Análise detalhada do projeto AIOS (AI Operating System), um sistema…

INEMA

Pelo repositório, os dois diagramas fazem parte do mesmo projeto AIOS, mas representam níveis diferentes da arquitetura.

O primeiro diagrama é a arquitetura principal do AIOS. Ele mostra a estrutura geral do sistema: AIOS SDK / Cerebrum, aplicações de agentes, chamadas de sistema, kernel, agendador, filas, gerenciadores de LLM, memória, ferramentas e armazenamento. No README, o projeto explica que o AIOS é composto por dois componentes principais: AIOS Kernel e AIOS SDK, sendo o kernel a camada que gerencia recursos como LLM, memória, armazenamento e ferramentas, enquanto o SDK permite que usuários e desenvolvedores criem e executem aplicações de agentes.

O segundo diagrama, aquele do Computer-use Agent, é uma arquitetura especializada dentro do mesmo projeto. Ele não substitui o primeiro; ele detalha uma variação focada em agentes que usam computador. O README confirma isso quando diz que, para agentes de uso de computador, a arquitetura estende o AIOS Kernel com melhorias voltadas à contextualização computacional, mantendo componentes essenciais como LLM Core(s), Context Manager e Memory Manager, mas redesenhando o Tool Manager para incorporar VM Controller e MCP Server.

Então a hierarquia correta seria:

1. Arquitetura principal do AIOS É o primeiro diagrama. Mostra o sistema base: SDK, agentes, kernel, chamadas de sistema, filas e gerenciadores.

2. Arquitetura especializada para Computer-use Agent É o segundo diagrama. Mostra uma extensão da arquitetura principal para agentes capazes de operar terminal, navegador, código e documentos dentro de uma máquina virtual controlada.

Em termos de apresentação, eu organizaria assim:

Slide 1 — AIOS: visão geral do sistema Usar o primeiro diagrama como arquitetura-mãe.

Slide 2 — AIOS Kernel + SDK: como agentes fazem chamadas ao sistema Explicar Cerebrum, queries, syscalls, scheduler e managers.

Slide 3 — Extensão Computer-use Agent Usar o segundo diagrama como caso especializado: VM, MCP, automação de GUI, navegador, terminal e documentos.

Slide 4 — Por que isso importa Mostrar que o AIOS não é só um framework de agentes, mas uma proposta de “sistema operacional” para agentes, com camadas, chamadas, controle de recursos e execução segura.

A frase mais correta para amarrar os dois seria:

“O primeiro diagrama apresenta a arquitetura central do AIOS; o segundo mostra uma extensão especializada dessa arquitetura para agentes que usam computador, adicionando VM, MCP Server, VM Controller e automação de interface gráfica.”

cuta a ação e retorna o resultado.

Esse bloco existe para que agentes possam agir no mundo externo sem implementar cada integração manualmente.

13. Gerenciador de Memória⌗

O Gerenciador de Memória cuida das informações que o agente precisa lembrar.

Pode incluir:

memória de curto prazo, memória de longo prazo, preferências do usuário, histórico de tarefas, conhecimento aprendido, estado de execução.

Ele permite que um agente não seja apenas reativo, mas mantenha continuidade ao longo do tempo.

14. Gerenciador de Armazenamento⌗

O Gerenciador de Armazenamento cuida de dados persistentes.

Ele é diferente da memória. A memória está mais ligada a contexto e lembranças úteis para raciocínio. O armazenamento está mais ligado a arquivos, registros, documentos, bancos de dados e objetos salvos.

Exemplos:

salvar relatórios, ler arquivos, guardar logs, acessar documentos, persistir resultados de tarefas.

Ele existe para separar o que é “memória cognitiva do agente” do que é “armazenamento estrutural do sistema”.

15. AIOS Kernel⌗

O AIOS Kernel é a camada central que coordena tudo.

Ele recebe pedidos do SDK, transforma em chamadas de sistema, agenda a execução, envia para os gerenciadores corretos e devolve os resultados.

É parecido com um sistema operacional tradicional, mas em vez de gerenciar apenas CPU, disco e processos, ele gerencia recursos próprios de agentes de IA:

LLMs, memória, ferramentas, armazenamento, contexto, execução concorrente, filas, chamadas de sistema.

O motivo de existir um kernel é evitar que cada agente tenha que resolver tudo sozinho. Com o kernel, vários agentes compartilham uma infraestrutura comum, mais organizada e escalável.

Resumo visual da lógica⌗

O agente quer realizar uma tarefa.

O SDK transforma essa tarefa em queries.

As portas expostas recebem as queries.

O kernel converte isso em syscalls.

O agendador coloca cada syscall na fila correta.

Os gerenciadores executam a parte especializada.

O resultado volta pelo kernel, passa pelo SDK e retorna ao agente.

Em uma frase: o AIOS organiza agentes como se fossem aplicações rodando sobre um sistema operacional próprio para IA.

ele só precisa chamar a porta correta.

O motivo dessas portas existirem é criar uma fronteira clara entre camada de aplicação e camada de sistema.

6. Chamadas de Sistema AIOS⌗

Esse bloco é um dos mais importantes.

Ele representa as chamadas internas que o kernel entende. São equivalentes a “system calls” de um sistema operacional tradicional, mas adaptadas para agentes de IA.

No rodapé aparecem quatro tipos:

LSC — Syscall de LLM Chamada para operações de modelo de linguagem.

MSC — Syscall de Memória Chamada para operações de memória.

TSC — Syscall de Ferramentas Chamada para ferramentas externas ou internas.

SSC — Syscall de Armazenamento Chamada para arquivos, banco de dados ou armazenamento persistente.

Por exemplo, um agente pode fazer uma tarefa que gera uma sequência como:

Primeiro uma chamada de LLM para interpretar a tarefa. Depois uma chamada de memória para buscar contexto. Depois uma chamada de ferramenta para executar uma ação. Depois uma chamada de armazenamento para salvar o resultado.

Esse bloco existe porque agentes raramente fazem apenas uma operação. Eles executam cadeias de chamadas, e o AIOS precisa organizar isso.

7. Syscall em processamento⌗

A legenda “Syscall em processamento” indica chamadas que estão ativas naquele momento.

Isso mostra que o kernel consegue controlar o estado das operações: quais já chegaram, quais estão esperando, quais estão sendo executadas e quais foram concluídas.

Isso é importante porque vários agentes podem estar rodando ao mesmo tempo.

8. Vinculação de Threads⌗

A Vinculação de Threads conecta as chamadas de sistema ao mecanismo de execução.

Em termos simples: quando uma syscall chega, o kernel precisa decidir em qual fluxo de execução ela será processada.

Isso permite concorrência. Ou seja, múltiplos agentes podem fazer chamadas diferentes sem travar todo o sistema.

O motivo desse bloco existir é mostrar que o AIOS não apenas recebe pedidos; ele também controla a execução em nível de sistema.

9. Agendador⌗

O Agendador é o coração operacional do kernel.

Ele decide a ordem e a prioridade das chamadas.

Dentro dele há quatro filas:

Fila de LLM Guarda chamadas que precisam de modelos de linguagem.

Fila de Memória Guarda chamadas que precisam acessar ou atualizar memória.

Fila de Ferramentas Guarda chamadas que precisam executar ferramentas.

Fila de Armazenamento Guarda chamadas que precisam acessar arquivos ou dados persistentes.

Por que isso é necessário?

Porque diferentes recursos têm custos, limites e tempos diferentes. Uma chamada de LLM pode ser lenta e cara. Uma chamada de memória pode ser rápida. Uma ferramenta externa pode depender de internet. O agendador organiza tudo para evitar conflito, gargalo e uso descontrolado.

10. Gerenciador de Contexto⌗

O Gerenciador de Contexto controla o estado da conversa ou da tarefa.

Ele decide quais informações são relevantes para uma chamada de LLM ou para um agente em determinado momento.

Exemplo: se um agente está planejando uma viagem, o contexto pode incluir destino, datas, orçamento e preferências. O gerenciador evita mandar informações desnecessárias e mantém o agente coerente.

Ele existe porque LLMs têm limite de contexto e agentes precisam manter continuidade.

11. Núcleo(s) de LLM⌗

O bloco Núcleo(s) de LLM representa os modelos de linguagem disponíveis.

Pode ser um modelo local, um modelo em nuvem ou múltiplos modelos.

A função dele é executar operações como:

geração de texto, raciocínio, classificação, resumo, extração de informação, planejamento.

O plural indica que o AIOS pode trabalhar com mais de um LLM, escolhendo o modelo adequado para cada tarefa.

12. Gerenciador de Ferramentas⌗

O Gerenciador de Ferramentas administra ferramentas disponíveis para os agentes.

Essas ferramentas podem ser APIs, buscadores, calculadoras, bancos de dados, interpretadores de código, navegadores, sistemas externos ou plugins.

Ele decide como chamar uma ferramenta, valida parâmetros, exe

Esse diagrama mostra o AIOS como uma arquitetura em camadas, onde os agentes de IA não acessam diretamente LLMs, memória, ferramentas ou armazenamento. Eles passam por um SDK, que transforma as solicitações em chamadas organizadas para o Kernel AIOS, que agenda, distribui e executa cada recurso.

A lógica geral é:

Agente → SDK Cerebrum → Portas expostas → Chamadas de sistema → Agendador → Gerenciadores internos → Resultado de volta ao agente

1. Aplicações de Agentes⌗

Este bloco representa os agentes finais, como Agente A, B, C, D, E e F.

Cada agente pode ter quatro capacidades principais:

Planejamento Define o que precisa ser feito, divide uma tarefa em etapas e decide a sequência de ações.

Ação Executa comandos, chama ferramentas, interage com APIs ou dispara operações externas.

Memória Guarda e recupera informações importantes para manter contexto ao longo do tempo.

Armazenamento Lida com arquivos, documentos, dados persistentes ou registros estruturados.

O motivo de existir esse bloco é mostrar que o AIOS pode rodar vários agentes ao mesmo tempo, todos usando os mesmos serviços centrais do sistema operacional de agentes.

2. AIOS SDK — Cerebrum⌗

O AIOS SDK, chamado Cerebrum, é a camada usada por desenvolvedores para criar agentes sem precisar conversar diretamente com o kernel.

Ele funciona como uma biblioteca de desenvolvimento. Em vez de o desenvolvedor implementar manualmente acesso a LLM, memória, ferramentas e armazenamento, ele usa os módulos do SDK.

Elementos internos do SDK⌗

Módulo de Planejamento Prepara pedidos relacionados a raciocínio, decomposição de tarefas e organização de passos.

Módulo de Ação Prepara comandos de execução, como chamar ferramentas, APIs, funções ou ambientes externos.

Módulo de Memória Prepara consultas para salvar, buscar ou atualizar informações do agente.

Módulo de Armazenamento Prepara operações com arquivos, bases de dados ou objetos persistentes.

Dentro de cada módulo aparecem etapas como:

setup() Inicializa o módulo.

pré-processamento Organiza o pedido antes de enviá-lo ao kernel.

enviar_requisição() Manda a solicitação para o AIOS.

pós-processamento Trata a resposta recebida.

retornar_resultados Entrega o resultado final para o agente.

O motivo dessa camada existir é separar o desenvolvimento do agente da complexidade do sistema operacional. O agente pede algo de forma simples; o SDK transforma esse pedido em uma requisição estruturada.

3. Tipos de Query⌗

Na parte inferior dos módulos aparecem:

LLMQuery Pedido relacionado ao modelo de linguagem. Exemplo: gerar resposta, raciocinar, resumir, classificar.

ToolQuery Pedido para usar uma ferramenta. Exemplo: buscar na web, chamar uma API, executar código, usar uma calculadora.

MemoryQuery Pedido para acessar memória. Exemplo: lembrar preferências, recuperar histórico, salvar conhecimento.

StorageQuery Pedido para acessar armazenamento. Exemplo: ler arquivo, salvar documento, buscar dados persistentes.

Essas queries existem porque cada tipo de recurso precisa ser tratado de forma diferente pelo kernel.

4. enviar_requisição(Query)⌗

Esse é o ponto central do SDK.

Ele recebe uma query de qualquer módulo e envia para o kernel AIOS.

A função dele é padronizar a comunicação. Em vez de cada módulo se comunicar de um jeito diferente, todos passam por um único canal organizado.

Isso facilita controle, segurança, rastreabilidade e compatibilidade entre diferentes agentes.

5. Portas Expostas⌗

As Portas Expostas são os pontos de entrada do kernel.

No diagrama aparecem exemplos como:

/core/llm/setup Entrada para configurar ou acessar recursos de LLM.

/core/memory/setup Entrada para configurar ou acessar memória.

/core/storage/setup Entrada para configurar ou acessar armazenamento.

/core/tool/setup Entrada para configurar ou acessar ferramentas.

Essas portas funcionam como APIs internas. O SDK não precisa saber como o kernel executa tudo por dentro;

diferenciais são:

1. Virtual Machine⌗

Agora existe um ambiente explícito de execução isolado.

2. VM Controller⌗

O AIOS passa a controlar o ambiente computacional onde o agente atua.

3. MCP Client / MCP Server⌗

A comunicação com ferramentas e capacidades operacionais fica mais estruturada.

4. GUI Automation Library⌗

O agente consegue operar interfaces gráficas, não apenas APIs ou texto.

5. Access Manager⌗

Há maior preocupação com controle e segurança.

Resumo de cada bloco em uma frase⌗

Agent Application⌗

Camada onde vive o agente que usa computador.

Computer-use Agent⌗

Orquestra ações em terminal, código, navegador e documentos.

Terminal / Code / Browser / Document⌗

Interfaces operacionais que o agente usa para executar tarefas reais.

AIOS SDK⌗

Transforma intenções do agente em requisições técnicas.

Tool / LLM / Memory / Storage Query⌗

Tipos de pedidos que o agente faz ao sistema.

MCP Client / HTTP Client⌗

Canais de comunicação entre o SDK e o kernel/serviços.

AIOS Kernel⌗

Núcleo que organiza, executa e controla os recursos do agente.

LLM Core(s)⌗

Executa raciocínio e geração.

Context Manager⌗

Controla o contexto relevante.

Agent Scheduler⌗

Define ordem e prioridade das execuções.

Memory Manager⌗

Gerencia lembranças e estado cognitivo.

Storage Manager⌗

Gerencia persistência e arquivos.

Access Manager⌗

Controla permissões e segurança.

AIOS System Call⌗

Camada padronizada de chamadas internas do AIOS.

Tool Manager⌗

Gerencia ações operacionais e ferramentas.

VM Controller⌗

Controla a máquina virtual onde o agente atua.

MCP Server⌗

Expõe e media capacidades operacionais e ferramentas.

OS Kernel⌗

Base do sistema operacional real.

OS System Call⌗

Ponto de acesso aos recursos do SO real.

GUI Automation Library⌗

Permite controlar interface gráfica.

Virtual Machine⌗

Ambiente isolado e seguro onde o agente usa o computador.

Conclusão⌗

Esse diagrama mostra que o AIOS, nessa versão, não é só um sistema para orquestrar agentes “inteligentes”, mas um sistema para orquestrar agentes que agem em um computador real de forma controlada.

A ideia central é:

dar autonomia operacional ao agente,
manter segurança e isolamento,
permitir uso de terminal, navegador, documentos e código,
e fazer isso com uma arquitetura organizada, modular e escalável.

r no mundo computacional.

Exemplos:

automação de interface,
browser tools,
terminal tools,
integrações externas,
ações no sistema.

Por que existe⌗

Porque usar ferramentas é diferente de apenas gerar texto. É preciso ter controle, validação e execução organizada.

3.9 VM Controller⌗

Esse é um dos blocos-chave dessa arquitetura.

O que é⌗

O VM Controller é o controlador da máquina virtual.

Função⌗

Ele gerencia a interação do AIOS com a Virtual Machine.

Pode incluir:

iniciar/parar a VM,
monitorar estado,
enviar ações,
coordenar sessões,
garantir isolamento.

Por que existe⌗

Porque o agente precisa operar em um ambiente seguro e controlado, em vez de agir diretamente na máquina host.

Isso reduz risco e melhora reprodutibilidade.

3.10 MCP Server⌗

É a contraparte do MCP Client.

O que faz⌗

Recebe requisições do cliente MCP e conecta essas requisições ao ambiente operacional controlado pelo AIOS.

Função⌗

Servir como camada de mediação entre:

o agente,
as ferramentas,
a VM,
os recursos computacionais.

Por que existe⌗

Porque facilita uma comunicação padronizada e modular com as ferramentas e o ambiente.

4. OS Kernel⌗

Esse bloco mostra a camada do sistema operacional subjacente.

Ou seja, abaixo do AIOS existe o kernel real do sistema.

4.1 OS System Call⌗

Representa as chamadas de sistema do sistema operacional real.

Função⌗

Quando o AIOS precisa que algo aconteça no nível do SO, isso eventualmente vira uma chamada ao kernel do sistema.

Exemplos:

abrir processo,
manipular janela,
acessar arquivos,
executar ação do sistema.

Por que existe⌗

Porque o AIOS não substitui o sistema operacional tradicional; ele opera sobre ele.

4.2 GUI Automation Library⌗

Esse bloco representa uma biblioteca de automação de interface gráfica.

Função⌗

Permitir ações como:

clicar,
digitar,
mover mouse,
interagir com janelas,
capturar estado visual.

Por que existe⌗

Porque um computer-use agent precisa manipular interfaces gráficas, não só texto ou APIs.

Esse bloco é a ponte entre a intenção do agente e a interface visual do ambiente computacional.

5. Virtual Machine⌗

A Virtual Machine é o ambiente onde o agente efetivamente opera.

O que representa⌗

É a máquina virtual sandboxada onde ficam:

sistema operacional controlado,
navegador,
terminal,
documentos,
ambiente de testes,
possíveis aplicações.

Como funciona⌗

O AIOS se comunica com ela principalmente via:

VM Controller
Tool Manager
bibliotecas de automação
mecanismos de acesso controlado

Por que existe⌗

Esse é um dos pontos mais importantes da arquitetura.

A VM existe para:

isolar o agente do host real,
aumentar segurança,
permitir experimentação,
criar ambiente reprodutível,
controlar melhor o contexto computacional.

Em outras palavras: o agente usa o computador, mas usa um computador controlado.

Como o fluxo funciona ponta a ponta⌗

Exemplo prático⌗

Imagine que o agente recebe a tarefa:

“Abra o navegador, pesquise um artigo, resuma o conteúdo e salve em um documento.”

O fluxo seria algo como:

O Computer-use Agent interpreta a tarefa.
Ele gera uma LLM Query para entender os passos.
Usa Tool Query para abrir navegador.
O SDK envia isso via MCP Client ou HTTP Client.
O AIOS Kernel recebe a solicitação via AIOS System Call.
O Agent Scheduler organiza a ordem das ações.
O Tool Manager aciona os recursos necessários.
O VM Controller coordena a execução dentro da Virtual Machine.
A GUI Automation Library pode realizar cliques, digitação e navegação.
O agente consulta o conteúdo e faz nova LLM Query para resumir.
O Storage Manager salva o resultado em documento.
O resultado volta ao agente.

O que muda em relação ao diagrama anterior⌗

Comparando com a arquitetura anterior, esse diagrama adiciona um foco mais forte em computer-use.

Os principais

umentos, * acessar artefatos, * persistir resultados.

Por que existe⌗

Porque em uso de computador há arquivos reais, diretórios, outputs e registros que precisam ser manipulados.

2.5 MCP Client⌗

Esse é um dos blocos mais importantes nessa arquitetura.

O que é⌗

O MCP Client é o cliente que conversa com o MCP Server.

MCP aqui funciona como uma ponte padronizada para ferramentas e recursos operacionais do ambiente.

Como funciona⌗

Quando o agente precisa usar uma ferramenta controlada via MCP, o SDK envia o pedido pelo MCP Client.

Por que existe⌗

Porque ele desacopla o agente da implementação da ferramenta. O agente não precisa saber como a ferramenta funciona por dentro — ele só envia a intenção.

2.6 HTTP Client⌗

É o cliente usado para comunicação via HTTP com os serviços do kernel.

Como funciona⌗

Ele envia queries de:

LLM,
memória,
armazenamento,

e possivelmente outros serviços remotos.

Por que existe⌗

Porque parte da arquitetura pode funcionar como serviços expostos via rede/API, e o HTTP Client padroniza esse acesso.

3. AIOS Kernel⌗

Esse é o coração da arquitetura.

Ele é a camada que recebe as requisições do SDK e coordena tudo o que acontece internamente.

3.1 LLM Core(s)⌗

São os núcleos de modelos de linguagem.

Função⌗

Executar:

geração de texto,
interpretação,
raciocínio,
decisão,
planejamento.

Por que está no kernel⌗

Porque o uso de LLM precisa ser centralizado e gerenciado como recurso do sistema.

O plural “Core(s)”⌗

Indica que o AIOS pode trabalhar com:

um único modelo,
vários modelos,
modelos locais ou remotos.

3.2 Context Manager⌗

Gerencia o contexto ativo da tarefa.

Função⌗

Decidir quais informações devem ser usadas em cada etapa.

Exemplo:

o objetivo atual,
o estado do navegador,
o histórico recente,
memória relevante,
instruções do usuário.

Por que existe⌗

Porque agentes de uso de computador precisam manter coerência entre várias etapas, às vezes longas e multissistêmicas.

3.3 Agent Scheduler⌗

É o escalonador do sistema.

Função⌗

Organizar:

ordem de execução,
concorrência,
prioridade,
distribuição das chamadas.

Por que existe⌗

Porque um agente pode disparar múltiplas ações ao mesmo tempo ou em sequência, e o sistema precisa controlar isso.

Em um ambiente com vários agentes, isso é ainda mais importante.

3.4 Memory Manager⌗

Gerencia a memória do agente.

Função⌗

Controlar:

recuperação de memória,
atualização de contexto,
lembranças de curto e longo prazo,
estado intermediário da tarefa.

Por que existe⌗

Porque o agente precisa lembrar o que já viu, fez e decidiu.

3.5 Storage Manager⌗

Gerencia o armazenamento persistente.

Função⌗

Controlar:

arquivos,
documentos,
saídas geradas,
registros salvos,
conteúdos persistentes.

Por que existe⌗

Porque tarefas em computador produzem e consomem artefatos reais.

3.6 Access Manager⌗

Esse bloco é especialmente importante em arquitetura de computer-use.

Função⌗

Controlar acesso a recursos.

Pode envolver:

permissões,
isolamento,
autorização,
escopo do que o agente pode usar.

Por que existe⌗

Porque um agente que usa computador pode ser poderoso demais se não houver controle. O Access Manager ajuda a manter segurança e governança.

3.7 AIOS System Call⌗

Essa faixa horizontal representa as chamadas de sistema do AIOS.

O que é⌗

É o barramento interno que conecta as requisições do SDK aos módulos especializados do kernel.

Como funciona⌗

Tudo que o agente pede passa por essa camada:

chamadas para LLM,
memória,
armazenamento,
ferramentas,
controle da VM,
acesso.

Por que existe⌗

Porque o AIOS quer funcionar como um verdadeiro sistema operacional para agentes. Assim, ele padroniza o acesso aos recursos internos através de “system calls” próprias.

3.8 Tool Manager⌗

Esse bloco gerencia o uso de ferramentas.

Função⌗

Coordenar recursos operacionais que o agente usa para agi

docum

Esse diagrama mostra uma versão especializada do AIOS para agentes que usam computador, ou seja, agentes que não apenas “pensam”, mas também interagem com terminal, código, navegador e documentos.

A lógica geral aqui é:

Agente de uso de computador → SDK → Kernel AIOS → ferramentas / VM / MCP → sistema operacional e interface gráfica

Ou seja, o agente não mexe diretamente no computador host. Ele passa por uma arquitetura controlada, segura e organizada.

Visão geral do diagrama⌗

Esse modelo está dividido em 5 grandes áreas:

Agent Application
AIOS SDK
AIOS Kernel
OS Kernel
Virtual Machine

A diferença mais importante dessa arquitetura é que aqui o AIOS foi adaptado para computer-use agents, com foco em:

executar ações em ambiente computacional real,
operar navegador, terminal, arquivos e interfaces,
usar uma máquina virtual sandbox,
integrar isso com um MCP Server e um VM Controller.

1. Agent Application⌗

Esse bloco representa a camada onde está o agente de aplicação.

Elementos⌗

Computer-use Agent⌗

É o agente principal. Ele é um agente de IA que consegue usar o computador como ferramenta de trabalho.

Em vez de só responder texto, ele consegue:

abrir terminal,
escrever ou executar código,
navegar na web,
ler ou manipular documentos.

Terminal⌗

Representa a capacidade de interagir com linha de comando.

Exemplos:

executar scripts,
instalar dependências,
rodar comandos do sistema,
inspecionar diretórios,
compilar ou iniciar aplicações.

Code⌗

Representa a habilidade de lidar com código.

Exemplos:

criar arquivos,
editar scripts,
interpretar trechos de código,
rodar testes,
automatizar tarefas de desenvolvimento.

Browser⌗

Representa a interação com navegador.

Exemplos:

abrir páginas,
clicar em botões,
preencher formulários,
pesquisar,
coletar dados.

Document⌗

Representa manipulação de conteúdo documental.

Exemplos:

ler PDF,
gerar relatórios,
extrair informação,
revisar documentos,
salvar resultados.

Como funciona⌗

O Computer-use Agent é o orquestrador. Ele escolhe quando usar terminal, código, navegador ou documento conforme a tarefa.

Por exemplo:

se a tarefa é pesquisar algo → usa Browser;
se a tarefa é automatizar algo localmente → usa Terminal;
se precisa corrigir um script → usa Code;
se precisa resumir um relatório → usa Document.

Por que esse bloco existe⌗

Porque ele mostra que o agente não é apenas conversacional. Ele é um agente operacional, capaz de atuar em um ambiente de computação real.

2. AIOS SDK⌗

O AIOS SDK é a camada intermediária entre o agente e o kernel.

Ele transforma as intenções do agente em requisições técnicas compreensíveis pelo sistema.

2.1 Tool Query⌗

É a requisição ligada a uso de ferramentas.

O que representa⌗

Quando o agente quer agir no ambiente — como abrir terminal, navegar, clicar, executar código — ele gera uma Tool Query.

Por que existe⌗

Porque ações operacionais precisam ser tratadas como chamadas específicas de ferramenta, e não como simples geração de texto.

2.2 LLM Query⌗

É a requisição ligada ao modelo de linguagem.

O que representa⌗

Sempre que o agente precisa:

raciocinar,
planejar,
interpretar contexto,
decidir o próximo passo,
resumir conteúdo,

ele dispara uma LLM Query.

Por que existe⌗

Porque o agente precisa de uma camada formal para usar inteligência linguística e raciocínio.

2.3 Memory Query⌗

É a requisição ligada à memória.

O que representa⌗

Serve para:

recuperar contexto anterior,
lembrar estado da tarefa,
armazenar conhecimento temporário,
consultar histórico.

Por que existe⌗

Porque tarefas longas exigem continuidade. Sem isso, o agente perderia o encadeamento do trabalho.

2.4 Storage Query⌗

É a requisição ligada ao armazenamento persistente.

O que representa⌗

Serve para:

salvar arquivos,
recuperar

O AIOS é um “sistema operacional para agentes de IA”. A ideia central é colocar modelos de linguagem grandes, LLMs, como uma camada de sistema operacional para facilitar o desenvolvimento, execução e implantação de agentes baseados em LLM. O projeto tenta resolver problemas típicos de agentes, como agendamento, troca de contexto, gerenciamento de memória, armazenamento, ferramentas e SDKs de agentes.

Em termos práticos, ele se divide em dois blocos:

AIOS Kernel, que é este repositório, funciona como uma camada de abstração sobre o sistema operacional e gerencia recursos usados por agentes, como LLM, memória, armazenamento e ferramentas.

AIOS SDK, chamado Cerebrum, é voltado para usuários e desenvolvedores criarem e executarem aplicações de agentes interagindo com o kernel.

Principais recursos⌗

O projeto oferece suporte a Web UI e Terminal UI, permitindo interação tanto por interface web quanto por terminal.

Ele estrutura agentes como aplicações que fazem chamadas ao kernel, que agenda e despacha “syscalls” para módulos como LLM, memória, contexto, armazenamento e ferramentas.

Há uma arquitetura especializada para computer-use agents, com integração de VM Controller e MCP Server para permitir que agentes interajam com computadores de forma mais segura e contextualizada, em ambiente sandbox.

O AIOS também suporta diferentes modos de implantação: modo local, modo com kernel remoto, desenvolvimento remoto, e modos futuros com kernel pessoal remoto e virtualização de múltiplos kernels pessoais. Atualmente, o README informa que os modos 1 e 2 já são suportados, enquanto os demais ainda estão em desenvolvimento.

Para que serve⌗

O AIOS serve para criar uma infraestrutura comum onde diferentes agentes de IA possam ser desenvolvidos, executados, distribuídos e gerenciados de forma mais padronizada. Ele é especialmente útil para pesquisadores e desenvolvedores que querem construir agentes com memória, ferramentas, múltiplos LLMs, execução local/remota e integração com interfaces de usuário.

Requisitos e uso inicial⌗

O projeto suporta Python 3.10 a 3.11 e pode ser instalado com dependências separadas para ambientes CPU ou GPU. Para usar o sistema completo, o README também orienta instalar o SDK Cerebrum.

Para configurar, o AIOS usa um arquivo aios/config/config.yaml, onde podem ser colocadas chaves de API de serviços como OpenAI, Anthropic, Groq e HuggingFace.

github.com/agiresearch/AIOS ↗

AIOS - Sistema Operacional de IA

chatgpt.com ↗