Como construir seu primeiro agente de IA com Python: guia prático do zero

Construir um agente de IA do zero é uma das formas mais eficazes de entender profundamente como eles funcionam — e de ter algo funcional mais rápido do que você imagina. Um agente básico que pode pesquisar na web, executar código Python e consultar um banco de dados pode ser construído em algumas horas com ferramentas disponíveis em 2026. Este guia mostra o caminho mais direto usando a API da Anthropic com tool use nativo — sem frameworks intermediários, para máximo controle e aprendizado.

Estrutura básica: o loop do agente

Todo agente tem o mesmo loop fundamental em código: você envia uma mensagem para o modelo junto com a definição das ferramentas disponíveis. Se o modelo decidir usar uma ferramenta, a API retorna um bloco tool_use com o nome da ferramenta e os parâmetros. Você executa a ferramenta localmente, obtém o resultado, e reenvia ao modelo com o resultado no campo tool_result. O modelo usa o resultado para continuar o raciocínio ou para formular a resposta final. Esse ciclo se repete até o modelo não precisar mais de ferramentas e retornar a resposta final.

Definindo ferramentas

Ferramentas para a API da Anthropic são definidas como objetos JSON com nome, descrição (que o modelo usa para decidir quando invocar), e o schema dos parâmetros de entrada no formato JSON Schema. Uma ferramenta de busca na web, uma calculadora, e um leitor de arquivos somam menos de 40 linhas de Python. A qualidade da descrição da ferramenta é crítica — o modelo decide quais ferramentas usar baseado nas descrições, então “busca informações na web usando o Google” é muito melhor que apenas “search”.

Adicionando memória

Um agente sem memória esquece tudo entre sessões — todas as conversas começam do zero. Para adicionar memória simples, armazene o histórico de mensagens em um arquivo JSON ou banco SQLite e carregue nas primeiras mensagens de cada sessão. Para memória mais sofisticada — selecionar quais memórias são relevantes para a conversa atual — combine um banco vetorial (Chroma localmente) para buscar memórias semanticamente similares ao contexto atual. Essa “memória episódica” é o que permite a um agente lembrar preferências do usuário, contexto de projetos, e histórico de interações relevantes.

Testando e avaliando seu agente

Agentes são notoriamente difíceis de testar automaticamente porque o output correto varia dependendo de como o raciocínio se desenvolveu. Estratégias práticas: crie um conjunto de “cenários dourados” — pares de input/output onde você sabe qual é o comportamento correto — e verifique automaticamente se o agente os passa. Use o LangSmith ou Weights & Biases para logar cada passo do loop do agente e inspecionar o raciocínio visual. Test unitário as ferramentas separadamente do modelo. E nunca teste apenas o happy path — casos de erro, ferramentas que falham, e inputs ambíguos revelam a fragilidade do seu agente antes que os usuários o façam em produção.