Back to blog

Como dar memória permanente ao seu agente de IA

Uma visão técnica de como o OpenClaw implementa memória persistente para agentes de IA pessoais: histórico de conversas, pesquisa semântica, armazenamento de preferências e dicas práticas para construir um agente que genuinamente o conhece.

K-Claw Team·20 de dezembro de 2025·4 min read

Por que a memória muda tudo

A diferença entre um assistente de IA útil e um excecional é a memória. Sem memória, cada conversa começa do zero — você reexplica o seu contexto, as suas preferências, os seus projetos. Com memória, o seu agente acumula compreensão ao longo de semanas e meses, tornando-se progressivamente mais útil sem qualquer esforço adicional da sua parte.

O ChatGPT oferece funcionalidades de memória limitadas geridas pela OpenAI. Com um agente OpenClaw auto-hospedado, você controla todo o sistema de memória: o que é armazenado, como é pesquisado, por quanto tempo é retido e quem pode aceder. A sua base de dados de memória fica no seu servidor.

As três camadas da memória do agente

O OpenClaw implementa a memória como três sistemas distintos, cada um servindo um propósito diferente:

1. Histórico de conversas (curto prazo + longo prazo)

Cada mensagem que troca com o seu agente é armazenada numa base de dados PostgreSQL no seu servidor. Quando inicia uma nova conversa, o agente recupera mensagens recentes da mesma sessão como contexto. Para intervalos mais longos (dias ou semanas), recupera um resumo de conversas anteriores relevantes.

É análogo a como poderia informar um assistente humano: "Da última vez que falámos sobre o projeto, decidimos X." O seu agente tem acesso ao registo real da conversa, não a um resumo inventado.

2. Memória semântica (pesquisa vetorial)

À medida que as conversas se acumulam, pesquisar em texto bruto torna-se impraticável. O OpenClaw usa opcionalmente embeddings vetoriais — representações matemáticas de significado — para permitir a pesquisa semântica em todo o seu histórico de conversas.

Isso significa que pode perguntar: "O que disse sobre a minha estratégia de preços?" e o agente encontra menções relevantes mesmo que nunca tenha usado essas palavras exatas. Os embeddings são gerados localmente (usando um pequeno modelo de embedding) e armazenados na sua base de dados — sem serviços externos necessários.

3. Armazenamento de memória explícita (preferências e factos)

A terceira camada é a mais acionável: factos explícitos que indica ao agente para memorizar. Quando diz "lembra: prefiro exemplos de código em TypeScript, não em JavaScript", o agente armazena isto como uma entrada de memória discreta que é prefixada a conversas futuras relevantes.

Pode consultar e gerir estes factos armazenados através do comando /memory, editá-los se mudarem e eliminar entradas desatualizadas. Esta é a camada de memória que gere ativamente — as outras acumulam-se passivamente.

Ensinar o seu agente o que deve memorizar

O armazenamento de memória explícita é mais poderoso quando investe alguns minutos no início do uso do seu agente para estabelecer contexto fundamental. Boas coisas a capturar:

  • Contexto profissional: o seu papel, setor, stack tecnológico, tamanho da equipa
  • Preferências de comunicação: comprimento de resposta, tom, preferências de formatação
  • Regras permanentes: "Sugere sempre alternativas quando discordas da minha abordagem"
  • Relações-chave: nomes e contexto de pessoas que mencionará com frequência
  • Projetos ativos: breves descrições do que está a trabalhar

À medida que a sua situação evolui, atualize a memória: "O projeto do cliente que mencionei está agora concluído. Remova-o da sua memória de projetos ativos."

Gestão da janela de contexto da conversa

Os grandes modelos de linguagem têm uma janela de contexto limitada — a quantidade de texto que podem "ver" de uma vez. Históricos de conversas longos podem exceder este limite. O OpenClaw trata isto através de resumização automática: quando uma conversa excede um limiar configurável, a parte mais antiga é comprimida num resumo que usa menos tokens enquanto preserva os factos-chave.

Este processo é transparente: não o nota, mas o seu agente continua a referenciar informações do início de conversas longas sem ficar sem espaço de contexto.

Backup e exportação da memória

Como a sua base de dados de memória é uma instância PostgreSQL padrão no seu VPS, fazer backup é simples:

pg_dump openclaw_db > openclaw-backup-$(date +%Y%m%d).sql

Adicione isto a um cron job diário e sincronize a saída para armazenamento na nuvem (rclone para S3, Backblaze B2, etc.) para backup externo. Se alguma vez migrar para um novo VPS, restaure com:

psql openclaw_db < openclaw-backup-20260101.sql

Todo o seu histórico de conversas e memória seguem o seu agente onde quer que corra.

Implicações de privacidade da memória do agente

A memória permanente é uma funcionalidade de dois gumes. O agente torna-se mais útil porque sabe mais sobre si — mas também significa que informações sensíveis persistem por mais tempo. Algumas diretrizes práticas:

  • Realize revisões regulares do seu armazenamento de memória explícita e remova tudo o que já não precisa de estar lá
  • Para conversas altamente sensíveis (médicas, legais, financeiras), considere iniciá-las com "Não armazenes esta conversa na memória de longo prazo" — o OpenClaw suporta indicadores de memória ao nível da conversa
  • Mantenha a firewall do seu VPS corretamente configurada — a base de dados nunca deve ser acessível pela internet, apenas a partir do localhost

Os cursos do k-claw incluem um módulo dedicado à gestão de memória, cobrindo tanto a configuração técnica como os hábitos práticos que tornam a memória de longo prazo do agente genuinamente útil em vez de um problema.

Ready to follow along? Install OpenClaw now.

k-claw's guided courses walk you through every step. The automated installer does the heavy lifting.

Get started