Standard-KI-Agenten haben einen fundamentalen Nachteil: Nach jedem Gespräch ist alles vergessen. Für Assistenten, die täglich mit denselben Nutzern arbeiten, ist das ein echtes Problem. Letta löst das mit einem strukturierten Gedächtnissystem, das Informationen klassifiziert, dauerhaft speichert und gezielt abruft, ähnlich wie ein Mensch zwischen Kurzzeit- und Langzeitgedächtnis unterscheidet. Das Projekt entstand ursprünglich als Forschungsarbeit unter dem Namen MemGPT und ist heute als Letta mit über 23.000 GitHub-Stars eines der meistgenutzten Agent-Frameworks. Für aktuelle Reasoning-Modelle wie GPT-5 oder Claude 4.5 empfiehlt Letta die neue V1-Architektur, die alte MemGPT-Architektur wird weiter unterstützt.

Wichtigste Funktionen

Core Memory: Ein kleiner, immer verfügbarer Gedächtnisblock für die wichtigsten Fakten über den Nutzer und die aktuelle Aufgabe. Der Agent kann diesen Block aktiv lesen und schreiben.
Archival Memory: Unbegrenzt großes Langzeitgedächtnis. Der Agent durchsucht es bei Bedarf per semantischer Suche und ruft nur das ab, was gerade relevant ist.
Recall Memory: Gesprächshistorie aus vergangenen Sessions, selektiv abrufbar. Ermöglicht es dem Agenten, auf frühere Interaktionen zurückzugreifen.
Tool Use und externe Integrationen: Agenten können externe APIs, Datenbanken und Dokumente einbinden und daraus lernen. Skills und Subagenten erweitern die Fähigkeiten modular.
REST-API mit Python- und TypeScript-SDK: Letta läuft als Server, eigene Anwendungen sprechen per API mit den Agenten. Das erleichtert die Integration in bestehende Systeme erheblich.
Letta Code: Eine eigene App samt CLI (April 2026) für personalisierte Agenten, die lokal arbeiten und über die Zeit dazulernen. Letta Code bündelt Skills und Subagenten und schneidet auf dem Coding-Benchmark Terminal-Bench unter den Open-Source-Agenten stark ab.

Preise und Tarife

Letta ist Open Source unter Apache-2.0-Lizenz und kann kostenlos selbst gehostet werden. Für den Eigenbetrieb fallen nur die Infrastrukturkosten und die API-Kosten des gewählten Sprachmodells an. Wer keinen eigenen Server betreiben möchte, kann Letta Cloud nutzen: Der Free-Plan erlaubt bis zu 3 Agenten und eigene API-Keys. Pro- und Max-Pläne schalten mehr Agenten, höhere Nutzungslimits und Frontier-Modelle auf der Letta-Infrastruktur frei. Für Unternehmen gibt es einen Enterprise-Plan mit SAML/OIDC-SSO, rollenbasierter Zugriffskontrolle und dediziertem Support. Genaue Preise für die Cloud-Pläne sind auf app.letta.com einsehbar.

Für wen ist Letta geeignet?

Entwickler, die personalisierte Assistenten bauen: Wenn Ihr Agent Vorlieben, Projekte und vergangene Entscheidungen eines Nutzers kennen soll, ist Letta der richtige Ausgangspunkt. Das persistente Gedächtnis ist direkt eingebaut und muss nicht selbst implementiert werden.
Unternehmen mit Kundenservice-Agenten: Wenn Agenten Gesprächshistorie, Kundendaten und frühere Tickets kennen sollen, ohne dass Nutzer jedes Mal von vorne erklären müssen, ist persistentes Gedächtnis entscheidend.
Forschung und Prototyping: Letta entstand in einem akademischen Kontext und wird aktiv weiterentwickelt. Wer neuartige Agenten-Architekturen ausprobieren möchte, findet hier ein gut dokumentiertes Framework mit aktiver Community.

DSGVO und Datenschutz

Beim Self-Hosting auf eigener Infrastruktur liegt die vollständige Datenkontrolle beim Betreiber. Welche Daten an externe KI-APIs übertragen werden, hängt vom gewählten Modell ab. Bei Nutzung von Letta Cloud gelten die Datenschutzbedingungen von Letta Inc. (USA). Für datenschutzsensible Deployments empfiehlt sich Self-Hosting in Kombination mit einem lokal betriebenen Modell über Ollama oder llama.cpp, dann verlassen keine Daten die eigene Infrastruktur.

Alternativen zu Letta

CrewAI: Für Multi-Agenten-Teams ohne Gedächtnis-Fokus. Stärker bei koordinierten Aufgaben, bei denen mehrere spezialisierte Agenten zusammenarbeiten.
AnythingLLM: Für dokumentenbasiertes RAG statt persönlichem Gedächtnis. Einfacher aufzusetzen, ohne Programmierkenntnisse nutzbar.
OpenHands: Für agierende Software-Entwicklungsagenten, die Code schreiben, testen und deployen. Anderer Fokus, keine Gedächtnisfunktion.

Vorteile

Persistentes Gedächtnis über alle Gespräche hinweg, kein Vergessen nach Session-Ende

Strukturierte Gedächtnisblöcke (Core Memory, Archival Memory, Recall Memory)

REST-API und Python/TypeScript-SDK für Integration in eigene Anwendungen

Funktioniert mit OpenAI, Anthropic und lokalen Modellen via Ollama

Vollständig selbst hostbar, Apache-2.0-Lizenz ohne kommerzielle Einschränkungen

Wir zeigen Ihnen, wo KI in Ihrem Unternehmen wirtschaftlich sinnvoll ist.

Workshops und Vorträge, die Teams KI im Alltag sicher machen.

KI-Lösungen nach Anwendungsdomäne, unabhängig von der Technologie.

Unsere KI-Plattform für Unternehmen. Modular, lokal, DSGVO-konform.

Letta: KI-Tool Test & Bewertung

Wichtigste Funktionen

Preise und Tarife

Für wen ist Letta geeignet?

DSGVO und Datenschutz

Alternativen zu Letta

Vorteile

Nachteile

Anwendungsgebiete

Ähnliche Tools

Dify

Hermes Agent

Sim Studio