Letta – KI-Tool Test & Bewertung
Letta, früher bekannt als MemGPT, löst eine grundlegende Schwäche von KI-Agenten: Nach jedem Gespräch ist alles vergessen. Letta gibt Agenten ein persistentes Gedächtnissystem mit strukturierten Speicherblöcken, die über Konversationen hinweg erhalten bleiben und bei Bedarf per semantischer Suche abgerufen werden. Das Framework ist Open Source (Apache 2.0) und lässt sich selbst hosten oder über Letta Cloud nutzen.
Zuletzt aktualisiert: 14. März 2026
Standard-KI-Agenten haben einen fundamentalen Nachteil: Nach jedem Gespräch ist alles vergessen. Für Assistenten, die täglich mit denselben Nutzern arbeiten, ist das ein echtes Problem. Letta löst das mit einem strukturierten Gedächtnissystem, das Informationen klassifiziert, dauerhaft speichert und gezielt abruft, ähnlich wie ein Mensch zwischen Kurzzeit- und Langzeitgedächtnis unterscheidet. Das Projekt entstand ursprünglich als Forschungsarbeit unter dem Namen MemGPT und ist heute als Letta mit aktuell über 21.000 GitHub-Stars eines der meistgenutzten Agent-Frameworks.
Wichtigste Funktionen
- Core Memory: Ein kleiner, immer verfügbarer Gedächtnisblock für die wichtigsten Fakten über den Nutzer und die aktuelle Aufgabe. Der Agent kann diesen Block aktiv lesen und schreiben.
- Archival Memory: Unbegrenzt großes Langzeitgedächtnis. Der Agent durchsucht es bei Bedarf per semantischer Suche und ruft nur das ab, was gerade relevant ist.
- Recall Memory: Gesprächshistorie aus vergangenen Sessions, selektiv abrufbar. Ermöglicht es dem Agenten, auf frühere Interaktionen zurückzugreifen.
- Tool Use und externe Integrationen: Agenten können externe APIs, Datenbanken und Dokumente einbinden und daraus lernen. Skills und Subagenten erweitern die Fähigkeiten modular.
- REST-API mit Python- und TypeScript-SDK: Letta läuft als Server, eigene Anwendungen sprechen per API mit den Agenten. Das erleichtert die Integration in bestehende Systeme erheblich.
- Letta Code CLI: Agenten lassen sich direkt im Terminal ausführen, was Entwicklern eine schnelle Iteration ohne grafische Oberfläche ermöglicht.
Preise und Tarife
Letta ist Open Source unter Apache-2.0-Lizenz und kann kostenlos selbst gehostet werden. Für den Eigenbetrieb fallen nur die Infrastrukturkosten und die API-Kosten des gewählten Sprachmodells an. Wer keinen eigenen Server betreiben möchte, kann Letta Cloud nutzen: Der Free-Plan erlaubt bis zu 3 Agenten und eigene API-Keys. Pro- und Max-Pläne schalten mehr Agenten, höhere Nutzungslimits und Frontier-Modelle auf der Letta-Infrastruktur frei. Für Unternehmen gibt es einen Enterprise-Plan mit SAML/OIDC-SSO, rollenbasierter Zugriffskontrolle und dediziertem Support. Genaue Preise für die Cloud-Pläne sind auf app.letta.com einsehbar.
Für wen ist Letta geeignet?
- Entwickler, die personalisierte Assistenten bauen: Wenn dein Agent Vorlieben, Projekte und vergangene Entscheidungen eines Nutzers kennen soll, ist Letta der richtige Ausgangspunkt. Das persistente Gedächtnis ist direkt eingebaut und muss nicht selbst implementiert werden.
- Unternehmen mit Kundenservice-Agenten: Wenn Agenten Gesprächshistorie, Kundendaten und frühere Tickets kennen sollen, ohne dass Nutzer jedes Mal von vorne erklären müssen, ist persistentes Gedächtnis entscheidend.
- Forschung und Prototyping: Letta entstand in einem akademischen Kontext und wird aktiv weiterentwickelt. Wer neuartige Agenten-Architekturen ausprobieren möchte, findet hier ein gut dokumentiertes Framework mit aktiver Community.
DSGVO und Datenschutz
Beim Self-Hosting auf eigener Infrastruktur liegt die vollständige Datenkontrolle beim Betreiber. Welche Daten an externe KI-APIs übertragen werden, hängt vom gewählten Modell ab. Bei Nutzung von Letta Cloud gelten die Datenschutzbedingungen von Letta Inc. (USA). Für datenschutzsensible Deployments empfiehlt sich Self-Hosting in Kombination mit einem lokal betriebenen Modell über Ollama oder llama.cpp, dann verlassen keine Daten die eigene Infrastruktur.
Alternativen zu Letta
- CrewAI: Für Multi-Agenten-Teams ohne Gedächtnis-Fokus. Stärker bei koordinierten Aufgaben, bei denen mehrere spezialisierte Agenten zusammenarbeiten.
- AnythingLLM: Für dokumentenbasiertes RAG statt persönlichem Gedächtnis. Einfacher aufzusetzen, ohne Programmierkenntnisse nutzbar.
- OpenHands: Für agierende Software-Entwicklungsagenten, die Code schreiben, testen und deployen. Anderer Fokus, keine Gedächtnisfunktion.
Vorteile
- Persistentes Gedächtnis über alle Gespräche hinweg, kein Vergessen nach Session-Ende
- Strukturierte Gedächtnisblöcke (Core Memory, Archival Memory, Recall Memory)
- REST-API und Python/TypeScript-SDK für Integration in eigene Anwendungen
- Funktioniert mit OpenAI, Anthropic und lokalen Modellen via Ollama
- Vollständig selbst hostbar, Apache-2.0-Lizenz ohne kommerzielle Einschränkungen
Nachteile
- Komplexer aufzusetzen als einfache Chat-Agenten
- Agenten-Qualität hängt stark vom gewählten Basismodell ab
- Kleinere Community als CrewAI oder LangChain
Anwendungsgebiete
Du nutzt Letta?
Teile deine Erfahrung mit uns – wir nehmen dein Feedback in unsere Bewertung auf.