LTX-2 – KI-Tool Test & Bewertung
LTX-2 von Lightricks ist eines der wenigen Open-Source-Videomodelle, das Audio und Video gemeinsam generiert. Das 13B-Modell erstellt 4K-Clips mit synchron erzeugtem Sound direkt auf der eigenen Hardware, ohne Cloud-Abhängigkeit. Die aktuelle Version 0.9.8 enthält ein destilliertes Modell für schnellere Generierung auf Consumer-Hardware.
Zuletzt aktualisiert: 14. März 2026
Videogenerierung mit KI funktioniert meist so: Du bekommst einen stummen Clip, den du anschließend mit einer separaten Lösung vertonst. LTX-2 bricht dieses Muster. Das Modell von Lightricks erzeugt Bild und Ton in einem einzigen Durchgang, Dialog, Hintergrundgeräusche, Musik und Bewegung entstehen synchron. Und es läuft lokal auf deiner eigenen Hardware, ohne dass Daten in eine Cloud übertragen werden.
Wichtigste Funktionen
- Gemeinsame Audio und Video-Generierung: LTX-2 gilt als erstes DiT-basiertes Audio-Video-Basismodell. Bewegung, Dialog, Hintergrundgeräusche und Musik werden in einem einzigen Generierungsschritt erzeugt. Das Ergebnis ist zeitlich konsistent, weil Bild und Ton auf demselben Modell basieren.
- Mehrere Modellvarianten: Das 13B-Entwicklungsmodell liefert die höchste Qualität. Das 13B-Distillat balanciert Geschwindigkeit und Qualität für den täglichen Einsatz. Das 2B-Distillat ist auf Consumer-Hardware mit weniger VRAM ausführbar, mit erwartbaren Abstrichen bei der Detailschärfe.
- Text-to-Video und Image-to-Video: Du kannst aus einer Textbeschreibung starten oder ein Bild als Ausgangspunkt verwenden. Multi-Keyframe-Konditionierung erlaubt es, mehrere Bilder als Anfangs- und Endpunkte eines Clips vorzugeben.
- Bis zu 60 Sekunden und 4K-Auflösung: Die Standardkonfiguration generiert Clips bei 1216x704 Pixeln mit 30 FPS. Mit dem 13B-Distillat sind in erweiterten Workflows bis zu 60 Sekunden Länge bei nativer 4K-Auflösung (50 FPS) möglich.
- LTX Desktop Beta: Es gibt eine kostenlose Desktop-App, die den Einstieg ohne Kommandozeile ermöglicht. Für Nutzer ohne Python-Erfahrung ist das der einfachste Weg, das Modell auszuprobieren.
- LoRA Fine-Tuning: Ein eingebautes Fine-Tuning-Framework erlaubt die Anpassung an eigene Stile, Figuren oder Marken-Vorgaben, ohne das Basismodell komplett neu trainieren zu müssen.
Preise und Tarife
LTX-2 ist vollständig kostenlos und steht unter der Apache-2.0-Lizenz, also auch für kommerzielle Projekte frei nutzbar. Die einzigen Kosten entstehen durch die Hardware: Das 13B-Modell benötigt eine leistungsstarke GPU mit ausreichend VRAM. Das 2B-Distillat läuft auch auf Consumer-GPUs mit 8 bis 12 GB VRAM, allerdings mit reduzierter Ausgabequalität.
Für wen ist LTX-2 geeignet?
- Teams mit Datenschutzanforderungen: Wer Video-Content mit KI erstellen will, ohne Material in eine Cloud zu übertragen, findet in LTX-2 eine der wenigen praxistauglichen lokalen Alternativen. Für Branchen mit sensiblen Inhalten, etwa Gesundheitswesen oder Rechtswesen, ist das ein wichtiges Argument.
- Content-Ersteller mit technischem Hintergrund: Wer eine GPU-Workstation hat und bereit ist, das Setup über Python und CUDA einzurichten, bekommt ein mächtiges Werkzeug für eigenständige Video-Produktion. Die LoRA-Funktion erlaubt außerdem Stil-Konsistenz über mehrere Clips hinweg.
- Entwickler und KI-Forscher: Das Apache-Lizenz-Modell und der öffentliche Code machen LTX-2 interessant für eigene Experimente, Integrationen in größere Pipelines oder als Ausgangspunkt für eigene Anpassungen.
DSGVO und Datenschutz
LTX-2 läuft vollständig lokal. Es gibt keinen Cloud-Dienst, keine API und keine Datenübertragung. Eingaben, Zwischenergebnisse und generierte Videos bleiben auf deiner Hardware. Das macht das Modell aus Datenschutzsicht unkompliziert: Es gibt keine externen Verarbeitungsstellen und keinen Auftragsverarbeiter. Die Apache-2.0-Lizenz erlaubt auch kommerzielle Nutzung ohne Einschränkungen. Einzige Voraussetzung: ausreichend GPU-Kapazität vor Ort.
Alternativen zu LTX-2
- Kling 3 – Cloud-basierter Dienst mit höherer Ausgabequalität und einfacherer Bedienung. Besser geeignet, wenn Qualität Vorrang hat und Datenschutz keine Rolle spielt.
- Seedance 2 – Weiterer Cloud-Dienst für hochwertige KI-Video-Generierung. Vergleichbar mit Kling, ebenfalls ohne Self-Hosting-Option.
- ComfyUI – Knotenbasierte Open-Source-Pipeline für Bild- und Video-Generierung, in die sich LTX-2 ebenfalls einbinden lässt. Flexibler, aber noch aufwändiger einzurichten.
Vorteile
- Audio und Video werden gemeinsam generiert, kein separater Schritt
- Open Source unter Apache-2.0, vollständig lokal ausführbar
- Bis zu 4K-Auflösung und 60 Sekunden Länge mit dem 13B-Modell
- Mehrere Modellgrößen, auch für Consumer-Hardware mit dem 2B-Distillat
Nachteile
- Leistungsstarke GPU mit ausreichend VRAM erforderlich
- Einrichtung erfordert Python-Kenntnisse und CUDA-Setup
- Qualität bei komplexen Szenen noch hinter kommerziellen Cloud-Diensten
Anwendungsgebiete
Du nutzt LTX-2?
Teile deine Erfahrung mit uns – wir nehmen dein Feedback in unsere Bewertung auf.