Descript: KI-Tool Test & Bewertung
Descript verwandelt Video- und Podcast-Editing in eine Textverarbeitung: Sie bearbeiten das Transkript, und die Änderungen werden automatisch im Audio und Video übernommen. Wort löschen bedeutet Audio löschen. Dazu kommen automatische Untertitel, Füllwort-Entfernung, Studio-Sound-Verbesserung und Voice Cloning in über 25 Sprachen.
Zuletzt aktualisiert: 14. März 2026
Descript verfolgt einen ungewöhnlichen Ansatz: Statt Clips auf einer Timeline zu verschieben, bearbeiten Sie ein Transkript. Wenn Sie ein Wort aus dem Text löschen, verschwindet es auch aus dem Audio oder Video. Wer ein Textdokument bearbeiten kann, kann damit auch einen Podcast schneiden. Das macht den Einstieg für Menschen ohne Schnitterfahrung deutlich einfacher als jedes klassische Videobearbeitungsprogramm.
Wichtigste Funktionen
- Textbasiertes Editing: Das Herzstück von Descript. Sie sehen den gesprochenen Text als editierbares Dokument und schneiden durch Markieren und Löschen. Kein Timeline-Wissen nötig, keine Schnittsoftware-Einarbeitung.
- KI-Transkription: Automatische Transkription in über 25 Sprachen inklusive Deutsch, mit korrekter Erkennung von Umlauten und Eszett.
- Füllwort-Entfernung: “Ähm”, “also”, “sozusagen” erkennt und entfernt Descript automatisch. Bei Interview-Podcasts spart das leicht 30 Minuten Nachbearbeitungszeit pro Episode.
- Studio Sound: KI-gestützte Rauschunterdrückung und Audio-Verbesserung. Macht Aufnahmen aus dem Homeoffice oder unterwegs deutlich professioneller, ohne teures Mikrofon.
- Voice Cloning: Aus einer Sprachprobe erstellt Descript einen synthetischen Klon Ihrer Stimme. Damit korrigieren Sie Versprecher, ohne neu aufnehmen zu müssen.
- Dynamische Untertitel: Automatisch generierte Untertitel in über 22 Sprachen, direkt eingebrannt oder als separate Datei exportierbar. Für Social-Media-Clips, die oft ohne Ton angesehen werden, ein praktisches Feature.
- Rooms: Eingebaute Aufnahmefunktion für Remote-Interviews und Podcast-Gespräche. Jeder Teilnehmer wird lokal in hoher Qualität aufgenommen.
Preise und Tarife
Descript rechnet mit Media Minutes und KI-Credits ab. Media Minutes erfassen hochgeladene und aufgenommene Medien, KI-Credits decken Funktionen wie Studio Sound, Eye Contact und den Underlord-KI-Editor ab.
Der kostenlose Plan bietet 60 Media Minutes pro Monat sowie 100 einmalige KI-Credits, genug zum Ausprobieren. Der Hobbyist-Plan kostet $16/Monat (bei jährlicher Zahlung) und bietet 10 Media-Stunden sowie 400 KI-Credits pro Monat. Der Creator-Plan für $24/Monat (jährlich) erhöht auf 30 Stunden und 800 Credits und erlaubt bis zu drei Teammitglieder. Der Business-Plan für $50/Monat (jährlich) fügt 40 Stunden, 1.500 Credits, KI-Übersetzung und Dubbing in 30+ Sprachen sowie Prioritäts-Support hinzu. Bei monatlicher Zahlung (ohne Jahresvertrag) sind die Preise rund 35 % höher.
Für wen ist Descript geeignet?
- Podcaster: Interviews schneiden, ohne Audacity oder GarageBand lernen zu müssen. Füllwort-Entfernung und Studio-Sound-Verbesserung allein sparen pro Episode deutlich Zeit.
- Marketing-Teams: Lange Webinare oder Vorträge in kurze Social-Media-Clips schneiden, mit automatischen Untertiteln für LinkedIn und Instagram.
- Trainer und Berater: Schulungsvideos produzieren ohne Videoschnitt-Erfahrung. Aufnehmen, Transkript bearbeiten, exportieren.
DSGVO und Datenschutz
Descript ist ein US-Unternehmen mit Sitz in San Francisco und verarbeitet alle Daten in der Cloud. Spezifische EU-Server oder eine explizite DSGVO-Konformität werden nicht angeboten. Für öffentliche Marketing-Inhalte, Podcasts und externe Videos ist das in der Regel unproblematisch. Interne Schulungsvideos mit vertraulichen Inhalten sollten Sie vor dem Upload prüfen. Beim Voice Cloning gilt: Sie brauchen die ausdrückliche Einwilligung der Person, deren Stimme Sie verwenden.
Alternativen zu Descript
- ElevenLabs: Wenn Sie primär hochwertige Sprachsynthese und Voice Cloning brauchen, ohne Video-Editing. ElevenLabs bietet die bessere Stimmqualität, Descript das komplettere Editing-Paket.
- Chatterbox: Open-Source-Alternative für Sprachsynthese, die lokal läuft und damit DSGVO-konform genutzt werden kann.
Vorteile
- Textbasiertes Editing: Audio und Video bearbeiten wie ein Dokument
- Automatische Transkription in 25+ Sprachen mit hoher Genauigkeit
- Füllwort-Entfernung und Studio Sound sparen Stunden Nachbearbeitung
- All-in-one: Aufnahme, Transkription, Schnitt und Export in einem Tool
Nachteile
- Oberfläche nur auf Englisch
- Cloud-basiert: keine Offline-Nutzung möglich
- Performance-Probleme bei sehr langen Projekten über eine Stunde
- Nicht geeignet für professionellen Videoschnitt mit Effekten und Color Grading