Skyvern – KI-Tool Test & Bewertung
Skyvern automatisiert Aufgaben im Browser so, wie ein Mensch es tun würde: Es macht einen Screenshot der aktuellen Seite, lässt ein LLM verstehen was zu tun ist, und führt die nächste Aktion aus. Im Gegensatz zu klassischer Browser-Automatisierung braucht Skyvern keine fragilen XPath-Selektoren oder CSS-Klassen, die bei jedem Website-Update brechen.
Zuletzt aktualisiert: 14. März 2026
Klassische Browser-Automatisierung mit Selenium oder Playwright ist mächtig, aber brüchig. Sobald eine Webseite ihr Layout ändert, brechen die XPath-Selektoren. Skyvern umgeht das Problem: Statt auf feste Elemente zu zeigen, versteht der Agent die Seite visuell und entscheidet selbst, wo er klicken muss. Das funktioniert auch auf Webseiten, die Skyvern noch nie gesehen hat.
Wichtigste Funktionen
- Screenshot-basierte Navigation: Nach jedem Schritt macht Skyvern einen Screenshot, analysiert ihn mit einem Vision-LLM und plant die nächste Aktion. Layouts können sich ändern, der Agent passt sich automatisch an.
- Workflow-Definition: Komplexe Abläufe werden als strukturierte Workflows definiert, mit Verzweigungen, Schleifen und Fehlerbehandlung.
- Datei-Handling: PDFs herunterladen, Dateien hochladen, Formulare mit dynamischen Feldern ausfüllen.
- 2FA und CAPTCHAs: Unterstützt TOTP-basierte Zwei-Faktor-Authentifizierung und kann bei CAPTCHAs externe Lösungsdienste einbinden.
- Parallelisierung: Mehrere Browser-Sessions gleichzeitig für höheren Durchsatz.
- MCP-Integration: Per MCP-Server lässt sich Skyvern direkt aus KI-Agenten wie Claude Desktop oder Cursor steuern.
Preise und Tarife
Skyvern arbeitet mit einem Credit-System. Der kostenlose Einstieg umfasst 1.000 Credits ohne Kreditkarte. Der Hobby-Plan kostet $29 pro Monat und enthält 5.000 monatliche Credits sowie Webhooks und schnellere Ausführung. Der Professional-Plan kostet $149 pro Monat mit 25.000 Credits, Team-Workspaces, erweiterten Workflows und dediziertem Support. Der Enterprise-Tarif bietet unlimitierte Credits, Self-Hosted-Deployment, HIPAA-Konformität, SOC 2 Type II und SLA-Garantien zu individuellen Konditionen.
Für wen ist Skyvern geeignet?
- Unternehmen mit Legacy-Portalen: Wer regelmäßig Daten in Behörden-Websites, Lieferantenportale oder veraltete Systeme einpflegen muss und keine API-Schnittstelle bekommt.
- Operations-Teams: Teams, die wiederkehrende Web-Aufgaben wie Bestellungen, Formulare oder Datentransfers automatisieren wollen, ohne Entwicklungsaufwand für brüchige Selektoren.
- Entwickler und KI-Agenten-Builder: Wer Skyvern als Werkzeug in komplexere Agenten-Pipelines einbettet, etwa per MCP aus Claude Desktop heraus gesteuert.
DSGVO und Datenschutz
Bei der Cloud-Version von Skyvern laufen Browsersitzungen und Screenshots auf Servern in den USA. Das umfasst potenziell sensible Inhalte, die während der Automatisierung sichtbar sind. Eine DSGVO-konforme Nutzung setzt Self-Hosting voraus, das ab dem Enterprise-Tarif verfügbar ist. Im Self-Hosted-Betrieb per Docker bleibt alles in der eigenen Infrastruktur. Für produktive Einsätze mit personenbezogenen Daten ist Self-Hosting die einzige vertretbare Option.
Alternativen zu Skyvern
- Playwright MCP: Für Entwickler, die direkt per Claude oder anderen LLMs Browser-Aktionen ausführen wollen, ohne ein separates Tool zu betreiben.
- n8n: Für einfachere Web-Automatisierungen mit API-Unterstützung und visuellem Workflow-Builder.
Vorteile
- Funktioniert auf jeder Webseite ohne API oder Zugangsdaten
- Keine fragilen XPath/CSS-Selektoren, die bei Layout-Updates brechen
- Versteht dynamische Seiten, CAPTCHAs und mehrstufige Flows
- Self-Hosted-Deployment im Enterprise-Tarif verfügbar
- Open Source (AGPL-3.0)
Nachteile
- Langsamer als klassische Browser-Automatisierung
- Höhere LLM-Kosten durch Screenshot-Analyse bei jedem Schritt
- Komplexe Flows erfordern Einarbeitung in Workflow-Definitionen
- AGPL-Lizenz schränkt kommerzielle Einbettung ein
Anwendungsgebiete
Du nutzt Skyvern?
Teile deine Erfahrung mit uns – wir nehmen dein Feedback in unsere Bewertung auf.