Zum Inhalt springen
K

Kimi: KI-Tool Test & Bewertung

4.5
Sprachmodelle Freemium Kostenlos mit täglichem Limit / API ab ca. 0,55 Euro pro Mio. Input-Tokens (OpenRouter) bzw. 0,87 Euro (Moonshot) Cloud Open Source

Kimi K2.6 ist das am 20. April 2026 veröffentlichte Open-Weight-Modell von Moonshot AI. Die Mixture-of-Experts-Architektur mit 1 Billion Parametern (32 Milliarden aktiv) schlägt auf Humanity's Last Exam, SWE-Bench Pro und LiveCodeBench v6 Claude Opus 4.6 und GPT-5.4 und zählt damit zu den besten verfügbaren Sprachmodellen. Das Modell bietet 256.000 Token Kontext, native Multimodalität mit Video und einen Agent Swarm mit bis zu 300 Sub-Agenten über rund 4.000 Schritte. Die Gewichte stehen unter modifizierter MIT-Lizenz zum Self-Hosting bereit.

Zuletzt aktualisiert: 21. April 2026

Kimi K2.6 ist im April 2026 das vermutlich stärkste frei verfügbare Sprachmodell. Es schlägt Claude Opus 4.6 und GPT-5.4 auf Humanity’s Last Exam, liefert auf SWE-Bench Pro 58,6 Punkte (Claude Opus 4.6: 53,4) und spielt in der Königsdisziplin agentischer KI mit: 300 parallele Sub-Agenten koordinieren bis zu 4.000 Schritte in einer Aufgabe. Die Gewichte stehen offen bereit, die Cloud läuft jedoch auf Servern unter chinesischer Jurisdiktion. Für DSGVO-konforme Nutzung ist entweder Self-Hosting oder ein europäischer Inferenz-Anbieter wie LLMBase nötig.

Wichtigste Funktionen

  • 256K Kontextfenster: Verträge, Codebases oder technische Dokumentationen mit bis zu 262.144 Tokens lassen sich in einem Durchlauf verarbeiten. Bei Reasoning-Aufgaben sind bis zu 98.304 Token Ausgabe möglich.
  • Native Multimodalität: K2.6 verarbeitet Text, Bilder und Videos in einer Architektur, nicht über ein nachträglich angebundenes Vision-Modul. Unterstützt werden unter anderem mp4, mov, webm und 3gpp.
  • Agent Swarm mit 300 Sub-Agenten: Komplexe Aufgaben werden auf bis zu 300 parallele Sub-Agenten verteilt, die über rund 4.000 Schritte koordiniert arbeiten. Das ist der dreifache Wert des Vorgängers K2.5 (100 Agenten, 1.500 Schritte).
  • Kimi Code: Eigenständiger Coding-Assistent für Terminal und IDE, der mehrstufige Entwicklungsaufgaben selbst ausführt. In SWE-Bench Pro erreicht K2.6 den Wert 58,6 und liegt damit vor Claude Opus 4.6.
  • Deep Research: Plant selbstständig mehrere Suchschritte, liest Webquellen aus und fasst die Ergebnisse zu einem strukturierten Bericht mit Quellenverweisen zusammen.
  • Open Weights auf Hugging Face: Die Gewichte stehen unter moonshotai/Kimi-K2.6 bereit. Das volle 1T-MoE-Modell erfordert mehrere H100-Knoten. Community-Quantisierungen in 4 oder 3 Bit laufen auch auf kleinerer Hardware, mit entsprechenden Qualitätseinbußen.

Preise und Tarife

Über kimi.com lässt sich K2.6 mit einem täglichen Freikontingent ohne Kosten nutzen. Die API gibt es wahlweise über die offizielle Moonshot-Plattform oder über Drittanbieter wie OpenRouter und Cloudflare. Moonshot nennt für K2.6 Preise von etwa 0,87 Euro pro Million Input-Tokens, 3,68 Euro pro Million Output-Tokens und 0,15 Euro pro Million gecachter Tokens (umgerechnet aus 0,95, 4,00 und 0,16 US-Dollar, Stand April 2026). Über OpenRouter liegen die Preise mit rund 0,55 Euro pro Million Input-Tokens und 2,57 Euro pro Million Output-Tokens niedriger. Self-Hosting ist lizenzfrei, braucht aber mehrere H100-GPUs für das volle Modell oder passende Quantisierungen für kleinere Setups.

Für wen ist Kimi geeignet?

  • Entwickler mit Kostenbewusstsein: Für Anwendungen mit hohem Token-Volumen ist die API deutlich günstiger als GPT-5.4 oder Claude Opus 4.6, bei vergleichbarer Coding-Leistung. Gut geeignet für Experimente, Prototypen und Pipelines mit hohem Durchsatz.
  • Teams mit sehr langen Dokumenten: Wer regelmäßig umfangreiche Verträge, Studien oder Codebases in einem Aufruf verarbeiten muss, profitiert vom 256K-Kontext und der verbesserten Stabilität bei langen Eingaben.
  • Self-Hosting-Anwender mit GPU-Kapazität: Die offenen Gewichte machen einen DSGVO-konformen Betrieb auf eigener Infrastruktur möglich. Ohne starke GPUs ist das kein realistischer Einsatz, eher ein Fall für kleinere Open-Weight-Modelle wie Qwen 3.6 oder GLM-5.

DSGVO und Datenschutz

Die Cloud-Version von Kimi ist nicht DSGVO-konform. Moonshot AI unterliegt chinesischem Recht (Personal Information Protection Law, PIPL), das behördlichen Datenzugriff ermöglicht. Einen Opt-out für das Modelltraining gibt es in der kostenlosen Cloud-Nutzung nicht. Im Februar 2026 hat Anthropic öffentlich dokumentiert, dass Moonshot AI über gefälschte Accounts mehr als 3,4 Millionen Anfragen an Claude gesendet hat, vermutlich zum Destillieren eigener Modelle.

Für einen DSGVO-konformen Betrieb müssen die Open-Weight-Gewichte auf eigener Infrastruktur oder bei einem europäischen Inferenz-Anbieter laufen. Erst dann bleiben die Daten unter eigener Kontrolle.

Alternativen zu Kimi

  • Claude: US-Anbieter mit klarer Datenschutzdokumentation, Opt-out für Training und 200K-Kontext. Teurer, aber für Unternehmen mit westlichen Compliance-Anforderungen die ruhigere Wahl.
  • Qwen 3.6 35B-A3B: Alibabas MoE-Modell unter Apache 2.0 Lizenz, lokal betreibbar und leichter zu hosten. Schwächer auf Long-Horizon-Coding-Benchmarks, dafür mit 3 Mrd. aktiven Parametern praxistauglich auf einer einzelnen GPU.
  • Le Chat: Europäischer KI-Assistent von Mistral AI, nativ DSGVO-konform. Kürzere Kontexte und schwächere Reasoning-Werte, dafür ohne Risiken durch asiatische Jurisdiktion.

Vorteile

  • 256K Kontextfenster und native Video-Eingabe in der Standardversion
  • Agent Swarm mit bis zu 300 Sub-Agenten und rund 4.000 koordinierten Schritten
  • Open-Weight-Modell unter modifizierter MIT-Lizenz, Self-Hosting möglich
  • Spitzenwerte auf HLE-Full (54,0), SWE-Bench Pro (58,6) und LiveCodeBench v6 (89,6)

Nachteile

  • Cloud-Version nicht DSGVO-konform, Server in China
  • Chinesisches Recht (PIPL) ermöglicht behördlichen Datenzugriff
  • Kein Opt-out für Training in der kostenlosen Cloud-Nutzung
  • Vorwürfe der Modelldestillation durch Anthropic (Februar 2026)

Anwendungsgebiete

Lange Dokumente und Codebases analysierenEigenständige Recherche mit Deep ResearchCoding-Aufgaben mit Kimi CodeGünstige KI-API für Entwickler