Zum Inhalt springen
L

LLMBase: KI-Tool Test & Bewertung

4.0
Hosting & Cloud Freemium Prepaid-Credits ab 5 US-Dollar, Kimi K2 ab 0,58 US-Dollar, GLM 5.1 ab 1,40 US-Dollar pro Mio. Input-Tokens, dedizierte Endpoints ab 0,93 Euro pro Stunde Cloud DSGVO-konform

LLMBase ist ein deutscher LLM-Hoster, der die großen chinesischen und internationalen Open-Weight-Modelle (Kimi K2.6, GLM 5.1, DeepSeek R1, Qwen 3.6, Llama 4) über eine OpenAI-kompatible Inferenz-API in Europa verfügbar macht. Damit schließt er eine Lücke, die IONOS und Mittwald nicht abdecken. Alle Infrastruktur liegt in europäischen Rechenzentren, Eingaben werden nicht für das Training verwendet. Betrieben wird der Dienst von der Eyloo GmbH aus Montabaur.

Zuletzt aktualisiert: 21. April 2026

Wer Frontier-Modelle wie Kimi K2.6 oder GLM 5.1 produktiv einsetzen will, aber nicht über OpenRouter oder direkt auf chinesische Server gehen möchte, hat in Deutschland bislang wenig Auswahl. IONOS und Mittwald hosten nur kleinere Open-Source-Modelle wie Llama oder Mistral, Hetzner liefert nur rohe GPU-Kapazität, bei der man alles selbst aufsetzen muss. LLMBase schließt genau diese Lücke: Die großen Open-Weight-Modelle sind über eine OpenAI-kompatible API auf europäischer Infrastruktur abrufbar, mit deutscher Rechnung durch die Eyloo GmbH aus Montabaur (Amtsgericht Montabaur, HRB 28282).

Wichtigste Funktionen

  • Inferenz-API für große Open-Weight-Modelle: Kimi K2.6, GLM 5.1, DeepSeek R1, Qwen 3.6, Llama 4 und weitere stehen OpenAI-kompatibel zur Verfügung. Die Abrechnung läuft über Prepaid-Credits (ein Credit entspricht 0,01 US-Dollar), Einzahlbeträge liegen zwischen 5 und 10.000 US-Dollar. Auto-Top-up erneuert das Guthaben bei Erreichen einer Schwelle.
  • Transparente Token-Preise pro Modell: Unter llmbase.ai/models/ ist für jedes Modell der Preis pro Million Input- und Output-Tokens einsehbar. Stand April 2026 kostet Kimi K2 beispielsweise 0,58 US-Dollar pro Million Input- und 2,40 US-Dollar pro Million Output-Tokens, GLM 5.1 liegt bei 1,40 und 4,40 US-Dollar.
  • Dedizierte GPU-Endpoints: Für kontinuierliche Lasten stehen Instanzen mit NVIDIA L4, L40S und H100 zur Verfügung, abgerechnet pro Stunde, ohne Token-Limit und mit 99,9 Prozent SLA. Einsetzbar für Modelle wie Llama 3.3 70B, Mistral 7B v0.3, Mixtral 8x7B oder Qwen 2.5 Coder 32B.
  • EU-gehostete Open-Source-Modelle: Für besonders sensible Eingaben stehen Varianten offener Modelle bereit, die ausschließlich auf eigenen europäischen Servern laufen. In diesem Modus verlassen Prompt und Antwort die europäische Infrastruktur nicht.
  • Monatspakete für reservierte Kapazität: Drei Stufen mit fixer Kapazität und Monatsabrechnung. Small für kleinere Lasten, Medium für höheren Durchsatz, Large für maximale dedizierte Kapazität. Im Jahresvertrag jeweils 20 Prozent günstiger.
  • Proprietäre Modelle und Chat-Oberfläche: Zugriff auf GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro und Grok 4.1 über dieselbe API, allerdings als Pass-through an den jeweiligen Anbieter. Die Weboberfläche mit über 100 Modellen dient als schneller Einstieg oder als Ersatz für Einzel-Abos.

Preise und Tarife

Für die API werden Prepaid-Credits gekauft, die Abrechnung erfolgt pro Modell nach tatsächlichem Verbrauch. Ein Credit entspricht 0,01 US-Dollar, Mindesteinzahlung sind 5 US-Dollar (rund 4,60 Euro). Die Preise pro Modell sind öffentlich auf llmbase.ai/models/ dokumentiert. Für Kimi K2 werden 0,58 US-Dollar pro Million Input- und 2,40 US-Dollar pro Million Output-Tokens verlangt (umgerechnet etwa 0,53 Euro und 2,21 Euro), für GLM 5.1 sind es 1,40 und 4,40 US-Dollar (1,29 Euro und 4,05 Euro). Damit liegen die Kimi-Preise leicht unter OpenRouter (dort 0,60 und 2,80 US-Dollar), ohne den Umweg über einen US-Anbieter.

Für dedizierte Kapazität gibt es drei Monatspakete: Small für 699 Euro, Medium für 1.299 Euro und Large für 2.599 Euro, im Jahresvertrag jeweils 20 Prozent günstiger. Stundenweise abgerechnete GPU-Instanzen kosten 0,93 Euro für eine NVIDIA L4 mit 24 GB, 1,72 Euro für eine L40S mit 48 GB, 3,40 Euro für eine H100 mit 80 GB und 6,68 Euro für eine Dual-H100-Instanz mit 160 GB. Die Chat-Oberfläche gibt es zusätzlich als Free-Tarif, Starter für 9 Euro pro Monat und Pro für 19 Euro pro Monat mit Zugriff auf alle Modelle.

Für wen ist LLMBase geeignet?

  • Entwickler mit Interesse an Frontier-Open-Weight-Modellen: Wer Kimi K2.6, GLM 5.1 oder DeepSeek R1 für eigene Anwendungen nutzen will, bekommt hier den API-Zugriff über eine europäische Rechnungsstelle. Das ist für Projekte mit DSGVO-Anforderungen praktisch die einzige seriöse Option neben OpenRouter.
  • Unternehmen mit gleichmäßiger Inferenzlast: Dedizierte GPU-Endpoints mit fixen Stundenpreisen sind bei konstantem Bedarf günstiger als Pay-per-Token. Für Support-Chatbots, RAG-Pipelines oder interne Assistenten mit berechenbarem Volumen lohnt sich die reservierte Kapazität.
  • KMU und Berater mit mehreren KI-Abos: Die Chat-Oberfläche im Pro-Tarif (19 Euro pro Monat) ersetzt mehrere Einzel-Abos bei OpenAI, Anthropic und Google. Für kleine Teams ohne Enterprise-Anforderungen ein messbarer Kostenvorteil gegenüber Langdock.

DSGVO und Datenschutz

LLMBase wird von der Eyloo GmbH aus Montabaur betrieben (Amtsgericht Montabaur, HRB 28282, USt-IdNr. DE350377015). Die Infrastruktur liegt nach Angaben des Anbieters vollständig in Europa, Eingaben werden nicht für das Training der Modelle verwendet. Auf ausgewählten offenen Modellen lässt sich ein Modus ohne Datenspeicherung wählen, bei dem weder Eingabe noch Ausgabe protokolliert werden. Ein Auftragsverarbeitungsvertrag ist über die Rechtsabteilung (legal@llmbase.ai) erhältlich.

Bei proprietären US-Modellen wie GPT-5.4 oder Claude Opus 4.6 reicht LLMBase die Anfrage an den jeweiligen Anbieter weiter, womit die Daten das europäische Umfeld verlassen. Für streng DSGVO-kritische Inhalte empfiehlt sich daher der Einsatz der Open-Weight-Modelle wie Kimi K2.6, GLM 5.1 oder DeepSeek R1 oder der dedizierten GPU-Endpoints. In beiden Varianten verbleiben die Daten innerhalb der europäischen Infrastruktur.

Alternativen zu LLMBase

  • IONOS AI Model Hub: Deutscher Cloud-Anbieter mit OpenAI-kompatibler API. Deutlich kleineres Modellangebot (primär Llama und Mistral), keine großen chinesischen Frontier-Modelle wie Kimi oder GLM. Dafür integrierte Vektor-Datenbank und etablierter Infrastrukturbetreiber.
  • Hetzner: Rohinfrastruktur mit GPU-Servern in Falkenstein und Helsinki. Deutlich günstiger pro Rechenstunde, aber das Modell-Hosting und das API-Frontend müssen Sie selbst aufsetzen und betreiben. Für 1T-MoE-Modelle wie Kimi K2.6 sind zusätzlich mehrere H100-GPUs nötig.
  • Mittwald: Managed Hosting für Agenturen mit AI-Hosting-Komponente. Mehr Betreuung und Service-Integration als LLMBase, dafür schmaleres Portfolio an Open-Source-Modellen und ohne Zugriff auf Kimi oder GLM.

Vorteile

  • Einer der wenigen EU-Anbieter mit API-Zugriff auf Kimi K2.6, GLM 5.1 und DeepSeek
  • Deutscher Betreiber Eyloo GmbH, Server in Europa, keine Trainingsnutzung von Eingaben
  • Inferenz-API mit transparenten Token-Preisen pro Modell, Prepaid-Credits
  • Dedizierte GPU-Endpoints (L4, L40S, H100) mit festen Stundenpreisen und 99,9 Prozent SLA

Nachteile

  • Proprietäre Plattform, kein Self-Hosting möglich
  • Proprietäre US-Modelle werden an OpenAI, Anthropic oder Google durchgereicht
  • Kleiner Anbieter mit begrenzter öffentlicher Referenzkundenbasis

Anwendungsgebiete

DSGVO-konformer API-Zugriff auf Kimi K2.6, GLM 5.1 und DeepSeekDedizierte GPU-Endpoints für Open-Source-Modelle in EuropaDeutsche Rechnungsstelle für LLM-InferenzChat-Oberfläche mit über 100 Modellen als Bonus