Zum Inhalt springen
N

NVIDIA DGX Spark: KI-Tool Test & Bewertung

4.5
KI-Hardware Kostenpflichtig Ab ca. 3.300 EUR (OEM-Varianten) bzw. ab ca. 4.300 EUR (Founders Edition) Self-Hosted DSGVO-konform

Der NVIDIA DGX Spark ist ein kompakter Desktop-Rechner mit dem GB10 Grace Blackwell Superchip und 128 GB Unified Memory, in dem sich CPU und GPU einen gemeinsamen Speicherpool teilen. Er bringt das volle CUDA-Ökosystem und Server-ähnliche KI-Leistung in ein kleines Gehäuse, das direkt auf dem Schreibtisch Platz findet.

Zuletzt aktualisiert: 10. April 2026

Der NVIDIA DGX Spark, ursprünglich als “Project DIGITS” angekündigt, wurde Anfang 2025 auf der CES vorgestellt und ist seitdem über ausgewählte Retailer wie Amazon, PNY, Micro Center sowie über OEM-Partner wie Dell, HP, Lenovo und ASUS erhältlich. Das Gerät beantwortet eine konkrete Frage: Wie bekommt man GPU-Server-Leistung mit dem vollen CUDA-Ökosystem auf den Schreibtisch, ohne ein Rechenzentrum zu betreiben?

Wichtigste Funktionen

  • GB10 Grace Blackwell Superchip: Der DGX Spark verbaut NVIDIAs GB10 Superchip, der eine Blackwell-GPU direkt mit einem ARM-basierten Grace-Prozessor koppelt. CPU und GPU kommunizieren über eine hochbandbreite NVLink-C2C-Verbindung statt über den langsameren PCIe-Bus.
  • 128 GB Unified Memory: CPU und GPU teilen sich einen gemeinsamen Speicherpool von 128 GB. Große Sprachmodelle müssen nicht in einen begrenzten GPU-VRAM passen, sondern können den gesamten Speicher nutzen. Das ermöglicht das Betreiben von Modellen bis ca. 70B in guter Qualität.
  • Volles CUDA-Ökosystem: Jedes Framework, das auf NVIDIA-GPUs läuft, funktioniert auch auf dem DGX Spark: PyTorch, TensorFlow, vLLM, Ollama und alle gängigen Inferenz-Server. Das ist der wesentliche Unterschied zu Apple Silicon.
  • ConnectX-Kopplung: Zwei DGX-Spark-Geräte lassen sich über ConnectX verbinden. Das verdoppelt den Speicher auf 256 GB und die Rechenleistung, ohne einen eigenen Server anschaffen zu müssen.
  • Eigenständiges Gerät: Der DGX Spark wird als fertig konfiguriertes System geliefert. Kein Zusammenbauen, kein Treiber-Puzzle wie bei einer selbst zusammengestellten GPU-Workstation.

Preise und Tarife

Der DGX Spark ist in Deutschland ab ca. 3.300 EUR erhältlich (OEM-Varianten wie Lenovo ThinkStation PGX oder ASUS Ascent GX10). Die NVIDIA Founders Edition liegt bei ca. 4.300 bis 4.600 EUR. NVIDIA hat den ursprünglichen Listenpreis von 3.999 USD im Februar 2026 auf 4.699 USD angehoben. OEM-Varianten von Dell, Lenovo, ASUS, Acer, Gigabyte und MSI sind in der Regel günstiger als die Founders Edition.

Für wen ist der DGX Spark geeignet?

  • Entwickler mit CUDA-Workflows: Wer bereits mit PyTorch, vLLM oder anderen CUDA-basierten Frameworks arbeitet, bekommt mit dem DGX Spark eine nahtlose lokale Erweiterung ohne Cloud-Abhängigkeit.
  • Unternehmen mit Datenschutzanforderungen: Alle Daten bleiben lokal. Das Gerät braucht keine Cloud-Anbindung und ist damit eine praktische Lösung für DSGVO-konforme KI-Anwendungen.
  • KI-Teams und Forschungsgruppen: Als lokale Entwicklungsplattform, bevor Modelle auf Cloud-GPUs skaliert werden, oder als dauerhafter Inferenz-Server für interne Anwendungen.

DSGVO und Datenschutz

Da der DGX Spark ein vollständig lokales Gerät ist, verlassen keine Daten das eigene Netzwerk. Es gibt keine Cloud-Komponente, kein Telemetrie-Pflichtprogramm und keine Abhängigkeit von externen Diensten. Die Kombination aus lokalem Betrieb und dem vollen CUDA-Ökosystem macht den DGX Spark zu einer soliden Basis für datenschutzkonforme KI-Infrastruktur, sowohl für Entwicklung als auch für Produktion.

Bewertung

4,5 von 5 Sternen. Das beste Gesamtpaket für den Einstieg in CUDA-basierte lokale KI: kompakt, fertig konfiguriert und mit 128 GB ausreichend für die meisten Modelle. Wer mehr Speicherbandbreite oder größere Modelle braucht, sollte sich die RTX PRO 6000 (96 GB) oder eine Multi-GPU Workstation ansehen.

Alternativen zu NVIDIA DGX Spark

  • Apple Mac Studio M3 Ultra: Bis zu 512 GB Unified Memory, leise und energiesparend, aber ohne CUDA. Für Apple-Workflows die stärkere Wahl beim Speicher.
  • NVIDIA RTX PRO 6000: 96 GB GDDR7 ECC-VRAM als Einbaukarte für bestehende Workstations. Mehr Speicherbandbreite als der DGX Spark, aber kein eigenständiges Gerät.
  • NVIDIA Multi-GPU Workstation: Wer mehr als 128 GB VRAM und CUDA braucht, kombiniert mehrere RTX-PRO-6000-Karten in einer Workstation. Deutlich mehr Aufwand, aber auch deutlich mehr Leistung.

Vorteile

  • 128 GB Unified Memory: CPU und GPU teilen sich denselben Speicherpool
  • Volles CUDA-Ökosystem für maximale Framework-Kompatibilität
  • Kompakter Formfaktor passen auf den Schreibtisch
  • Zwei Geräte über ConnectX koppelbar für 256 GB und doppelte Leistung
  • Alle Daten bleiben lokal, kein Cloud-Zwang

Nachteile

  • Kein Display-Ausgang, reine Compute-Lösung (SSH-Zugriff nötig)
  • Linux-basiert (DGX OS), kein Windows oder macOS
  • 128 GB reichen nicht für die größten Modelle (400B+ Parameter)
  • Verfügbarkeit über ausgewählte Retailer, kein direkter NVIDIA-Store-Kauf

Anwendungsgebiete

Lokale LLM-Inferenz mit CUDAKI-Prototyping und EntwicklungDSGVO-konforme KI ohne CloudFine-Tuning kleinerer Modelle