Nvidia, GQE

Nvidia GQE: Datenbankabfragen 7,5-fach schneller mit GPUs

01.07.2026 - 08:23:11 | boerse-global.de

Nvidias neue GPU-Architektur beschleunigt Datenbankabfragen um das 7,5-Fache und senkt KI-Inferenzkosten drastisch.

Nvidia GQE: 7,5-fach schnellere Datenbankabfragen durch GPUs
Nvidia - Nahaufnahme eines stilisierten, leuchtenden NVIDIA-GPU-Chips in einem High-Tech-Serverrack mit abstrakten Lichtspuren als Datenfluss. 01.07.2026 - Bild: über boerse-global.de

Die GPU-beschleunigten Query Engines (GQE) lösen das seit Jahren drängende Problem von Speicher- und I/O-Engpässen – und das mit beeindruckenden Zahlen.

Im TPC-H SF1000-Benchmark, einem Industriestandard für Datenbankleistung, erzielt die neue Architektur eine 7,5-fache Gesamtbeschleunigung im Vergleich zu herkömmlichen CPU-basierten Systemen. Das geht aus technischen Dokumentationen hervor, die Nvidia am 30. Juni veröffentlichte.

So funktioniert der Turbo für Datenbanken

Das Herzstück der GQE-Architektur ist die Kombination aus Hochgeschwindigkeitsspeicher (HBM), NVLink-C2C-Verbindungen und spezieller Dekompressions-Hardware. Diese Komponenten arbeiten zusammen, um Daten schneller zu verarbeiten als je zuvor.

Die Zahlen sprechen für sich: Ein einzelner GB200-GPU benötigt für die 22 Abfragen des TPC-H-Benchmarks auf einem Terabyte großen Datensatz gerade einmal 9,0 Sekunden. Zum Vergleich: Zwei CPU-Sockel mit DuckDB brauchen dafür zwischen 70,6 und 74,0 Sekunden. Bei einzelnen Abfragen beträgt der Geschwindigkeitsvorteil sogar bis zu 25,5-fach.

Verantwortlich für diese Sprünge ist unter anderem der Blackwell Decompression Engine, der Daten mit bis zu 400 GB/s entpackt. In Kombination mit Kompressionsverfahren wie LZ4 und Cascaded über die nvCOMP-Bibliothek werden selbst riesige Datenmengen rasant verarbeitet.

Clevere Optimierungen sparen Ressourcen

Nvidia setzt zudem auf Partition Pruning – eine Technik, die unnötige Datenbewegungen vermeidet. Laut technischen Berichten reduzierte sich der Datentransfer dadurch um 31 Prozent, was zu einer 1,43-fachen Verbesserung der Gesamtverarbeitungsgeschwindigkeit führte.

Anzeige

Wer die 7,5-fache Beschleunigung von Datenbankabfragen durch Nvidias GQE-Architektur für sein Unternehmen nutzen will, findet im Whitepaper die technischen Details und einen konkreten Migrations-Fahrplan – inklusive Benchmark-Vergleich und Checkliste. Jetzt Whitepaper anfordern

Blackwell und Vera Rubin: Die nächste Hardware-Generation

Die GQE-Architektur ist nur ein Teil einer größeren Offensive. Parallel dazu treibt Nvidia die Einführung seiner nächsten Hardware-Plattformen voran. Seit dem 29. Juni sind die Claude-Modelle von Anthropic auf den GB300 Blackwell Ultra GPUs in der Microsoft Foundry auf Azure verfügbar – ausgerüstet mit GB300 NVL72-Konfigurationen und Quantum-X800 InfiniBand-Netzwerken.

Noch einen Schritt weiter geht die Vera-Rubin-Architektur. Am 30. Juni bestätigten CoreWeave und Nvidia die erste Inbetriebnahme des Vera Rubin NVL72-Systems. Dieses Rack-Scale-System vereint 72 Rubin-GPUs und 36 Vera-CPUs und bietet eine beeindruckende 260 TB/s NVLink-6-Bandbreite. Siemens und Fluence kündigten zudem am 1. Juli eine Zusammenarbeit an, um Referenzarchitekturen für extrem dichte KI-Rechenzentren auf Basis des DSX-Vera-Rubin-Designs zu entwickeln – inklusive moderner Stromversorgung und Flüssigkeitskühlung.

Kostenvorteile bei KI-Inferenz

Die Optimierungen beschränken sich nicht auf Datenbanken. Berichten vom 30. Juni zufolge können Blackwell-GPUs (GB200 und GB300) die Token-Kosten für das DeepSeek v4-Modell um bis zu das Fünffache senken. Möglich wird dies durch Full-Stack-Optimierungen mit TensorRT-LLM, die in Kombination mit Technologien wie NVFP4 und Multi-Token-Vorhersage einen 20-fachen Durchsatz ermöglichen.

Wettbewerb schläft nicht

Anzeige

Speicher- und I/O-Engpässe bremsen Ihre Datenbank-Queries? Nvidias GQE-Referenzarchitektur zeigt, wie GPUs mit HBM und NVLink-C2C Abfragen bis zu 25,5-mal schneller machen. Der Report liefert Benchmark-Daten und eine Schritt-für-Schritt-Migrationsanleitung. GPU-Query-Report jetzt sichern

Doch Nvidia ist nicht allein auf dem Feld. DeepSeek veröffentlichte am 27. Juni sein DSpark-Modul zur spekulativen Dekodierung, das die Generierungsgeschwindigkeit seiner V4-Modelle um bis zu 85 Prozent steigert – ohne neue Hardware. Und eine am 30. Juni veröffentlichte Studie von Hochleistungsrechen-Experten legt nahe, dass moderne CPUs mit Matrixbeschleunigung und Hochgeschwindigkeitsspeicher GPUs für bestimmte KI- und HPC-Workloads ersetzen könnten. Als Beispiel dient der reine CPU-Supercomputer Fugaku.

Auch Google Cloud rüstet auf: Seit dem 1. Juli ist Conversational Analytics in BigQuery allgemein verfügbar. Zudem positioniert Google seine AlloyDB Omni für die Finanzbranche und verspricht analytische Abfragen, die bis zu 100-mal schneller sein sollen als Standard-PostgreSQL – dank einer speziellen Columnar-Engine.

de | wissenschaft | 69665762 |