Google AI Edge Gallery für macOS: Gemini läuft jetzt lokal

04.06.2026 - 05:31:19 | boerse-global.de

Google veröffentlicht die AI Edge Gallery für macOS, die lokale KI-Verarbeitung ohne Cloud ermöglicht und den Datenschutz stärkt.

Google AI Edge Gallery für macOS: Gemini läuft jetzt lokal - Bild: über boerse-global.de

Google erweitert sein KI-Ökosystem für lokale Geräte und veröffentlicht die AI Edge Gallery für macOS. Der Fokus liegt auf Datenschutz durch Verarbeitung direkt auf dem Rechner.

Seit dem 4. Juni 2026 können Mac-Nutzer die KI-Modelle Gemini und Gemma lokal auf ihrer Hardware ausführen. Mit der offiziellen Freigabe der Google AI Edge Gallery für macOS entfällt die Notwendigkeit, Daten in die Cloud zu senden – die gesamte Rechenleistung bleibt auf dem Gerät. Parallel dazu brachte Google die Diktier-App AI Edge Eloquent für macOS auf den Markt, die ebenfalls komplett offline arbeitet.

Gemma 4: Multimodale KI für den Laptop

Anzeige: Möchten auch Sie Gemini und Gemma 4 lokal auf Ihrem Mac nutzen? In dieser Anleitung erfahren Sie, wie Sie die Modelle installieren und konfigurieren – inklusive Hardware-Checkliste und Vergleich der verfügbaren Modelle. Kostenlose Anleitung jetzt sichern

Das Herzstück der neuen macOS-Unterstützung ist das Gemma 4 12B-Modell, das Google bereits am 3. Juni 2026 veröffentlichte. Mit 12 Milliarden Parametern verarbeitet es nicht nur Text, sondern auch Bilder und Audio. Erstaunlich: Trotz seiner Größe läuft das Modell auf Laptops mit 16 GB RAM oder VRAM flüssig.

Entwickler loben die encoderfreie Architektur des Modells, die einen 35 Millionen Parameter starken Vision-Embedder und eine direkte Audio-Projektion nutzt. Laut technischen Unterlagen erreicht die 12B-Version eine Leistung, die mit deutlich größeren 26B-Modellen vergleichbar ist.

Gemma 4 wird unter der Apache 2.0-Lizenz vertrieben und ist in mehreren Varianten erhältlich:
- Eine 31B dichte Version
- Eine 26B Mixture-of-Experts (MoE)-Version
- Kleinere 2B- und 4B-Versionen für Edge-Geräte

Die macOS-Version der AI Edge Gallery enthält zudem integrierte Code-Generierungsfunktionen. Die App AI Edge Eloquent bietet eine Voice Edit-Funktion, mit der Nutzer Text per Sprachbefehl bearbeiten können.

Neue Werkzeuge für Entwickler

Zur Unterstützung lokaler KI-Workflows launchte Google das LiteRT-LM CLI. Dieses Tool richtet einen OpenAI-kompatiblen lokalen HTTP-Server auf Port 9379 ein. Entwickler können damit eine lokale API für Gemma 4 12B nutzen und dynamisch zwischen CPU, GPU und NPU-Ressourcen wählen.

Ebenfalls am 4. Juni 2026 erschien eine dedizierte Gemini-App für macOS 15 und höher. Sie bietet eine Shortcut-basierte Oberfläche mit dem Befehl Option+Leertaste für schnellen KI-Zugriff. Die App integriert Bildschirmfreigabe zur Zusammenfassung von Dokumenten und Daten sowie Werkzeuge zur Bild- und Videogenerierung.

Gemini Spark: KI-Assistent für Hintergrundaufgaben

Über die lokale Ausführung hinaus führte Google am 2. Juni 2026 in den USA Gemini Spark ein. Dieses agentische Tool erledigt Aufgaben im Hintergrund – etwa Buchungsverwaltung oder Datenanalyse aus Gmail und Google Kalender. Gemini Spark basiert auf dem Gemini Flash 3.5-Modell und der Antigravity-Plattform.

Der Dienst ist zunächst Abonnenten von Google AI Ultra vorbehalten und kostet rund 100 Euro monatlich. Zum Start integriert das Tool Canva, OpenTable und Instacart. Künftige Unterstützung ist für Adobe, Uber, Spotify und Booking.com geplant.

Anzeige: Datenschutzbedenken bei Cloud-KI? Mit der lokalen Ausführung von Gemini auf dem Mac bleiben Ihre Daten auf dem Gerät. Diese Anleitung zeigt Ihnen, wie Sie die AI Edge Gallery einrichten und mit dem LiteRT-LM CLI eine lokale API bereitstellen. Datenschutz-KI-Guide anfordern

TurboQuant: Revolutionäre Kompression für KI-Modelle

Google Research stellte zudem eine neue Quantisierungsmethode namens TurboQuant vor. Diese Technologie überwindet Hardware-Speicherbeschränkungen, indem sie große Sprachmodelle nahezu verlustfrei in 4-Bit- und 2-Bit-Formate komprimiert.

Ein 32B-Modell passt damit in weniger als 13 GB Speicher. Auf High-End-Hardware wie dem M3 Max erreicht das System Verarbeitungsgeschwindigkeiten von rund 18 Tokens pro Sekunde. Das beschleunigt den Trend zur lokalen KI-Ausführung auf Verbraucherhardware erheblich.

de | wissenschaft | 69480395 |