Google, Edge

Google AI Edge Gallery fĂŒr macOS: Gemini lĂ€uft jetzt lokal

04.06.2026 - 05:31:19 | boerse-global.de

Google veröffentlicht die AI Edge Gallery fĂŒr macOS, die lokale KI-Verarbeitung ohne Cloud ermöglicht und den Datenschutz stĂ€rkt.

Google AI Edge Gallery fĂŒr macOS: Gemini lĂ€uft jetzt lokal - Bild: ĂŒber boerse-global.de
Google AI Edge Gallery fĂŒr macOS: Gemini lĂ€uft jetzt lokal - Bild: ĂŒber boerse-global.de

Google erweitert sein KI-Ökosystem fĂŒr lokale GerĂ€te und veröffentlicht die AI Edge Gallery fĂŒr macOS. Der Fokus liegt auf Datenschutz durch Verarbeitung direkt auf dem Rechner.

Seit dem 4. Juni 2026 können Mac-Nutzer die KI-Modelle Gemini und Gemma lokal auf ihrer Hardware ausfĂŒhren. Mit der offiziellen Freigabe der Google AI Edge Gallery fĂŒr macOS entfĂ€llt die Notwendigkeit, Daten in die Cloud zu senden – die gesamte Rechenleistung bleibt auf dem GerĂ€t. Parallel dazu brachte Google die Diktier-App AI Edge Eloquent fĂŒr macOS auf den Markt, die ebenfalls komplett offline arbeitet.

Gemma 4: Multimodale KI fĂŒr den Laptop

Anzeige: Möchten auch Sie Gemini und Gemma 4 lokal auf Ihrem Mac nutzen? In dieser Anleitung erfahren Sie, wie Sie die Modelle installieren und konfigurieren – inklusive Hardware-Checkliste und Vergleich der verfĂŒgbaren Modelle. Kostenlose Anleitung jetzt sichern

Das HerzstĂŒck der neuen macOS-UnterstĂŒtzung ist das Gemma 4 12B-Modell, das Google bereits am 3. Juni 2026 veröffentlichte. Mit 12 Milliarden Parametern verarbeitet es nicht nur Text, sondern auch Bilder und Audio. Erstaunlich: Trotz seiner GrĂ¶ĂŸe lĂ€uft das Modell auf Laptops mit 16 GB RAM oder VRAM flĂŒssig.

Entwickler loben die encoderfreie Architektur des Modells, die einen 35 Millionen Parameter starken Vision-Embedder und eine direkte Audio-Projektion nutzt. Laut technischen Unterlagen erreicht die 12B-Version eine Leistung, die mit deutlich grĂ¶ĂŸeren 26B-Modellen vergleichbar ist.

Gemma 4 wird unter der Apache 2.0-Lizenz vertrieben und ist in mehreren Varianten erhÀltlich:
- Eine 31B dichte Version
- Eine 26B Mixture-of-Experts (MoE)-Version
- Kleinere 2B- und 4B-Versionen fĂŒr Edge-GerĂ€te

Die macOS-Version der AI Edge Gallery enthÀlt zudem integrierte Code-Generierungsfunktionen. Die App AI Edge Eloquent bietet eine Voice Edit-Funktion, mit der Nutzer Text per Sprachbefehl bearbeiten können.

Neue Werkzeuge fĂŒr Entwickler

Zur UnterstĂŒtzung lokaler KI-Workflows launchte Google das LiteRT-LM CLI. Dieses Tool richtet einen OpenAI-kompatiblen lokalen HTTP-Server auf Port 9379 ein. Entwickler können damit eine lokale API fĂŒr Gemma 4 12B nutzen und dynamisch zwischen CPU, GPU und NPU-Ressourcen wĂ€hlen.

Ebenfalls am 4. Juni 2026 erschien eine dedizierte Gemini-App fĂŒr macOS 15 und höher. Sie bietet eine Shortcut-basierte OberflĂ€che mit dem Befehl Option+Leertaste fĂŒr schnellen KI-Zugriff. Die App integriert Bildschirmfreigabe zur Zusammenfassung von Dokumenten und Daten sowie Werkzeuge zur Bild- und Videogenerierung.

Gemini Spark: KI-Assistent fĂŒr Hintergrundaufgaben

Über die lokale AusfĂŒhrung hinaus fĂŒhrte Google am 2. Juni 2026 in den USA Gemini Spark ein. Dieses agentische Tool erledigt Aufgaben im Hintergrund – etwa Buchungsverwaltung oder Datenanalyse aus Gmail und Google Kalender. Gemini Spark basiert auf dem Gemini Flash 3.5-Modell und der Antigravity-Plattform.

Der Dienst ist zunĂ€chst Abonnenten von Google AI Ultra vorbehalten und kostet rund 100 Euro monatlich. Zum Start integriert das Tool Canva, OpenTable und Instacart. KĂŒnftige UnterstĂŒtzung ist fĂŒr Adobe, Uber, Spotify und Booking.com geplant.

Anzeige: Datenschutzbedenken bei Cloud-KI? Mit der lokalen AusfĂŒhrung von Gemini auf dem Mac bleiben Ihre Daten auf dem GerĂ€t. Diese Anleitung zeigt Ihnen, wie Sie die AI Edge Gallery einrichten und mit dem LiteRT-LM CLI eine lokale API bereitstellen. Datenschutz-KI-Guide anfordern

TurboQuant: RevolutionĂ€re Kompression fĂŒr KI-Modelle

Google Research stellte zudem eine neue Quantisierungsmethode namens TurboQuant vor. Diese Technologie ĂŒberwindet Hardware-SpeicherbeschrĂ€nkungen, indem sie große Sprachmodelle nahezu verlustfrei in 4-Bit- und 2-Bit-Formate komprimiert.

Ein 32B-Modell passt damit in weniger als 13 GB Speicher. Auf High-End-Hardware wie dem M3 Max erreicht das System Verarbeitungsgeschwindigkeiten von rund 18 Tokens pro Sekunde. Das beschleunigt den Trend zur lokalen KI-AusfĂŒhrung auf Verbraucherhardware erheblich.

de | wissenschaft | 69480395 |