Gemini 3.5 Flash: Google bringt KI-Bildschirmsteuerung in die API
27.06.2026 - 09:09:33 | boerse-global.de
Die neuen Funktionen erlauben es den Systemen, eigenständig durch Computer-Oberflächen zu navigieren – ein Schritt, der die Art und Weise verändern könnte, wie Unternehmen und Entwickler mit künstlicher Intelligenz arbeiten.
Gemini 3.5 Flash übernimmt die Bildschirmsteuerung
Bereits Ende Juni integrierte Google eine native „Computer-Use"-Funktion in sein Modell Gemini 3.5 Flash. Das System kann nun Bildschirminhalte erfassen, klicken, tippen und scrollen – und das über Web-, Mobil- und Desktop-Umgebungen hinweg. Im OSWorld-Benchmark, der die Navigationsfähigkeiten von KI-Systemen misst, erreichte das Modell einen Wert von 78,4 Punkten.
Die Sicherheitsbedenken, die autonome Bildschirmsteuerung naturgemäß aufwirft, adressiert Google mit mehreren Schutzmechanismen. Dazu gehören gegnerisches Training, die zwingende Bestätigung von Aktionen durch Menschen sowie automatisierte Erkennungssysteme, die eingreifen, wenn eine indirekte Prompt-Injektion festgestellt wird. Entwickler können die Funktion über die Gemini API und die Enterprise Agent Platform nutzen.
Neue Interactions API und günstigere Preise
Am 27. Juni gab Google die allgemeine Verfügbarkeit der Interactions API für Gemini-Modelle bekannt. Diese Schnittstelle wird nun zum Standard in Google AI Studio und der Gemini API. Sie bringt Funktionen wie verwaltete Agenten und Hintergrundausführung mit. Hinzu kommen verbesserte Tools, Medien-Generierung und ein vereinfachtes Schema für Entwickler.
Während Google die technischen Möglichkeiten von KI-Systemen massiv ausbaut, stellt die neue EU-KI-Verordnung Unternehmen vor komplexe rechtliche Herausforderungen. Dieser kostenlose Umsetzungsleitfaden bietet Ihnen einen kompakten Überblick über alle Anforderungen, Pflichten und Fristen des EU AI Act. EU AI Act in 5 Schritten verstehen: Fristen, Pflichten und Risikoklassen kompakt erklärt
Parallel dazu senkte Google die Kosten für seinen Flex-Tarif um 50 Prozent. Die Infrastruktur-Updates sind darauf ausgelegt, langlaufende Agenten-Workflows zu unterstützen – etwa für umfangreiche Recherchen oder Prozesse, die eine dauerhafte Ausführung erfordern.
Leichtgewicht für die Praxis: Gemini 3.1 Flash-Lite
Einen Tag später, am 26. Juni, brachte Google Gemini 3.1 Flash-Lite an den Start. Das Modell gilt als das kosteneffizienteste der Gemini-3-Serie und hat bereits erste Partner überzeugt. Der Kundenservice-Plattform Gladly bescherte es Berichten zufolge eine Kostenreduktion von 60 Prozent bei einer Erfolgsquote von 99,6 Prozent. Auch der Softwareentwickler JetBrains und die Finanzplattform AlphaSense setzen auf das leichte Modell.
Im Unternehmensbereich führte Google Cloud zudem ein föderiertes Daten-Repository für Confluence Data Center sowie ein Agent Registry zur Verwaltung von Agenten und Servern ein. Neue Integrationen für Drittanbieter-Plattformen wie Airtable und Freshservice runden das Angebot ab.
Milliarden-Investment in Großbritannien
Während des Google Cloud UK Summit in London bestätigte das Unternehmen, dass Gemini 3.5 Flash noch im Juni in Großbritannien verfügbar sein wird. Gemini 3.5 Pro und Gemini Omni sollen im Laufe des Jahres 2026 folgen. Google kündigte zudem ein Investitionspaket von fünf Milliarden Euro an, das unter anderem ein neues Rechenzentrum in Waltham Cross sowie die Schulung von 100.000 britischen Beamten bis 2030 vorsieht.
Ob automatisierte Agenten oder die private Nutzung von KI-Tools – wer die neuen Technologien effizient einsetzen will, benötigt die richtigen Befehle. Ein neuer Gratis-Report enthüllt die praktischsten Tricks und fertige Beispiel-Prompts, mit denen Sie KI-Assistenten wie ChatGPT sofort für Ihren Alltag nutzen können. Diese einfachen ChatGPT-Befehle kennen die wenigsten – jetzt gratis herunterladen
Bereits jetzt zeigt sich der praktische Nutzen: Ein automatisiertes Extraktionstool, das in Zusammenarbeit mit dem britischen Ministerium für Wohnungsbau, Gemeinden und Kommunalverwaltung entwickelt wurde, wird in englischen Kommunen eingesetzt und spart dort Berichten zufolge 255 Arbeitsstunden pro Standort.
Lernhilfe für Studierende: Study Notebooks
Für Endnutzer hat Google am 25. Juni die Funktion „Study Notebooks" in der Gemini-App freigeschaltet. Das kostenlose Feature erlaubt es Studierenden, Materialien hochzuladen und daraus personalisierte Lektionen und Quizze zu generieren. Das Tool synchronisiert sich mit NotebookLM und enthält – in Partnerschaft mit dem Princeton Review – Lerninhalte für standardisierte Tests wie SAT und GRE. Die Web-Version rollt bereits aus, die Unterstützung für Mobilgeräte und Bildungskonten soll im Laufe des Sommers folgen.
