KI-Agenten am Desktop: Google, OpenAI und Startups starten Offensive
25.06.2026 - 16:27:15 | boerse-global.de
und 25. Juni neue KI-Agenten für den Desktop vorgestellt, die komplexe Entwicklungsaufgaben direkt auf dem Rechner des Nutzers erledigen. Der Trend geht klar dahin, KI-gesteuerte Arbeitsabläufe tief in lokale Entwicklungsumgebungen zu integrieren.
Google stattet Gemini mit Computersteuerung aus
Google hat seinem Modell Gemini 3.5 Flash eine native Funktion für die Computersteuerung verpasst. Die KI kann nun Bildschirmelemente erkennen, analysieren und darauf zugreifen – egal ob im Web, auf mobilen Geräten oder dem Desktop. Entwickler greifen über die Gemini-API und die Enterprise Agent Platform darauf zu. Im Benchmark-Test OSWorld-Verified erzielte das neue Tool beachtliche 78,4 Punkte.
Für Unternehmen hat Google Sicherheitsvorkehrungen eingebaut: Bei heiklen Aktionen ist eine manuelle Bestätigung nötig, und bei erkannten Prompt-Injection-Angriffen stoppt das System automatisch. Zeitgleich brachte Google den Chrome-Browser in Version 149 heraus, der eine „Vom Bildschirm auswählen“-Funktion für schnelle Eingabeaufforderungen bietet.
Am 25. Juni folgte zudem die Veröffentlichung von Antigravity 2.0, das nun als eigenständige IDE und Chat-Agent daherkommt. Die neue Version bringt dynamische Unter-Agenten für Multitasking, asynchrone Aufgaben und Live-Sprachtranskription mit.
Devin und OpenAI liefern sich Wettstreit um Entwickler
Das Startup Devin hat am 25. Juni eine Desktop-Anwendung gestartet, die sowohl lokale als auch cloudbasierte KI-Coding-Agenten verwaltet. Die App enthält eine integrierte Entwicklungsumgebung, Agenten-Orchestrierung und das hauseigene Modell SWE-1.6. Die Preisgestaltung ist gestaffelt: Neben einer kostenlosen Version gibt es die Stufen Pro für 20 Euro, Teams für 80 Euro und Max für 200 Euro monatlich.
Während Profis neue KI-Agenten für die Softwareentwicklung nutzen, bietet ChatGPT auch für Einsteiger enorme Erleichterungen im täglichen Leben. Wie Sie die KI ohne Vorkenntnisse für Ihre Organisation und Zeitersparnis einsetzen, zeigt dieser kostenlose Ratgeber. ChatGPT als Alltagshelfer: Gratis-Report mit fertigen Prompts sichern
Parallel dazu hat OpenAI Codex vorgestellt – einen cloudbasierten Coding-Agenten auf Basis des speziell angepassten codex-1-Modells. Codex nutzt Bestärkungslernen an Programmieraufgaben und automatische Tests, um Code so lange zu verbessern, bis er alle Anforderungen erfüllt. Das Tool richtet sich an Entwicklungsteams, die KI-Fähigkeiten nutzen wollen, ohne eigene Infrastruktur aufbauen zu müssen.
Nischenlösungen für spezielle Anforderungen
Mehrere kleinere Anbieter haben spezialisierte Desktop-Tools auf den Markt gebracht:
Mindstone Rebel startete am 25. Juni als „local-first“ KI-Agenten-Betriebssystem. Es setzt auf Markdown-basierten Speicher und die Orchestrierung mehrerer Modelle. Das Projekt, das kürzlich fünf Millionen Euro Finanzierung einsammelte, läuft auf macOS und Windows. Unter einer Fair-Source-Lizenz bleibt es für bis zu 100 Nutzer kostenlos.
Die rasante Entwicklung von KI-Tools wie den neuen Desktop-Agenten erfordert auch ein Bewusstsein für die rechtlichen Rahmenbedingungen in Unternehmen. Dieser kompakte Leitfaden erklärt Ihnen die wichtigsten Pflichten der EU-KI-Verordnung, damit Sie technologische Innovationen rechtssicher nutzen können. Kostenloses E-Book zum EU AI Act herunterladen
Traycer ist ein Open-Source-Orchestrierungs-Workspace, der am 24. Juni unter der Apache-2.0-Lizenz erschien. Das Tool unterstützt verschiedene Modelle wie Claude, Codex und Cursor und konzentriert sich auf die Kommunikation zwischen Agenten sowie die Verwaltung von Arbeitsbäumen und Artefakten.
Nuanced kam ebenfalls am 24. Juni auf den Markt – exklusiv für macOS. Die Anwendung setzt auf „progressive Disambiguierung“: Nutzer müssen ihre Vorgaben schrittweise präzisieren, bevor ein KI-Agent Code ausführt. Das soll Fehler in der automatisierten Entwicklung reduzieren.
Bereits auf der Google I/O 2026 hatte der Konzern durchblicken lassen, dass seine AI Studio nun aus einfachen Eingabeaufforderungen Android-App-Prototypen generieren kann. Die neue Android CLI 1.0 öffnet zudem die Plattform-Werkzeugkette für KI-Agenten von Drittanbietern.
