Google präsentiert aktuell seine neueste künstliche Intelligenz (KI) mit Gemini 2.5. Mit dem nun präsentiertem „Computer Use Model“. Damit zeigt das Unternehmen erstmals ein System, das Apps und Webseiten selbstständig steuern kann. Das sind so die Augenblicke, wo sich mir Blockbuster wie „Terminator“ oder „Matrix“ ins Hirn brennen. Habe nur ich bei dieser Entwicklung leichte Panikschübe?
Google Gemini 2.5 ist offiziell!
Google erweitert die Fähigkeiten seiner KI Gemini und möchte sie stärker auf Automatisierung ausrichten. Mit dem neuen Gemini 2.5 „Computer Use Model“ kann die KI erstmals selbstständig Web- und Mobilanwendungen bedienen. Laut Google geschieht das mit hoher Genauigkeit und sehr kurzer Reaktionszeit. Statt wie herkömmliche Automatisierungen auf APIs zuzugreifen, interagiert Gemini direkt mit echten Benutzeroberflächen. Sie kann klicken, scrollen, Texte eingeben oder Objekte per Drag & Drop verschieben.
Entwickler können die neue Funktion über den speziellen Modus in der Gemini-API einbinden. Dafür stehen ein Screenshot-Loop und eine Action-History zur Verfügung, mit denen die KI ihre Schritte dokumentiert. Damit lassen sich viele Aufgaben automatisieren, etwa Formulare ausfüllen, Websites durchsuchen, Inhalte sortieren oder wiederkehrende Workflows übernehmen. Laut Google bleibt die Sicherheit dabei zentral. Jede Aktion wird geprüft, und sensible Vorgänge erfordern eine ausdrückliche Zustimmung des Nutzers.
Bereits erste Beta-Tester nutzen das Gemini 2.5 „Computer Use Model“ für automatisierte UI-Tests, persönliche Assistenten und komplexe Prozessabläufe. Die Vorschauversion steht ab sofort im Google AI Studio und in Vertex AI bereit und soll Entwicklern zeigen, wie leistungsfähig die neue Automatisierungsstufe von Gemini werden kann.
CMF Headphone Pro im ersten Hands-on: Läuft und läuft und läuft!




















Leave a Reply