Gestern Abend war es nun soweit, das Sundar Pichai als amtierender CEO die Google I/O Keynote 2024 eröffnet hat. Und wie bereits im Vorfeld schon vermutet, drehte sich dieses Jahr auf der Entwicklerkonferenz fast alles um KI – die künstliche Intelligenz. Fassen wir also einmal zusammen.
Das Gemini-Symbol und eine Nachricht begrüßen die Nutzer beim Wechsel in den neuen Tab. Diese innovative Funktion ermöglicht es, gezielt nach bestimmten Dingen in Fotos zu suchen, wie etwa dem persönlichen Kennzeichen oder Fotos vom Schwimmen lernen des Kindes. Während Suchen und Finden in Produkten nicht neu sind, bringt Geminis KI eine generative Verarbeitung mit sich, die Google Fotos zu mehr als nur einer Anzeige von Bildern mit bestimmten Personen oder Gegenständen befähigt.
Unter den zahlreichen KI-Neuerungen sticht sicherlich „Project Astra“ hervor. In einer beeindruckenden Demo-Video wurde gezeigt, wie vielseitig und reaktionsschnell dieser Dienst ist.
Die Demo präsentierte Astra als eine Art App mit einem Kamerasucher, in dem Nutzer Pfeile zeichnen und dann Fragen zu den markierten Inhalten stellen können. Ebenso faszinierend war die Fähigkeit von Astra, sich auch nach längerer Zeit an Details zu erinnern, wie beispielsweise den Verbleib einer verlorenen Brille neben einem roten Apfel auf einem Tisch.
Besonders beeindruckend war die natürliche Aussprache des Assistenten, die einem echten Gespräch ähnelte und in der Regel in der Muttersprache von Google (US-Englisch) besonders gut ist.
Teile von Project Astra sollen noch in diesem Jahr für alle verfügbar sein, möglicherweise inklusive weiterer spannender Funktionen wie der Klärung, ob die im Video gezeigte Brille eine neue Version der Google Glasses oder ein ganz neues Modell ist.
Während der Google I/O-Konferenz wurde weiterhin bekannt gegeben, dass Google sein leichtgewichtiges Modell Gemini Nano AI in den Chrome-Browser integrieren wird. Dieses Modell, das bereits auf dem Google Pixel 8* verwendet wird, wird speziell für Chrome angepasst. Chrome, in der Version 126 wird Gemini Nano nutzen, um KI-Funktionen wie Textgenerierung direkt auf dem Gerät auszuführen.
Durch diese Integration können Nutzer in Chrome beispielsweise Produktbewertungen, Social-Media-Beiträge und andere Kurztexte direkt erstellen. Diese Funktionalität erinnert ein wenig an Microsoft Copilot, wobei Gemini Nano AI laut Google lokal auf dem Gerät ausgeführt wird.
Zusätzlich wird Google Gemini in den Chrome DevTools verfügbar machen. Diese Tools werden von Entwicklern zum Debuggen und Optimieren ihrer Apps verwendet. Gemini wird dort Erklärungen für Fehlermeldungen liefern und Vorschläge machen, wie Probleme behoben werden können.
Später sollen Nutzer Gemini auch in der App und im Web über Gmail verwenden können, um Fragen zu ihren E-Mails zu stellen oder Antworten basierend auf dem Kontext der E-Mails zu erhalten. Ebenfalls ist eine Integration anderer Google-Anwendungen wie Google Notizen, Drive, Google Kalender, Aufgaben und Notizen geplant.
Die Antwortvorschläge, bekannt als „Contextual Smart Reply“, sollen ähnlich wie das aktuelle Smart-Reply-Feature funktionieren, jedoch detaillierter sein. Weitere Eigenschaften werden über einen neuen Gemini-Button in der Gmail-App zugänglich sein. Fraglich, was davon in der kostenlosen Gmail-App verfügbar sein wird.
Natürlich durfte auf der Google I/O Keynote die KI im Zusammenhang mit Android 15 fehlen. Besonders Android-Nutzer profitieren bereits von zahlreichen KI-Funktionen, darunter das Circle-to-Search-Feature. Google plant, dieses Erlebnis weiter auszubauen, insbesondere für Schüler, die bei ihren Hausaufgaben Unterstützung benötigen.
Circle to Search wird Schritt-für-Schritt-Anleitungen für Physik- und Matheaufgaben bieten, später auch für komplexe Aufgaben mit symbolischen Formeln, Diagrammen und Grafiken.
In Zukunft wird das Gemini-Overlay auch über anderen Apps eingeblendet, um die KI vielseitiger einzusetzen. Beispielsweise könnten generierte Bilder per Drag-and-Drop in E-Mails oder Nachrichten verschoben werden. Mit Gemini Advanced können Nutzer auch Antworten zu Inhalten von PDFs erhalten, ohne lange scrollen zu müssen.
Ein neues Feature, das sich noch in der Testphase befindet, ermöglicht es Gemini Nano, während eines Anrufs in Echtzeit Betrugsversuche zu erkennen und zu warnen. Mal sehen was der deutsche Datenschutz von dieser Idee hält.
Google wird seine Suche mit KI-Technologie aufwerten, ähnlich wie Microsoft Bing. Ein neues Gemini-Modell organisiert Suchergebnisse und bietet Planungs- und Recherchefunktionen, zunächst nur in den USA und auf Englisch im Rahmen der Search Labs.
Die Suche soll neben der Recherche auch Planungen und Brainstormings ermöglichen. Das Gemini-Modell kombiniert mehrstufige Argumentationen und Multimodalität. KI-Übersichten liefern schnellere Antworten und einen Überblick über komplexe Themen.
Beispielsweise ermöglicht die Suche nach einem Yoga-Studio auf dem Arbeitsweg detaillierte Ergebnisse ohne mehrere Suchvorgänge. Planungsfunktionen wie Essenspläne, die nach Tagen aufgeschlüsselt und anpassbar sind, stehen ebenfalls bereit, leider auch vorerst nur für US-Nutzer. Weitere Kategorien sollen folgen.
KI-organisierte Ergebnisseiten mit generierten Überschriften und vielfältigen Perspektiven sind ebenfalls geplant. Auch eine KI-Hilfe bei der Videoaufnahme ist in den USA verfügbar, mit späterer Ausweitung auf andere Regionen.
Samsung hat nun auf seinem Galaxy-Oktober-Event in Südkorea und den USA das Galaxy XR-Headset offiziell…
Anfang der Woche hat Vivo im Heimatland das als preiswert zu bezeichnende iQOO 15 präsentiert.…
Manch einer von Euch wird vermutlich schmunzeln, wenn wir wieder einmal über das Apple iPad…
Neben dem Realme GT 8 Pro, das mit austauschbaren Kamera-Arrays in runder und eckiger Form…
Noch vor dem OnePlus 15 und OnePlus Ace 6 hat nun das Schwester-Unternehmen heute das…
Bislang war der Exynos-Prozessor von Samsung eher ein Chip, welchen die werte Kundschaft gemieden hat.…
Diese Seite verwendet cookies.