Google Gemini-Update mit Podcast-Funktion auf Deutsch!
Google hat eine Vorschauversion seiner KI-Bildgenerierung mit Gemini 2.0 Flash veröffentlicht. Laut dem Unternehmen bietet die neue Version nicht nur deutlich verbesserte Bildqualität, sondern auch höhere Nutzungslimits. Besonders hervorgehoben wird die optimierte Darstellung von Text in generierten Bildern – ein Bereich, der bislang bei vielen KI-Bildgeneratoren Schwächen zeigte. Weiterhin gibt es mit Google Gemini-Update nun die Audio-Zusammenfassungen in 45 weiteren Sprachen. Darunter auch Deutsch!
Google Gemini-Update bei der Bildgenerierung!
Die Integration der neuen Bildgenerierungsfunktion erfolgt über die Gemini API, die sowohl in Google AI Studio als auch in Vertex AI zur Verfügung steht. Entwickler können dabei das Modell mit dem Namen „gemini-2.0-flash-preview-image-generation“ nutzen. Dadurch ist es möglich, direkt mit der Einbindung der KI-gestützten Bildgenerierung in eigene Anwendungen und Projekte zu beginnen, ohne auf zusätzliche Tools oder Schnittstellen zurückgreifen zu müssen.
Die neue Funktionalität eröffnet eine Vielzahl spannender Anwendungsfälle. So lassen sich Produkte virtuell in verschiedene Umgebungen platzieren, was etwa im Marketing oder bei Produktpräsentationen nützlich ist. Darüber hinaus erlaubt das System eine kollaborative Bearbeitung von Bildern in Echtzeit – ideal für kreative Teams. Besonders praktisch ist auch die gezielte Bearbeitung einzelner Bildbereiche, ohne dass der Rest des Bildes verändert wird. Diese präzise Steuerung dürfte vor allem im E-Commerce-Bereich von großem Interesse sein, etwa um automatisch neue Produktvarianten zu visualisieren und mit passenden Beschriftungen zu versehen.
Aktuell befindet sich die neue Bildgenerierungsfunktion noch in einer Vorschauphase. Google hat jedoch bereits weitere Verbesserungen in Aussicht gestellt – darunter eine nochmals gesteigerte Bildqualität, zusätzliche Funktionen und erweiterte Nutzungslimits. Bereits jetzt zeigen erste Ergebnisse laut Google deutliche Fortschritte im Vergleich zur bisherigen experimentellen Version.
Gemini-App jetzt mit deutscher Podcast-Funktion!
Nicht nur die API-Nutzer profitieren von dem Fortschritt. Auch die reguläre Google Gemini App erhält durch das Update neue Funktionen – allen voran die erweiterte Podcast-Funktion. Ursprünglich hatte Google das Feature der KI-basierten Audio-Zusammenfassungen für die Plattform NotebookLM entwickelt. Im März 2025 wurde es erstmals auch in die Gemini-App integriert – allerdings zunächst nur in einer Sprache (englisch) verfügbar gemacht.
Nun hat Google bekanntgegeben, dass dieses Feature ab sofort in insgesamt 46 Sprachen, darunter auch Deutsch, verfügbar ist. Die Unterstützung für diese zusätzlichen Sprachen war ursprünglich ausschließlich für NotebookLM angekündigt worden, wird nun aber auch auf die Gemini-App ausgeweitet. Die Verteilung des Updates hat laut Google dieses Wochenende begonnen und soll innerhalb der nächsten zwei Wochen vollständig abgeschlossen sein. Damit steht die neue Funktion bald allen Nutzern weltweit zur Verfügung.
Die Audio-Zusammenfassungen ermöglichen es, KI-Antworten in Form eines Podcasts vorzulesen. Besonders bei umfangreichen Inhalten – etwa im Rahmen von Recherchen mit Deep Research – ist diese Funktion äußerst hilfreich. Der Clou: Die generierten Audios klingen erstaunlich natürlich und erinnern stark an echte Dialoge zwischen zwei Personen. Das macht die Nutzung nicht nur informativ, sondern auch unterhaltsam.
Google Pixel 8a im Hands-On: Dieses Smartphone sollte jeder haben!