Article

Gemini Omni und Gemini 3.5 Flash: Googles neue KI-Generation

Auf der Google I/O 2026 präsentierte das Unternehmen zwei bahnbrechende KI-Modelle, die unterschiedliche Schwerpunkte setzen.

Kurzbeschreibung

Google führt mit Gemini Omni und 3.5 Flash zwei neue Modelle ein: eines für kreative Videobearbeitung und eines für agentische Workflows.

Abstract

Gemini Omni ist ein multimodales Modell, das aus beliebigen Eingaben – Bilder, Audio, Video und Text – hochwertige Videos erstellen kann. Besonders beeindruckend ist die Fähigkeit zur konversationellen Videobearbeitung: Charaktere bleiben konsistent, die Physik stimmt, und Szenen erinnern sich an vorherige Anweisungen. Die Demos zeigen Transformationen von Skulpturen aus Seifenblasen und rekursive Videoeffekte.

Gemini 3.5 Flash zielt auf agentische Workflows ab. Das Modell kombiniert Frontier-Level-Intelligenz mit hoher Geschwindigkeit und eignet sich ideal für komplexe, langfristige Aufgaben. In Kombination mit “Antigravity” kann es mehrstufige Workflows automatisieren und kollaborative Subagenten bereitstellen. Weitere Highlights sind interaktive Web-UIs, personalisierte KI-Agenten wie “Gemini Spark” und “Information Agents”, die rund um die Uhr im Hintergrund arbeiten.

Die generative UI in der Suche ermöglicht maßgeschneiderte Dashboards und Mini-Apps für Aufgaben wie Fitness-Tracking oder Eventplanung. Beide Modelle sind bereits für Abonnenten verfügbar und werden schrittweise ausgeweitet – Gemini Omni Flash für Google AI Plus, Pro und Ultra sowie kostenfrei auf YouTube Shorts, Gemini 3.5 Flash über API, Gemini App und AI Mode.

Link zum Original: https://blog.google/innovation-and-ai/technology/ai/