Veo 3 ist jetzt in der Gemini API verfügbar. Weitere Informationen

Diese Seite wurde von der Cloud Translation API übersetzt.

Gemini-Modelle

2.5 Pro

Unser leistungsstärkstes Denkmodell mit höchstmöglicher Antwortgenauigkeit und modernster Leistung

Audio, Bilder, Videos und Text eingeben und Textantworten erhalten
Schwierige Probleme lösen, große Datenbanken analysieren und mehr
Optimal für komplexes Programmieren, Schlussfolgern und multimodales Verstehen

2.5 Flash

Unser bestes Modell in Bezug auf das Preis-Leistungs-Verhältnis mit umfassenden Funktionen.

Audio, Bilder, Videos und Text eingeben und Textantworten erhalten
Das Modell denkt nach Bedarf oder Sie können ein Budget für Denkprozesse konfigurieren.
Am besten für Aufgaben mit niedriger Latenz und hohem Volumen, die Nachdenken erfordern

2.5 Flash-Lite

Ein für Kosteneffizienz und niedrige Latenz optimiertes Gemini 2.5 Flash-Modell.

Audio, Bilder, Videos und Text eingeben und Textantworten erhalten
Kostengünstigstes Modell mit Unterstützung für hohen Durchsatz
Am besten für Echtzeit-Anwendungsfälle mit niedriger Latenz geeignet

Modellvarianten

Die Gemini API bietet verschiedene Modelle für unterschiedliche Anwendungsfälle. Hier finden Sie einen kurzen Überblick über die verfügbaren Gemini-Varianten:

Modellvariante	Eingabe(n)	Ausgabe	Optimiert für
Gemini 2.5 Pro `gemini-2.5-pro`	Audio, Bilder, Videos, Text und PDF	Text	Verbessertes Denken und Schlussfolgern, multimodales Verstehen, komplexes Programmieren und mehr
Gemini 2.5 Flash `gemini-2.5-flash`	Audio, Bilder, Videos und Text	Text	Anpassungsfähigkeit, Kosteneffizienz
Gemini 2.5 Flash-Lite (Vorschau) `gemini-2.5-flash-lite-preview-06-17`	Text, Bild, Video, Audio	Text	Kostengünstigstes Modell mit Unterstützung für hohen Durchsatz
Gemini 2.5 Flash Native Audio `gemini-2.5-flash-preview-native-audio-dialog` & `gemini-2.5-flash-exp-native-audio-thinking-dialog`	Audio, Videos und Text	Text und Audio, verschachtelt	Hochwertige, natürlich klingende Audioausgabe von Gesprächen, mit oder ohne Denkprozess
Gemini 2.5 Flash Preview TTS `gemini-2.5-flash-preview-tts`	Text	Audio	Sprachausgabe mit niedriger Latenz, die sich steuern lässt und für einen oder mehrere Sprecher geeignet ist
Gemini 2.5 Pro Preview – TTS `gemini-2.5-pro-preview-tts`	Text	Audio	Sprachausgabe mit niedriger Latenz, die sich steuern lässt und für einen oder mehrere Sprecher geeignet ist
Gemini 2.0 Flash `gemini-2.0-flash`	Audio, Bilder, Videos und Text	Text	Funktionen der nächsten Generation, Geschwindigkeit und Echtzeit-Streaming.
Gemini 2.0 Flash – Vorschau auf die Bildgenerierung `gemini-2.0-flash-preview-image-generation`	Audio, Bilder, Videos und Text	Text, Bilder	Bilder in natürlicher Sprache generieren und bearbeiten
Gemini 2.0 Flash-Lite `gemini-2.0-flash-lite`	Audio, Bilder, Videos und Text	Text	Kosteneffizienz und geringe Latenz
Gemini 1.5 Flash `gemini-1.5-flash`	Audio, Bilder, Videos und Text	Text	Schnelle und vielseitige Leistung bei einer Vielzahl von Aufgaben Eingestellt
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Audio, Bilder, Videos und Text	Text	Aufgaben mit hohem Volumen und geringerem Intelligenzgrad Eingestellt
Gemini 1.5 Pro `gemini-1.5-pro`	Audio, Bilder, Videos und Text	Text	Komplexe Aufgaben, die mehr Intelligenz erfordern Eingestellt
Gemini Embedding `gemini-embedding-001`	Text	Texteinbettungen	Verwandtschaft von Textstrings messen
Imagen 4 `imagen-4.0-generate-preview-06-06` `imagen-4.0-ultra-generate-preview-06-06`	Text	Bilder	Unser aktuellstes Modell zur Bildgenerierung
Bild 3 `imagen-3.0-generate-002`	Text	Bilder	Hochwertiges Modell zur Bildgenerierung
Veo 3 – Vorabversion `veo-3.0-generate-preview`	Text	Video mit Audio	Hochwertige Videogenerierung mit Soundeffekten, Umgebungsgeräuschen und Dialogen
Veo 2 `veo-2.0-generate-001`	Text, Bilder	Video	Videogenerierung in hoher Qualität
Gemini 2.5 Flash Live `gemini-live-2.5-flash-preview`	Audio, Video und Text	Text, Audio	Bidirektionale Sprach- und Videointeraktionen mit geringer Latenz
Gemini 2.0 Flash Live `gemini-2.0-flash-live-001`	Audio, Video und Text	Text, Audio	Bidirektionale Sprach- und Videointeraktionen mit geringer Latenz

Die Ratenlimits für die einzelnen Modelle finden Sie auf der Seite mit den Ratenlimits.

Gemini 2.5 Pro

Gemini 2.5 Pro ist unser innovativstes Thinking Model, das in der Lage ist, komplexe Probleme in den Bereichen Programmieren, Mathematik und Naturwissenschaften, Technik und Mathematik (STEM) zu lösen und große Datensätze, Codebasen und Dokumente mithilfe von Langkontext zu analysieren.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`gemini-2.5-pro`
Unterstützte Datentypen	Eingaben Audio, Bilder, Video, Text und PDF Ausgabe Text
Token-Limits^[*]	Eingabetokenlimit 1.048.576 Tokenausgabelimit 65.536
-Funktionen	Strukturierte Ausgaben Unterstützt Caching Unterstützt Tuning Nicht unterstützt Funktionsaufrufe Unterstützt Codeausführung Unterstützt Nach Fundierung suchen Unterstützt Bildgenerierung Nicht unterstützt Audioerstellung Nicht unterstützt Live API Nicht unterstützt Denken Unterstützt Batch API Unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. `Stable: gemini-2.5-pro` `Preview: gemini-2.5-pro-preview-06-05` `Preview: gemini-2.5-pro-preview-05-06` `Preview: gemini-2.5-pro-preview-03-25`
Letzte Aktualisierung	Juni 2025
Wissensstichtag	Januar 2025

Gemini 2.5 Flash

Unser bestes Modell in Bezug auf das Preis-Leistungs-Verhältnis mit umfassenden Funktionen. 2.5 Flash eignet sich am besten für die Verarbeitung im großen Maßstab, Aufgaben mit niedriger Latenz und hohem Volumen, die Denkprozesse erfordern, sowie für agentische Anwendungsfälle.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-2.5-flash`
Unterstützte Datentypen	Eingaben Text, Bilder, Video, Audio Ausgabe Text
Token-Limits^[*]	Eingabetokenlimit 1.048.576 Tokenausgabelimit 65.536
-Funktionen	Audioerstellung Nicht unterstützt Caching Unterstützt Codeausführung Unterstützt Funktionsaufrufe Unterstützt Bildgenerierung Nicht unterstützt Nach Fundierung suchen Unterstützt Strukturierte Ausgaben Unterstützt Denken Unterstützt Tuning Nicht unterstützt Batch API Unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Stabil: `gemini-2.5-flash` Vorschau für: `gemini-2.5-flash-preview-05-20`
Letzte Aktualisierung	Juni 2025
Wissensstichtag	Januar 2025

Gemini 2.5 Flash-Lite (Vorabversion)

Ein für Kosteneffizienz und niedrige Latenz optimiertes Gemini 2.5 Flash-Modell.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-2.5-flash-lite-preview-06-17`
Unterstützte Datentypen	Eingaben Text, Bilder, Videos und Audio Ausgabe Text
Token-Limits^[*]	Eingabetokenlimit 1.000.000 Tokenausgabelimit 64.000
-Funktionen	Strukturierte Ausgaben Unterstützt Caching Unterstützt Tuning Nicht unterstützt Funktionsaufrufe Unterstützt Codeausführung Unterstützt URL-Kontext Unterstützt Nach Fundierung suchen Unterstützt Bildgenerierung Nicht unterstützt Audioerstellung Nicht unterstützt Live API Nicht unterstützt Denken Unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Vorschau für: `gemini-2.5-flash-lite-preview-06-17`
Letzte Aktualisierung	Juni 2025
Wissensstichtag	Januar 2025

Gemini 2.5 Flash – native Audiofunktionen

Unsere nativen Audio-Dialogmodelle mit und ohne Denkprozess sind über die Live API verfügbar. Diese Modelle bieten interaktive und unstrukturierte Unterhaltungen mit Stil- und Kontroll-Prompts.

Native Audio in Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-2.5-flash-preview-native-audio-dialog` & `models/gemini-2.5-flash-exp-native-audio-thinking-dialog`
Unterstützte Datentypen	Eingaben Audio, Video, Text Ausgabe Audio und Text
Token-Limits^[*]	Eingabetokenlimit 128.000 Tokenausgabelimit 8.000
-Funktionen	Audioerstellung Unterstützt Caching Nicht unterstützt Codeausführung Nicht unterstützt Funktionsaufrufe Unterstützt Bildgenerierung Nicht unterstützt Nach Fundierung suchen Unterstützt Strukturierte Ausgaben Nicht unterstützt Denken Unterstützt Tuning Nicht unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Vorschau für: `gemini-2.5-flash-preview-05-20` Test: `gemini-2.5-flash-exp-native-audio-thinking-dialog`
Letzte Aktualisierung	Mai 2025
Wissensstichtag	Januar 2025

Gemini 2.5 Flash-Vorschau – Text-zu-Sprache

Gemini 2.5 Flash Preview TTS ist unser preisgünstiges Text-zu-Sprache-Modell, das eine hohe Kontrolle und Transparenz für strukturierte Workflows wie die Erstellung von Podcasts, Hörbüchern und Kundensupport bietet. Die Ratenbegrenzungen für Gemini 2.5 Flash sind strenger, da es sich um ein experimentelles Modell / ein Modell in der Vorabversion handelt.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-2.5-flash-preview-tts`
Unterstützte Datentypen	Eingaben Text Ausgabe Audio
Token-Limits^[*]	Eingabetokenlimit 8.000 Tokenausgabelimit 16.000
-Funktionen	Strukturierte Ausgaben Nicht unterstützt Caching Nicht unterstützt Tuning Nicht unterstützt Funktionsaufrufe Nicht unterstützt Codeausführung Nicht unterstützt Suche Nicht unterstützt Audioerstellung Unterstützt Live API Nicht unterstützt Denken Nicht unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. `gemini-2.5-flash-preview-tts`
Letzte Aktualisierung	Mai 2025

Gemini 2.5 Pro-Vorschau: Text-zu-Sprache

Gemini 2.5 Pro Preview TTS ist unser leistungsstärkstes Modell für die Sprachsynthese. Es bietet hohe Kontrolle und Transparenz für strukturierte Workflows wie die Erstellung von Podcasts, Hörbüchern und Kundensupport. Die Ratenbegrenzungen für Gemini 2.5 Pro sind strenger, da es sich um ein experimentelles Modell bzw. ein Modell in der Vorabversion handelt.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-2.5-pro-preview-tts`
Unterstützte Datentypen	Eingaben Text Ausgabe Audio
Token-Limits^[*]	Eingabetokenlimit 8.000 Tokenausgabelimit 16.000
-Funktionen	Strukturierte Ausgaben Nicht unterstützt Caching Nicht unterstützt Tuning Nicht unterstützt Funktionsaufrufe Nicht unterstützt Codeausführung Nicht unterstützt Suche Nicht unterstützt Audioerstellung Unterstützt Live API Nicht unterstützt Denken Nicht unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. `gemini-2.5-pro-preview-tts`
Letzte Aktualisierung	Mai 2025

Gemini 2.0 Flash

Gemini 2.0 Flash bietet Funktionen der nächsten Generation und verbesserte Möglichkeiten, darunter eine höhere Geschwindigkeit, die Nutzung nativer Tools und ein Kontextfenster von 1 Million Tokens.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-2.0-flash`
Unterstützte Datentypen	Eingaben Audio, Bilder, Videos und Text Ausgabe Text
Token-Limits^[*]	Eingabetokenlimit 1.048.576 Tokenausgabelimit 8.192
-Funktionen	Strukturierte Ausgaben Unterstützt Caching Unterstützt Tuning Nicht unterstützt Funktionsaufrufe Unterstützt Codeausführung Unterstützt Suche Unterstützt Bildgenerierung Nicht unterstützt Audioerstellung Nicht unterstützt Live API Unterstützt Denken Experimentell Batch API Unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Neueste: `gemini-2.0-flash` Stabil: `gemini-2.0-flash-001` Test: `gemini-2.0-flash-exp`
Letzte Aktualisierung	Februar 2025
Wissensstichtag	August 2024

Gemini 2.0 Flash – Vorschau auf die Bildgenerierung

Die Vorschaufunktion für die Bildgenerierung mit Gemini 2.0 Flash bietet verbesserte Funktionen für die Bildgenerierung, einschließlich der Möglichkeit, Bilder im Dialog zu generieren und zu bearbeiten.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-2.0-flash-preview-image-generation`
Unterstützte Datentypen	Eingaben Audio, Bilder, Videos und Text Ausgabe Text und Bilder
Token-Limits^[*]	Eingabetokenlimit 32.000 Tokenausgabelimit 8.192
-Funktionen	Strukturierte Ausgaben Unterstützt Caching Unterstützt Tuning Nicht unterstützt Funktionsaufrufe Nicht unterstützt Codeausführung Nicht unterstützt Suche Nicht unterstützt Bildgenerierung Unterstützt Audioerstellung Nicht unterstützt Live API Nicht unterstützt Denken Nicht unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Vorschau für: `gemini-2.0-flash-preview-image-generation` Die Bildgenerierung mit gemini-2.0-flash-preview wird derzeit in einigen Ländern in Europa, im Nahen Osten und in Afrika nicht unterstützt.
Letzte Aktualisierung	Mai 2025
Wissensstichtag	August 2024

Gemini 2.0 Flash-Lite

Ein für Kosteneffizienz und niedrige Latenz optimiertes Gemini 2.0 Flash-Modell.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-2.0-flash-lite`
Unterstützte Datentypen	Eingaben Audio, Bilder, Videos und Text Ausgabe Text
Token-Limits^[*]	Eingabetokenlimit 1.048.576 Tokenausgabelimit 8.192
-Funktionen	Strukturierte Ausgaben Unterstützt Caching Unterstützt Tuning Nicht unterstützt Funktionsaufrufe Unterstützt Codeausführung Nicht unterstützt Suche Nicht unterstützt Bildgenerierung Nicht unterstützt Audioerstellung Nicht unterstützt Live API Nicht unterstützt Batch API Unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Neueste: `gemini-2.0-flash-lite` Stabil: `gemini-2.0-flash-lite-001`
Letzte Aktualisierung	Februar 2025
Wissensstichtag	August 2024

Gemini 1.5 Flash

Gemini 1.5 Flash ist ein schnelles und vielseitiges multimodales Modell, das sich für die Skalierung für verschiedene Aufgaben eignet.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-1.5-flash`
Unterstützte Datentypen	Eingaben Audio, Bilder, Videos und Text Ausgabe Text
Token-Limits^[*]	Eingabetokenlimit 1.048.576 Tokenausgabelimit 8.192
Audio-/visuelle Spezifikationen	Maximale Anzahl von Bildern pro Prompt 3.600 Maximale Videolänge 1 Stunde Maximale Audiolänge Etwa 9,5 Stunden
-Funktionen	Systemanweisungen Unterstützt JSON-Modus Unterstützt JSON-Schema Unterstützt Anpassbare Sicherheitseinstellungen Unterstützt Caching Unterstützt Tuning Unterstützt Funktionsaufrufe Unterstützt Codeausführung Unterstützt Live API Nicht unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Neueste: `gemini-1.5-flash-latest` Letzte stabile Version: `gemini-1.5-flash` Stabil: `gemini-1.5-flash-001` `gemini-1.5-flash-002`
Einstellungsdatum	September 2025
Letzte Aktualisierung	September 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash‑8B ist ein kleines Modell, das für Aufgaben mit geringerem Intelligenzbedarf entwickelt wurde.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-1.5-flash-8b`
Unterstützte Datentypen	Eingaben Audio, Bilder, Videos und Text Ausgabe Text
Token-Limits^[*]	Eingabetokenlimit 1.048.576 Tokenausgabelimit 8.192
Audio-/visuelle Spezifikationen	Maximale Anzahl von Bildern pro Prompt 3.600 Maximale Videolänge 1 Stunde Maximale Audiolänge Etwa 9,5 Stunden
-Funktionen	Systemanweisungen Unterstützt JSON-Modus Unterstützt JSON-Schema Unterstützt Anpassbare Sicherheitseinstellungen Unterstützt Caching Unterstützt Tuning Unterstützt Funktionsaufrufe Unterstützt Codeausführung Unterstützt Live API Nicht unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Neueste: `gemini-1.5-flash-8b-latest` Letzte stabile Version: `gemini-1.5-flash-8b` Stabil: `gemini-1.5-flash-8b-001`
Einstellungsdatum	September 2025
Letzte Aktualisierung	Oktober 2024

Gemini 1.5 Pro,

Testen Sie Gemini 2.5 Pro Preview, unser bisher fortschrittlichstes Gemini-Modell.

Gemini 1.5 Pro ist ein mittelgroßes multimodales Modell, das für eine Vielzahl von Aufgaben optimiert ist, die logisches Denken erfordern. Gemini 1.5 Pro kann große Datenmengen gleichzeitig verarbeiten, darunter 2 Stunden Video, 19 Stunden Audio, Codebasen mit 60.000 Zeilen Code oder 2.000 Seiten Text.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-1.5-pro`
Unterstützte Datentypen	Eingaben Audio, Bilder, Videos und Text Ausgabe Text
Token-Limits^[*]	Eingabetokenlimit 2.097.152 Tokenausgabelimit 8.192
Audio-/visuelle Spezifikationen	Maximale Anzahl von Bildern pro Prompt 7.200 Maximale Videolänge 2 Stunden Maximale Audiolänge Etwa 19 Stunden
-Funktionen	Systemanweisungen Unterstützt JSON-Modus Unterstützt JSON-Schema Unterstützt Anpassbare Sicherheitseinstellungen Unterstützt Caching Unterstützt Tuning Nicht unterstützt Funktionsaufrufe Unterstützt Codeausführung Unterstützt Live API Nicht unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Neueste: `gemini-1.5-pro-latest` Letzte stabile Version: `gemini-1.5-pro` Stabil: `gemini-1.5-pro-001` `gemini-1.5-pro-002`
Einstellungsdatum	September 2025
Letzte Aktualisierung	September 2024

Imagen 4

Imagen 4 ist unser neuestes Bildmodell. Es kann sehr detaillierte Bilder mit guter Beleuchtung, deutlich besserem Textrendering und einer höheren Ausgaberesolution als frühere Modelle generieren.

Modelldetails

Attribut	Beschreibung
Modellcode	Gemini API `imagen-4.0-generate-preview-06-06` `imagen-4.0-ultra-generate-preview-06-06`
Unterstützte Datentypen	Eingabe Text Ausgabe Bilder
Token-Limits^[*]	Eingabetokenlimit 480 Tokens (Text) Ausgabe von Bildern 1 (Ultra) 1 bis 4 (Standard)
Letzte Aktualisierung	Juni 2025

Imagen 3

Imagen 3 ist unser bisher bestes Text‑zu‑Bild-Modell. Es kann Bilder mit noch mehr Details, besserer Belichtung und weniger störenden Artefakten als unsere bisherigen Modelle generieren.

Modelldetails

Attribut	Beschreibung
Modellcode	Gemini API `imagen-3.0-generate-002`
Unterstützte Datentypen	Eingabe Text Ausgabe Bilder
Token-Limits^[*]	Eingabetokenlimit – Ausgabe von Bildern Bis zu 4
Letzte Aktualisierung	Februar 2025

Veo 3 (Vorabversion)

Die Veo 3-Vorabversion ist unser neuestes Text-zu-Video-Modell, mit dem detaillierte Videos mit integriertem Audio, verbesserter Einhaltung der Vorgaben des Prompts und direkten Kamerasteuerelementen generiert werden können.

Veo 3 ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	Gemini API `veo-3.0-generate-preview`
Unterstützte Datentypen	Eingabe Text Ausgabe Video mit Audio
-Limits	Texteingabe 1.024 Tokens Ausgabe-Video 1
Letzte Aktualisierung	Juli 2025

Veo 2

Veo 2 ist unser hochwertiges Text- und Bild-zu-Video-Modell, mit dem sich detaillierte Videos erstellen lassen, die die künstlerischen Nuancen in Ihren Prompts erfassen.

Modelldetails

Attribut	Beschreibung
Modellcode	Gemini API `veo-2.0-generate-001`
Unterstützte Datentypen	Eingabe Text, Bild Ausgabe Video
-Limits	Texteingabe – Bildeingabe Beliebige Bildauflösung und beliebiges Seitenverhältnis bis zu einer Dateigröße von 20 MB Ausgabe-Video Bis zu 2
Letzte Aktualisierung	April 2025

Gemini 2.5 Flash Live

Das Modell Gemini 2.5 Flash Live funktioniert mit der Live API und ermöglicht bidirektionale Sprach- und Videointeraktionen mit Gemini mit geringer Latenz. Das Modell kann Text-, Audio- und Videoeingaben verarbeiten und Text- und Audioausgaben generieren.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-live-2.5-flash-preview`
Unterstützte Datentypen	Eingaben Audio, Video und Text Ausgabe Text und Audio
Token-Limits^[*]	Eingabetokenlimit 1.048.576 Tokenausgabelimit 8.192
-Funktionen	Strukturierte Ausgaben Unterstützt Tuning Nicht unterstützt Funktionsaufrufe Unterstützt Codeausführung Unterstützt Suche Unterstützt Bildgenerierung Nicht unterstützt Audioerstellung Unterstützt Denken Nicht unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Vorschau für: `gemini-live-2.5-flash-preview`
Letzte Aktualisierung	Juni 2025
Wissensstichtag	Januar 2025

Gemini 2.0 Flash Live

Das Modell Gemini 2.0 Flash Live funktioniert mit der Live API und ermöglicht bidirektionale Sprach- und Videointeraktionen mit Gemini mit geringer Latenz. Das Modell kann Text-, Audio- und Videoeingaben verarbeiten und Text- und Audioausgaben generieren.

In Google AI Studio ausprobieren

Modelldetails

Attribut	Beschreibung
Modellcode	`models/gemini-2.0-flash-live-001`
Unterstützte Datentypen	Eingaben Audio, Video und Text Ausgabe Text und Audio
Token-Limits^[*]	Eingabetokenlimit 1.048.576 Tokenausgabelimit 8.192
-Funktionen	Strukturierte Ausgaben Unterstützt Tuning Nicht unterstützt Funktionsaufrufe Unterstützt Codeausführung Unterstützt Suche Unterstützt Bildgenerierung Nicht unterstützt Audioerstellung Unterstützt Denken Nicht unterstützt
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Vorschau für: `gemini-2.0-flash-live-001`
Letzte Aktualisierung	April 2025
Wissensstichtag	August 2024

Gemini Embedding

Das Gemini Embedding-Modell bietet SOTA-Leistung in vielen wichtigen Dimensionen, darunter Code, Mehrsprachigkeit und Abruf.

Modelldetails

Attribut	Beschreibung
Modellcode	Gemini API `gemini-embedding-001`
Unterstützte Datentypen	Eingabe Text Ausgabe Texteinbettungen
Token-Limits^[*]	Eingabetokenlimit 2.048 Größe der Ausgabedimension Flexibel, unterstützt: 128–3072, empfohlen: 768, 1536, 3072
-Versionen	Weitere Informationen finden Sie unter Muster für Modellversionen. Stabil: `gemini-embedding-001` Vorschau für: `gemini-embedding-exp-03-07`
Letzte Aktualisierung	Juni 2025

Legacy-Einbettungsmodelle

Texteinbettung (alt)

Texteinbettungen werden verwendet, um die Ähnlichkeit von Strings zu messen. Sie werden in vielen KI-Anwendungen eingesetzt.

Modelldetails

Attribut	Beschreibung
Modellcode	Gemini API `models/text-embedding-004`
Unterstützte Datentypen	Eingabe Text Ausgabe Texteinbettungen
Token-Limits^[*]	Eingabetokenlimit 2.048 Größe der Ausgabedimension 768
Ratenbeschränkungen^[**]	1.500 Anfragen pro Minute
anpassbare Sicherheitseinstellungen	Nicht unterstützt
Einstellungsdatum	Januar 2026
Letzte Aktualisierung	April 2024

AQA

Sie können das AQA-Modell verwenden, um Attributed Question-Answering-Aufgaben (AQA) für ein Dokument, einen Korpus oder eine Reihe von Passagen auszuführen. Das AQA-Modell gibt Antworten auf Fragen zurück, die auf bereitgestellten Quellen basieren, und schätzt die Wahrscheinlichkeit, dass die Frage beantwortet werden kann.

Modelldetails

Attribut	Beschreibung
Modellcode	`models/aqa`
Unterstützte Datentypen	Eingabe Text Ausgabe Text
Unterstützte Sprache	Englisch
Token-Limits^[*]	Eingabetokenlimit 7.168 Tokenausgabelimit 1.024
Ratenbeschränkungen^[**]	1.500 Anfragen pro Minute
anpassbare Sicherheitseinstellungen	Unterstützt
Letzte Aktualisierung	Dezember 2023

Hier finden Sie Beispiele, um die Funktionen dieser Modellvarianten kennenzulernen.

[*] Ein Token entspricht bei Gemini-Modellen etwa vier Zeichen. 100 Tokens entsprechen etwa 60–80 Wörtern.

Namensmuster für Modellversionen

Gemini-Modelle sind in stabilen, Vorschau- oder experimentellen Versionen verfügbar. In Ihrem Code können Sie eines der folgenden Modellnamensformate verwenden, um anzugeben, welches Modell und welche Version Sie verwenden möchten.

Neueste stabile Version

Verweist auf die neueste stabile Version, die für die angegebene Modellgeneration und ‑variante veröffentlicht wurde.

Wenn Sie die aktuelle stabile Version angeben möchten, verwenden Sie das folgende Muster: <model>-<generation>-<variation>. Beispiel: gemini-2.0-flash.

Stabil

Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich in der Regel nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.

Verwenden Sie das folgende Muster, um eine stabile Version anzugeben: <model>-<generation>-<variation>-<version>. Beispiel: gemini-2.0-flash-001

Vorschau

Verweist auf ein Vorschaumodell, das möglicherweise nicht für die Produktion geeignet ist, restriktivere Ratenbegrenzungen hat, für das aber die Abrechnung aktiviert sein kann.

Wenn Sie eine Vorschauversion angeben möchten, verwenden Sie das folgende Muster:<model>-<generation>-<variation>-<version>. Beispiel: gemini-2.5-pro-preview-06-05

Vorschaumodelle sind nicht stabil und die Verfügbarkeit von Modellendpunkten kann sich ändern.

Experimentell

Verweist auf ein experimentelles Modell, das möglicherweise nicht für die Produktion geeignet ist und mit restriktiveren Ratenbegrenzungen einhergeht. Wir veröffentlichen experimentelle Modelle, um Feedback zu sammeln und Entwicklern schnell die neuesten Updates zur Verfügung zu stellen.

Wenn Sie eine experimentelle Version angeben möchten, verwenden Sie das folgende Muster: <model>-<generation>-<variation>-<version>. Beispiel: gemini-2.0-pro-exp-02-05

Experimentelle Modelle sind nicht stabil und die Verfügbarkeit von Modellendpunkten kann sich ändern.

Experimentelle Modelle

Zusätzlich zu stabilen Modellen bietet die Gemini API experimentelle Modelle, die möglicherweise nicht für die Produktion geeignet sind und restriktivere Ratenlimits haben.

Wir veröffentlichen experimentelle Modelle, um Feedback zu sammeln, Entwicklern schnell unsere neuesten Updates zur Verfügung zu stellen und das Innovationstempo bei Google zu verdeutlichen. Die Erkenntnisse aus unseren experimentellen Releases fließen in die Art und Weise ein, wie wir Modelle für weitere Nutzersegmente veröffentlichen. Ein experimentelles Modell kann ohne vorherige Ankündigung durch ein anderes ersetzt werden. Wir garantieren nicht, dass ein experimentelles Modell in Zukunft zu einem stabilen Modell wird.

Vorherige experimentelle Modelle

Wenn neue Versionen oder stabile Releases verfügbar werden, entfernen und ersetzen wir experimentelle Modelle. Die bisherigen experimentellen Modelle, die wir veröffentlicht haben, finden Sie im folgenden Abschnitt zusammen mit der Ersatzversion:

Modellcode	Basismodell	Ersatzversion
`gemini-embedding-exp-03-07`	Gemini Embedding	`gemini-embedding-001`
`gemini-2.5-flash-preview-04-17`	Gemini 2.5 Flash	`gemini-2.5-flash-preview-05-20`
`gemini-2.0-flash-exp-image-generation`	Gemini 2.0 Flash	`gemini-2.0-flash-preview-image-generation`
`gemini-2.5-pro-preview-06-05`	Gemini 2.5 Pro	`gemini-2.5-pro`
`gemini-2.5-pro-preview-05-06`	Gemini 2.5 Pro	`gemini-2.5-pro`
`gemini-2.5-pro-preview-03-25`	Gemini 2.5 Pro	`gemini-2.5-pro`
`gemini-2.0-flash-thinking-exp-01-21`	Gemini 2.5 Flash	`gemini-2.5-flash-preview-04-17`
`gemini-2.0-pro-exp-02-05`	Gemini 2.0 Pro Experimental	`gemini-2.5-pro-preview-03-25`
`gemini-2.0-flash-exp`	Gemini 2.0 Flash	`gemini-2.0-flash`
`gemini-exp-1206`	Gemini 2.0 Pro	`gemini-2.0-pro-exp-02-05`
`gemini-2.0-flash-thinking-exp-1219`	Gemini 2.0 Flash Thinking	`gemini-2.0-flash-thinking-exp-01-21`
`gemini-exp-1121`	Gemini	`gemini-exp-1206`
`gemini-exp-1114`	Gemini	`gemini-exp-1206`
`gemini-1.5-pro-exp-0827`	Gemini 1.5 Pro,	`gemini-exp-1206`
`gemini-1.5-pro-exp-0801`	Gemini 1.5 Pro,	`gemini-exp-1206`
`gemini-1.5-flash-8b-exp-0924`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`
`gemini-1.5-flash-8b-exp-0827`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`

Unterstützte Sprachen

Gemini-Modelle sind für die folgenden Sprachen trainiert:

Arabisch (ar)
Bengalisch (bn)
Bulgarisch (bg)
Chinesisch, vereinfacht und traditionell (zh)
Kroatisch (hr)
Tschechisch (cs)
Dänisch (da)
Niederländisch (nl)
Englisch (en)
Estnisch (et)
Finnisch (fi)
Französisch (fr)
Deutsch (de)
Griechisch (el)
Hebräisch (iw)
Hindi (hi)
Ungarisch (hu)
Indonesisch (id)
Italienisch (it)
Japanisch (ja)
Koreanisch (ko)
Lettisch (lv)
Litauisch (lt)
Norwegisch (no)
Polnisch (pl)
Portugiesisch (pt)
Rumänisch (ro)
Russisch (ru)
Serbisch (sr)
Slowakisch (sk)
Slowenisch (sl)
Spanisch (es)
Swahili (sw)
Schwedisch (sv)
Thailändisch (th)
Türkisch (tr)
Ukrainisch (uk)
Vietnamesisch (vi)