Gemini-Modelle

Modellvarianten

Die Gemini API bietet verschiedene Modelle für unterschiedliche Anwendungsfälle. Hier finden Sie einen kurzen Überblick über die verfügbaren Gemini-Varianten:

Modellvariante Eingabe(n) Ausgabe Optimiert für
Gemini 2.5 Pro
gemini-2.5-pro
Audio, Bilder, Videos, Text und PDF Text Verbessertes Denken und Schlussfolgern, multimodales Verstehen, komplexes Programmieren und mehr
Gemini 2.5 Flash
gemini-2.5-flash
Audio, Bilder, Videos und Text Text Anpassungsfähigkeit, Kosteneffizienz
Gemini 2.5 Flash-Lite (Vorschau)
gemini-2.5-flash-lite-preview-06-17
Text, Bild, Video, Audio Text Kostengünstigstes Modell mit Unterstützung für hohen Durchsatz
Gemini 2.5 Flash Native Audio
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog
Audio, Videos und Text Text und Audio, verschachtelt Hochwertige, natürlich klingende Audioausgabe von Gesprächen, mit oder ohne Denkprozess
Gemini 2.5 Flash Preview TTS
gemini-2.5-flash-preview-tts
Text Audio Sprachausgabe mit niedriger Latenz, die sich steuern lässt und für einen oder mehrere Sprecher geeignet ist
Gemini 2.5 Pro Preview – TTS
gemini-2.5-pro-preview-tts
Text Audio Sprachausgabe mit niedriger Latenz, die sich steuern lässt und für einen oder mehrere Sprecher geeignet ist
Gemini 2.0 Flash
gemini-2.0-flash
Audio, Bilder, Videos und Text Text Funktionen der nächsten Generation, Geschwindigkeit und Echtzeit-Streaming.
Gemini 2.0 Flash – Vorschau auf die Bildgenerierung
gemini-2.0-flash-preview-image-generation
Audio, Bilder, Videos und Text Text, Bilder Bilder in natürlicher Sprache generieren und bearbeiten
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
Audio, Bilder, Videos und Text Text Kosteneffizienz und geringe Latenz
Gemini 1.5 Flash
gemini-1.5-flash
Audio, Bilder, Videos und Text Text Schnelle und vielseitige Leistung bei einer Vielzahl von Aufgaben
Eingestellt
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Audio, Bilder, Videos und Text Text Aufgaben mit hohem Volumen und geringerem Intelligenzgrad
Eingestellt
Gemini 1.5 Pro
gemini-1.5-pro
Audio, Bilder, Videos und Text Text Komplexe Aufgaben, die mehr Intelligenz erfordern
Eingestellt
Gemini Embedding
gemini-embedding-001
Text Texteinbettungen Verwandtschaft von Textstrings messen
Imagen 4
imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06
Text Bilder Unser aktuellstes Modell zur Bildgenerierung
Bild 3
imagen-3.0-generate-002
Text Bilder Hochwertiges Modell zur Bildgenerierung
Veo 3 – Vorabversion
veo-3.0-generate-preview
Text Video mit Audio Hochwertige Videogenerierung mit Soundeffekten, Umgebungsgeräuschen und Dialogen
Veo 2
veo-2.0-generate-001
Text, Bilder Video Videogenerierung in hoher Qualität
Gemini 2.5 Flash Live
gemini-live-2.5-flash-preview
Audio, Video und Text Text, Audio Bidirektionale Sprach- und Videointeraktionen mit geringer Latenz
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001
Audio, Video und Text Text, Audio Bidirektionale Sprach- und Videointeraktionen mit geringer Latenz

Die Ratenlimits für die einzelnen Modelle finden Sie auf der Seite mit den Ratenlimits.

Gemini 2.5 Pro

Gemini 2.5 Pro ist unser innovativstes Thinking Model, das in der Lage ist, komplexe Probleme in den Bereichen Programmieren, Mathematik und Naturwissenschaften, Technik und Mathematik (STEM) zu lösen und große Datensätze, Codebasen und Dokumente mithilfe von Langkontext zu analysieren.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode gemini-2.5-pro
Unterstützte Datentypen

Eingaben

Audio, Bilder, Video, Text und PDF

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

1.048.576

Tokenausgabelimit

65.536

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Unterstützt

Tuning

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Nach Fundierung suchen

Unterstützt

Bildgenerierung

Nicht unterstützt

Audioerstellung

Nicht unterstützt

Live API

Nicht unterstützt

Denken

Unterstützt

Batch API

Unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Stable: gemini-2.5-pro
  • Preview: gemini-2.5-pro-preview-06-05
  • Preview: gemini-2.5-pro-preview-05-06
  • Preview: gemini-2.5-pro-preview-03-25
Letzte Aktualisierung Juni 2025
Wissensstichtag Januar 2025

Gemini 2.5 Flash

Unser bestes Modell in Bezug auf das Preis-Leistungs-Verhältnis mit umfassenden Funktionen. 2.5 Flash eignet sich am besten für die Verarbeitung im großen Maßstab, Aufgaben mit niedriger Latenz und hohem Volumen, die Denkprozesse erfordern, sowie für agentische Anwendungsfälle.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-2.5-flash
Unterstützte Datentypen

Eingaben

Text, Bilder, Video, Audio

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

1.048.576

Tokenausgabelimit

65.536

-Funktionen

Audioerstellung

Nicht unterstützt

Caching

Unterstützt

Codeausführung

Unterstützt

Funktionsaufrufe

Unterstützt

Bildgenerierung

Nicht unterstützt

Nach Fundierung suchen

Unterstützt

Strukturierte Ausgaben

Unterstützt

Denken

Unterstützt

Tuning

Nicht unterstützt

Batch API

Unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Stabil: gemini-2.5-flash
  • Vorschau für: gemini-2.5-flash-preview-05-20
Letzte Aktualisierung Juni 2025
Wissensstichtag Januar 2025

Gemini 2.5 Flash-Lite (Vorabversion)

Ein für Kosteneffizienz und niedrige Latenz optimiertes Gemini 2.5 Flash-Modell.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-2.5-flash-lite-preview-06-17
Unterstützte Datentypen

Eingaben

Text, Bilder, Videos und Audio

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

1.000.000

Tokenausgabelimit

64.000

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Unterstützt

Tuning

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

URL-Kontext

Unterstützt

Nach Fundierung suchen

Unterstützt

Bildgenerierung

Nicht unterstützt

Audioerstellung

Nicht unterstützt

Live API

Nicht unterstützt

Denken

Unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Vorschau für: gemini-2.5-flash-lite-preview-06-17
Letzte Aktualisierung Juni 2025
Wissensstichtag Januar 2025

Gemini 2.5 Flash – native Audiofunktionen

Unsere nativen Audio-Dialogmodelle mit und ohne Denkprozess sind über die Live API verfügbar. Diese Modelle bieten interaktive und unstrukturierte Unterhaltungen mit Stil- und Kontroll-Prompts.

Native Audio in Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-2.5-flash-preview-native-audio-dialog &
models/gemini-2.5-flash-exp-native-audio-thinking-dialog
Unterstützte Datentypen

Eingaben

Audio, Video, Text

Ausgabe

Audio und Text

Token-Limits[*]

Eingabetokenlimit

128.000

Tokenausgabelimit

8.000

-Funktionen

Audioerstellung

Unterstützt

Caching

Nicht unterstützt

Codeausführung

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Bildgenerierung

Nicht unterstützt

Nach Fundierung suchen

Unterstützt

Strukturierte Ausgaben

Nicht unterstützt

Denken

Unterstützt

Tuning

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Vorschau für: gemini-2.5-flash-preview-05-20
  • Test: gemini-2.5-flash-exp-native-audio-thinking-dialog
Letzte Aktualisierung Mai 2025
Wissensstichtag Januar 2025

Gemini 2.5 Flash-Vorschau – Text-zu-Sprache

Gemini 2.5 Flash Preview TTS ist unser preisgünstiges Text-zu-Sprache-Modell, das eine hohe Kontrolle und Transparenz für strukturierte Workflows wie die Erstellung von Podcasts, Hörbüchern und Kundensupport bietet. Die Ratenbegrenzungen für Gemini 2.5 Flash sind strenger, da es sich um ein experimentelles Modell / ein Modell in der Vorabversion handelt.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-2.5-flash-preview-tts
Unterstützte Datentypen

Eingaben

Text

Ausgabe

Audio

Token-Limits[*]

Eingabetokenlimit

8.000

Tokenausgabelimit

16.000

-Funktionen

Strukturierte Ausgaben

Nicht unterstützt

Caching

Nicht unterstützt

Tuning

Nicht unterstützt

Funktionsaufrufe

Nicht unterstützt

Codeausführung

Nicht unterstützt

Suche

Nicht unterstützt

Audioerstellung

Unterstützt

Live API

Nicht unterstützt

Denken

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • gemini-2.5-flash-preview-tts
Letzte Aktualisierung Mai 2025

Gemini 2.5 Pro-Vorschau: Text-zu-Sprache

Gemini 2.5 Pro Preview TTS ist unser leistungsstärkstes Modell für die Sprachsynthese. Es bietet hohe Kontrolle und Transparenz für strukturierte Workflows wie die Erstellung von Podcasts, Hörbüchern und Kundensupport. Die Ratenbegrenzungen für Gemini 2.5 Pro sind strenger, da es sich um ein experimentelles Modell bzw. ein Modell in der Vorabversion handelt.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-2.5-pro-preview-tts
Unterstützte Datentypen

Eingaben

Text

Ausgabe

Audio

Token-Limits[*]

Eingabetokenlimit

8.000

Tokenausgabelimit

16.000

-Funktionen

Strukturierte Ausgaben

Nicht unterstützt

Caching

Nicht unterstützt

Tuning

Nicht unterstützt

Funktionsaufrufe

Nicht unterstützt

Codeausführung

Nicht unterstützt

Suche

Nicht unterstützt

Audioerstellung

Unterstützt

Live API

Nicht unterstützt

Denken

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • gemini-2.5-pro-preview-tts
Letzte Aktualisierung Mai 2025

Gemini 2.0 Flash

Gemini 2.0 Flash bietet Funktionen der nächsten Generation und verbesserte Möglichkeiten, darunter eine höhere Geschwindigkeit, die Nutzung nativer Tools und ein Kontextfenster von 1 Million Tokens.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-2.0-flash
Unterstützte Datentypen

Eingaben

Audio, Bilder, Videos und Text

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

1.048.576

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Unterstützt

Tuning

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Suche

Unterstützt

Bildgenerierung

Nicht unterstützt

Audioerstellung

Nicht unterstützt

Live API

Unterstützt

Denken

Experimentell

Batch API

Unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Neueste: gemini-2.0-flash
  • Stabil: gemini-2.0-flash-001
  • Test: gemini-2.0-flash-exp
Letzte Aktualisierung Februar 2025
Wissensstichtag August 2024

Gemini 2.0 Flash – Vorschau auf die Bildgenerierung

Die Vorschaufunktion für die Bildgenerierung mit Gemini 2.0 Flash bietet verbesserte Funktionen für die Bildgenerierung, einschließlich der Möglichkeit, Bilder im Dialog zu generieren und zu bearbeiten.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-2.0-flash-preview-image-generation
Unterstützte Datentypen

Eingaben

Audio, Bilder, Videos und Text

Ausgabe

Text und Bilder

Token-Limits[*]

Eingabetokenlimit

32.000

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Unterstützt

Tuning

Nicht unterstützt

Funktionsaufrufe

Nicht unterstützt

Codeausführung

Nicht unterstützt

Suche

Nicht unterstützt

Bildgenerierung

Unterstützt

Audioerstellung

Nicht unterstützt

Live API

Nicht unterstützt

Denken

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Vorschau für: gemini-2.0-flash-preview-image-generation
  • Die Bildgenerierung mit gemini-2.0-flash-preview wird derzeit in einigen Ländern in Europa, im Nahen Osten und in Afrika nicht unterstützt.

Letzte Aktualisierung Mai 2025
Wissensstichtag August 2024

Gemini 2.0 Flash-Lite

Ein für Kosteneffizienz und niedrige Latenz optimiertes Gemini 2.0 Flash-Modell.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-2.0-flash-lite
Unterstützte Datentypen

Eingaben

Audio, Bilder, Videos und Text

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

1.048.576

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Caching

Unterstützt

Tuning

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Nicht unterstützt

Suche

Nicht unterstützt

Bildgenerierung

Nicht unterstützt

Audioerstellung

Nicht unterstützt

Live API

Nicht unterstützt

Batch API

Unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Neueste: gemini-2.0-flash-lite
  • Stabil: gemini-2.0-flash-lite-001
Letzte Aktualisierung Februar 2025
Wissensstichtag August 2024

Gemini 1.5 Flash

Gemini 1.5 Flash ist ein schnelles und vielseitiges multimodales Modell, das sich für die Skalierung für verschiedene Aufgaben eignet.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-1.5-flash
Unterstützte Datentypen

Eingaben

Audio, Bilder, Videos und Text

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

1.048.576

Tokenausgabelimit

8.192

Audio-/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

3.600

Maximale Videolänge

1 Stunde

Maximale Audiolänge

Etwa 9,5 Stunden

-Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Tuning

Unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Live API

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Neueste: gemini-1.5-flash-latest
  • Letzte stabile Version: gemini-1.5-flash
  • Stabil:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Einstellungsdatum September 2025
Letzte Aktualisierung September 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash‑8B ist ein kleines Modell, das für Aufgaben mit geringerem Intelligenzbedarf entwickelt wurde.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-1.5-flash-8b
Unterstützte Datentypen

Eingaben

Audio, Bilder, Videos und Text

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

1.048.576

Tokenausgabelimit

8.192

Audio-/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

3.600

Maximale Videolänge

1 Stunde

Maximale Audiolänge

Etwa 9,5 Stunden

-Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Tuning

Unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Live API

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Neueste: gemini-1.5-flash-8b-latest
  • Letzte stabile Version: gemini-1.5-flash-8b
  • Stabil:
    • gemini-1.5-flash-8b-001
Einstellungsdatum September 2025
Letzte Aktualisierung Oktober 2024

Gemini 1.5 Pro,

Testen Sie Gemini 2.5 Pro Preview, unser bisher fortschrittlichstes Gemini-Modell.

Gemini 1.5 Pro ist ein mittelgroßes multimodales Modell, das für eine Vielzahl von Aufgaben optimiert ist, die logisches Denken erfordern. Gemini 1.5 Pro kann große Datenmengen gleichzeitig verarbeiten, darunter 2 Stunden Video, 19 Stunden Audio, Codebasen mit 60.000 Zeilen Code oder 2.000 Seiten Text.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-1.5-pro
Unterstützte Datentypen

Eingaben

Audio, Bilder, Videos und Text

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

2.097.152

Tokenausgabelimit

8.192

Audio-/visuelle Spezifikationen

Maximale Anzahl von Bildern pro Prompt

7.200

Maximale Videolänge

2 Stunden

Maximale Audiolänge

Etwa 19 Stunden

-Funktionen

Systemanweisungen

Unterstützt

JSON-Modus

Unterstützt

JSON-Schema

Unterstützt

Anpassbare Sicherheitseinstellungen

Unterstützt

Caching

Unterstützt

Tuning

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Live API

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Neueste: gemini-1.5-pro-latest
  • Letzte stabile Version: gemini-1.5-pro
  • Stabil:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Einstellungsdatum September 2025
Letzte Aktualisierung September 2024

Imagen 4

Imagen 4 ist unser neuestes Bildmodell. Es kann sehr detaillierte Bilder mit guter Beleuchtung, deutlich besserem Textrendering und einer höheren Ausgaberesolution als frühere Modelle generieren.

Modelldetails
Attribut Beschreibung
Modellcode

Gemini API

imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06

Unterstützte Datentypen

Eingabe

Text

Ausgabe

Bilder

Token-Limits[*]

Eingabetokenlimit

480 Tokens (Text)

Ausgabe von Bildern

1 (Ultra)
1 bis 4 (Standard)

Letzte Aktualisierung Juni 2025

Imagen 3

Imagen 3 ist unser bisher bestes Text‑zu‑Bild-Modell. Es kann Bilder mit noch mehr Details, besserer Belichtung und weniger störenden Artefakten als unsere bisherigen Modelle generieren.

Modelldetails
Attribut Beschreibung
Modellcode

Gemini API

imagen-3.0-generate-002

Unterstützte Datentypen

Eingabe

Text

Ausgabe

Bilder

Token-Limits[*]

Eingabetokenlimit

Ausgabe von Bildern

Bis zu 4

Letzte Aktualisierung Februar 2025

Veo 3 (Vorabversion)

Die Veo 3-Vorabversion ist unser neuestes Text-zu-Video-Modell, mit dem detaillierte Videos mit integriertem Audio, verbesserter Einhaltung der Vorgaben des Prompts und direkten Kamerasteuerelementen generiert werden können.

Veo 3 ausprobieren

Modelldetails
Attribut Beschreibung
Modellcode

Gemini API

veo-3.0-generate-preview

Unterstützte Datentypen

Eingabe

Text

Ausgabe

Video mit Audio

-Limits

Texteingabe

1.024 Tokens

Ausgabe-Video

1

Letzte Aktualisierung Juli 2025

Veo 2

Veo 2 ist unser hochwertiges Text- und Bild-zu-Video-Modell, mit dem sich detaillierte Videos erstellen lassen, die die künstlerischen Nuancen in Ihren Prompts erfassen.

Modelldetails
Attribut Beschreibung
Modellcode

Gemini API

veo-2.0-generate-001

Unterstützte Datentypen

Eingabe

Text, Bild

Ausgabe

Video

-Limits

Texteingabe

Bildeingabe

Beliebige Bildauflösung und beliebiges Seitenverhältnis bis zu einer Dateigröße von 20 MB

Ausgabe-Video

Bis zu 2

Letzte Aktualisierung April 2025

Gemini 2.5 Flash Live

Das Modell Gemini 2.5 Flash Live funktioniert mit der Live API und ermöglicht bidirektionale Sprach- und Videointeraktionen mit Gemini mit geringer Latenz. Das Modell kann Text-, Audio- und Videoeingaben verarbeiten und Text- und Audioausgaben generieren.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-live-2.5-flash-preview
Unterstützte Datentypen

Eingaben

Audio, Video und Text

Ausgabe

Text und Audio

Token-Limits[*]

Eingabetokenlimit

1.048.576

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Tuning

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Suche

Unterstützt

Bildgenerierung

Nicht unterstützt

Audioerstellung

Unterstützt

Denken

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Vorschau für: gemini-live-2.5-flash-preview
Letzte Aktualisierung Juni 2025
Wissensstichtag Januar 2025

Gemini 2.0 Flash Live

Das Modell Gemini 2.0 Flash Live funktioniert mit der Live API und ermöglicht bidirektionale Sprach- und Videointeraktionen mit Gemini mit geringer Latenz. Das Modell kann Text-, Audio- und Videoeingaben verarbeiten und Text- und Audioausgaben generieren.

In Google AI Studio ausprobieren

Modelldetails

Attribut Beschreibung
Modellcode models/gemini-2.0-flash-live-001
Unterstützte Datentypen

Eingaben

Audio, Video und Text

Ausgabe

Text und Audio

Token-Limits[*]

Eingabetokenlimit

1.048.576

Tokenausgabelimit

8.192

-Funktionen

Strukturierte Ausgaben

Unterstützt

Tuning

Nicht unterstützt

Funktionsaufrufe

Unterstützt

Codeausführung

Unterstützt

Suche

Unterstützt

Bildgenerierung

Nicht unterstützt

Audioerstellung

Unterstützt

Denken

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Vorschau für: gemini-2.0-flash-live-001
Letzte Aktualisierung April 2025
Wissensstichtag August 2024

Gemini Embedding

Das Gemini Embedding-Modell bietet SOTA-Leistung in vielen wichtigen Dimensionen, darunter Code, Mehrsprachigkeit und Abruf.

Modelldetails
Attribut Beschreibung
Modellcode

Gemini API

gemini-embedding-001

Unterstützte Datentypen

Eingabe

Text

Ausgabe

Texteinbettungen

Token-Limits[*]

Eingabetokenlimit

2.048

Größe der Ausgabedimension

Flexibel, unterstützt: 128–3072, empfohlen: 768, 1536, 3072

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Stabil: gemini-embedding-001
  • Vorschau für: gemini-embedding-exp-03-07
Letzte Aktualisierung Juni 2025

Legacy-Einbettungsmodelle

Texteinbettung (alt)

Texteinbettungen werden verwendet, um die Ähnlichkeit von Strings zu messen. Sie werden in vielen KI-Anwendungen eingesetzt.

Modelldetails
Attribut Beschreibung
Modellcode

Gemini API

models/text-embedding-004

Unterstützte Datentypen

Eingabe

Text

Ausgabe

Texteinbettungen

Token-Limits[*]

Eingabetokenlimit

2.048

Größe der Ausgabedimension

768

Ratenbeschränkungen[**] 1.500 Anfragen pro Minute
anpassbare Sicherheitseinstellungen Nicht unterstützt
Einstellungsdatum Januar 2026
Letzte Aktualisierung April 2024

AQA

Sie können das AQA-Modell verwenden, um Attributed Question-Answering-Aufgaben (AQA) für ein Dokument, einen Korpus oder eine Reihe von Passagen auszuführen. Das AQA-Modell gibt Antworten auf Fragen zurück, die auf bereitgestellten Quellen basieren, und schätzt die Wahrscheinlichkeit, dass die Frage beantwortet werden kann.

Modelldetails

Attribut Beschreibung
Modellcode models/aqa
Unterstützte Datentypen

Eingabe

Text

Ausgabe

Text

Unterstützte Sprache Englisch
Token-Limits[*]

Eingabetokenlimit

7.168

Tokenausgabelimit

1.024

Ratenbeschränkungen[**] 1.500 Anfragen pro Minute
anpassbare Sicherheitseinstellungen Unterstützt
Letzte Aktualisierung Dezember 2023

Hier finden Sie Beispiele, um die Funktionen dieser Modellvarianten kennenzulernen.

[*] Ein Token entspricht bei Gemini-Modellen etwa vier Zeichen. 100 Tokens entsprechen etwa 60–80 Wörtern.

Namensmuster für Modellversionen

Gemini-Modelle sind in stabilen, Vorschau- oder experimentellen Versionen verfügbar. In Ihrem Code können Sie eines der folgenden Modellnamensformate verwenden, um anzugeben, welches Modell und welche Version Sie verwenden möchten.

Neueste stabile Version

Verweist auf die neueste stabile Version, die für die angegebene Modellgeneration und ‑variante veröffentlicht wurde.

Wenn Sie die aktuelle stabile Version angeben möchten, verwenden Sie das folgende Muster: <model>-<generation>-<variation>. Beispiel: gemini-2.0-flash.

Stabil

Verweist auf ein bestimmtes stabiles Modell. Stabile Modelle ändern sich in der Regel nicht. Die meisten Produktions-Apps sollten ein bestimmtes stabiles Modell verwenden.

Verwenden Sie das folgende Muster, um eine stabile Version anzugeben: <model>-<generation>-<variation>-<version>. Beispiel: gemini-2.0-flash-001

Vorschau

Verweist auf ein Vorschaumodell, das möglicherweise nicht für die Produktion geeignet ist, restriktivere Ratenbegrenzungen hat, für das aber die Abrechnung aktiviert sein kann.

Wenn Sie eine Vorschauversion angeben möchten, verwenden Sie das folgende Muster:<model>-<generation>-<variation>-<version>. Beispiel: gemini-2.5-pro-preview-06-05

Vorschaumodelle sind nicht stabil und die Verfügbarkeit von Modellendpunkten kann sich ändern.

Experimentell

Verweist auf ein experimentelles Modell, das möglicherweise nicht für die Produktion geeignet ist und mit restriktiveren Ratenbegrenzungen einhergeht. Wir veröffentlichen experimentelle Modelle, um Feedback zu sammeln und Entwicklern schnell die neuesten Updates zur Verfügung zu stellen.

Wenn Sie eine experimentelle Version angeben möchten, verwenden Sie das folgende Muster: <model>-<generation>-<variation>-<version>. Beispiel: gemini-2.0-pro-exp-02-05

Experimentelle Modelle sind nicht stabil und die Verfügbarkeit von Modellendpunkten kann sich ändern.

Experimentelle Modelle

Zusätzlich zu stabilen Modellen bietet die Gemini API experimentelle Modelle, die möglicherweise nicht für die Produktion geeignet sind und restriktivere Ratenlimits haben.

Wir veröffentlichen experimentelle Modelle, um Feedback zu sammeln, Entwicklern schnell unsere neuesten Updates zur Verfügung zu stellen und das Innovationstempo bei Google zu verdeutlichen. Die Erkenntnisse aus unseren experimentellen Releases fließen in die Art und Weise ein, wie wir Modelle für weitere Nutzersegmente veröffentlichen. Ein experimentelles Modell kann ohne vorherige Ankündigung durch ein anderes ersetzt werden. Wir garantieren nicht, dass ein experimentelles Modell in Zukunft zu einem stabilen Modell wird.

Vorherige experimentelle Modelle

Wenn neue Versionen oder stabile Releases verfügbar werden, entfernen und ersetzen wir experimentelle Modelle. Die bisherigen experimentellen Modelle, die wir veröffentlicht haben, finden Sie im folgenden Abschnitt zusammen mit der Ersatzversion:

Modellcode Basismodell Ersatzversion
gemini-embedding-exp-03-07 Gemini Embedding gemini-embedding-001
gemini-2.5-flash-preview-04-17 Gemini 2.5 Flash gemini-2.5-flash-preview-05-20
gemini-2.0-flash-exp-image-generation Gemini 2.0 Flash gemini-2.0-flash-preview-image-generation
gemini-2.5-pro-preview-06-05 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.5-pro-preview-05-06 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.5-pro-preview-03-25 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.0-flash-thinking-exp-01-21 Gemini 2.5 Flash gemini-2.5-flash-preview-04-17
gemini-2.0-pro-exp-02-05 Gemini 2.0 Pro Experimental gemini-2.5-pro-preview-03-25
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro, gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro, gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

Unterstützte Sprachen

Gemini-Modelle sind für die folgenden Sprachen trainiert:

  • Arabisch (ar)
  • Bengalisch (bn)
  • Bulgarisch (bg)
  • Chinesisch, vereinfacht und traditionell (zh)
  • Kroatisch (hr)
  • Tschechisch (cs)
  • Dänisch (da)
  • Niederländisch (nl)
  • Englisch (en)
  • Estnisch (et)
  • Finnisch (fi)
  • Französisch (fr)
  • Deutsch (de)
  • Griechisch (el)
  • Hebräisch (iw)
  • Hindi (hi)
  • Ungarisch (hu)
  • Indonesisch (id)
  • Italienisch (it)
  • Japanisch (ja)
  • Koreanisch (ko)
  • Lettisch (lv)
  • Litauisch (lt)
  • Norwegisch (no)
  • Polnisch (pl)
  • Portugiesisch (pt)
  • Rumänisch (ro)
  • Russisch (ru)
  • Serbisch (sr)
  • Slowakisch (sk)
  • Slowenisch (sl)
  • Spanisch (es)
  • Swahili (sw)
  • Schwedisch (sv)
  • Thailändisch (th)
  • Türkisch (tr)
  • Ukrainisch (uk)
  • Vietnamesisch (vi)