Mô hình Gemini

Biến thể mô hình

Gemini API cung cấp nhiều mô hình được tối ưu hoá cho các trường hợp sử dụng cụ thể. Sau đây là thông tin tổng quan ngắn gọn về các phiên bản Gemini hiện có:

Biến thể mô hình Đầu vào Đầu ra Được tối ưu hoá cho
Gemini 2.5 Pro
gemini-2.5-pro
Âm thanh, hình ảnh, video, văn bản và tệp PDF Văn bản Khả năng tư duy và suy luận nâng cao, khả năng hiểu biết đa phương thức, khả năng lập trình nâng cao và nhiều khả năng khác
Gemini 2.5 Flash
gemini-2.5-flash
Âm thanh, hình ảnh, video và văn bản Văn bản Tư duy thích ứng, hiệu quả chi phí
Bản xem trước Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite-preview-06-17
Văn bản, hình ảnh, video, âm thanh Văn bản Mô hình tiết kiệm chi phí nhất, hỗ trợ thông lượng cao
Âm thanh gốc của Gemini 2.5 Flash
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog
Âm thanh, video và văn bản Văn bản và âm thanh xen kẽ Đầu ra âm thanh trò chuyện tự nhiên, chất lượng cao, có hoặc không cần suy nghĩ
Bản xem trước Gemini 2.5 Flash TTS
gemini-2.5-flash-preview-tts
Văn bản Âm thanh Tạo âm thanh chuyển văn bản sang lời nói có độ trễ thấp, có thể kiểm soát, một và nhiều người nói
Gemini 2.5 Pro Preview TTS
gemini-2.5-pro-preview-tts
Văn bản Âm thanh Tạo âm thanh chuyển văn bản sang lời nói có độ trễ thấp, có thể kiểm soát, một và nhiều người nói
Gemini 2.0 Flash
gemini-2.0-flash
Âm thanh, hình ảnh, video và văn bản Văn bản Các tính năng thế hệ mới, tốc độ và khả năng phát trực tuyến theo thời gian thực.
Bản xem trước tính năng tạo hình ảnh của Gemini 2.0 Flash
gemini-2.0-flash-preview-image-generation
Âm thanh, hình ảnh, video và văn bản Văn bản, hình ảnh Tạo và chỉnh sửa hình ảnh thông qua cuộc trò chuyện
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
Âm thanh, hình ảnh, video và văn bản Văn bản Hiệu quả chi phí và độ trễ thấp
Gemini 1.5 Flash
gemini-1.5-flash
Âm thanh, hình ảnh, video và văn bản Văn bản Hiệu suất nhanh chóng và linh hoạt trong nhiều loại tác vụ
Không dùng nữa
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Âm thanh, hình ảnh, video và văn bản Văn bản Các tác vụ có khối lượng lớn và trí tuệ nhân tạo thấp hơn
Không dùng nữa
Gemini 1.5 Pro
gemini-1.5-pro
Âm thanh, hình ảnh, video và văn bản Văn bản Các nhiệm vụ suy luận phức tạp đòi hỏi nhiều trí tuệ hơn
Không dùng nữa
Gemini Embedding
gemini-embedding-001
Văn bản Văn bản nhúng Đo lường mức độ liên quan của các chuỗi văn bản
Imagen 4
imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06
Văn bản Hình ảnh Mô hình tạo hình ảnh mới nhất của chúng tôi
Imagen 3
imagen-3.0-generate-002
Văn bản Hình ảnh Mô hình tạo hình ảnh chất lượng cao
Veo 3 (Bản xem trước)
veo-3.0-generate-preview
Văn bản Video có âm thanh Tạo video chất lượng cao có hiệu ứng âm thanh, tiếng ồn xung quanh và lời thoại
Veo 2
veo-2.0-generate-001
Văn bản, hình ảnh Video Tạo video chất lượng cao
Gemini 2.5 Flash Live
gemini-live-2.5-flash-preview
Âm thanh, video và văn bản Văn bản, âm thanh Tương tác thoại và video hai chiều có độ trễ thấp
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001
Âm thanh, video và văn bản Văn bản, âm thanh Tương tác thoại và video hai chiều có độ trễ thấp

Bạn có thể xem hạn mức sử dụng cho từng mô hình trên trang hạn mức sử dụng.

Gemini 2.5 Pro

Gemini 2.5 Pro là mô hình tư duy tiên tiến nhất của chúng tôi, có khả năng suy luận về các vấn đề phức tạp trong mã, toán học và STEM, cũng như phân tích các tập dữ liệu, cơ sở mã và tài liệu lớn bằng cách sử dụng ngữ cảnh dài.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy gemini-2.5-pro
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, hình ảnh, video, văn bản và tệp PDF

Đầu ra

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

65.536

Khả năng của

Kết quả có cấu trúc

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Tìm trong phần liên kết thực tế

Được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

Tạo âm thanh

Không được hỗ trợ

Live API

Không được hỗ trợ

Tư duy

Được hỗ trợ

Batch API

Được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Stable: gemini-2.5-pro
  • Preview: gemini-2.5-pro-preview-06-05
  • Preview: gemini-2.5-pro-preview-05-06
  • Preview: gemini-2.5-pro-preview-03-25
Thông tin cập nhật mới nhất Tháng 6 năm 2025
Điểm cắt kiến thức Tháng 1 năm 2025

Gemini 2.5 Flash

Mô hình tốt nhất của chúng tôi về hiệu suất so với giá, cung cấp các chức năng toàn diện. 2.5 Flash phù hợp nhất để xử lý quy mô lớn, độ trễ thấp, các tác vụ có khối lượng lớn đòi hỏi tư duy và các trường hợp sử dụng dựa trên tác nhân.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-2.5-flash
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Văn bản, hình ảnh, video, âm thanh

Đầu ra

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

65.536

Khả năng của

Tạo âm thanh

Không được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Gọi hàm

Được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

Tìm trong phần liên kết thực tế

Được hỗ trợ

Kết quả có cấu trúc

Được hỗ trợ

Tư duy

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Batch API

Được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Ổn định: gemini-2.5-flash
  • Xem trước: gemini-2.5-flash-preview-05-20
Thông tin cập nhật mới nhất Tháng 6 năm 2025
Điểm cắt kiến thức Tháng 1 năm 2025

Bản xem trước Gemini 2.5 Flash-Lite

Mô hình Gemini 2.5 Flash được tối ưu hoá để tiết kiệm chi phí và giảm độ trễ.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-2.5-flash-lite-preview-06-17
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Văn bản, hình ảnh, video và âm thanh

Đầu ra

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.000.000

Giới hạn mã thông báo đầu ra

64.000

Khả năng của

Kết quả có cấu trúc

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Ngữ cảnh URL

Được hỗ trợ

Tìm trong phần liên kết thực tế

Được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

Tạo âm thanh

Không được hỗ trợ

Live API

Không được hỗ trợ

Tư duy

Được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Xem trước: gemini-2.5-flash-lite-preview-06-17
Thông tin cập nhật mới nhất Tháng 6 năm 2025
Điểm cắt kiến thức Tháng 1 năm 2025

Âm thanh gốc của Gemini 2.5 Flash

Các mô hình hộp thoại âm thanh gốc của chúng tôi, có và không có suy nghĩ, có sẵn thông qua Live API. Các mô hình này mang đến trải nghiệm trò chuyện mang tính tương tác và không có cấu trúc, với lời nhắc về phong cách và quyền kiểm soát.

Dùng thử âm thanh gốc trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-2.5-flash-preview-native-audio-dialog
models/gemini-2.5-flash-exp-native-audio-thinking-dialog
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, video, văn bản

Đầu ra

Âm thanh và văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

128.000

Giới hạn mã thông báo đầu ra

8.000

Khả năng của

Tạo âm thanh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Không được hỗ trợ

Thực thi mã

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

Tìm trong phần liên kết thực tế

Được hỗ trợ

Kết quả có cấu trúc

Không được hỗ trợ

Tư duy

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Xem trước: gemini-2.5-flash-preview-05-20
  • Thử nghiệm: gemini-2.5-flash-exp-native-audio-thinking-dialog
Thông tin cập nhật mới nhất Tháng 5 năm 2025
Điểm cắt kiến thức Tháng 1 năm 2025

Bản xem trước tính năng chuyển văn bản sang lời nói của Gemini 2.5 Flash

Gemini 2.5 Flash Preview TTS là mô hình chuyển văn bản sang lời nói có hiệu suất cao so với mức giá, mang lại khả năng kiểm soát và tính minh bạch cao cho các quy trình công việc có cấu trúc như tạo podcast, sách nói, hỗ trợ khách hàng, v.v. Giới hạn số lượng yêu cầu của Gemini 2.5 Flash sẽ nghiêm ngặt hơn vì đây là một mô hình thử nghiệm/dùng thử.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-2.5-flash-preview-tts
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Văn bản

Đầu ra

Âm thanh

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

8.000

Giới hạn mã thông báo đầu ra

16.000

Khả năng của

Kết quả có cấu trúc

Không được hỗ trợ

Lưu vào bộ nhớ đệm

Không được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Không được hỗ trợ

Thực thi mã

Không được hỗ trợ

Tìm kiếm

Không được hỗ trợ

Tạo âm thanh

Được hỗ trợ

Live API

Không được hỗ trợ

Tư duy

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • gemini-2.5-flash-preview-tts
Thông tin cập nhật mới nhất Tháng 5 năm 2025

Bản xem trước tính năng chuyển văn bản sang lời nói của Gemini 2.5 Pro

Gemini 2.5 Pro Preview TTS là mô hình chuyển văn bản sang lời nói mạnh mẽ nhất của chúng tôi, mang lại khả năng kiểm soát và tính minh bạch cao cho các quy trình công việc có cấu trúc như tạo podcast, sách nói, hỗ trợ khách hàng và nhiều quy trình khác. Giới hạn về tốc độ của Gemini 2.5 Pro bị hạn chế hơn vì đây là một mô hình thử nghiệm/xem trước.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-2.5-pro-preview-tts
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Văn bản

Đầu ra

Âm thanh

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

8.000

Giới hạn mã thông báo đầu ra

16.000

Khả năng của

Kết quả có cấu trúc

Không được hỗ trợ

Lưu vào bộ nhớ đệm

Không được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Không được hỗ trợ

Thực thi mã

Không được hỗ trợ

Tìm kiếm

Không được hỗ trợ

Tạo âm thanh

Được hỗ trợ

Live API

Không được hỗ trợ

Tư duy

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • gemini-2.5-pro-preview-tts
Thông tin cập nhật mới nhất Tháng 5 năm 2025

Gemini 2.0 Flash

Gemini 2.0 Flash mang đến các tính năng thế hệ mới và khả năng cải tiến, bao gồm tốc độ vượt trội, khả năng sử dụng công cụ gốc và cửa sổ ngữ cảnh 1 triệu token.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-2.0-flash
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, hình ảnh, video và văn bản

Đầu ra

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

8.192

Khả năng của

Kết quả có cấu trúc

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Tìm kiếm

Được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

Tạo âm thanh

Không được hỗ trợ

Live API

Được hỗ trợ

Tư duy

Thử nghiệm

Batch API

Được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Mới nhất: gemini-2.0-flash
  • Ổn định: gemini-2.0-flash-001
  • Thử nghiệm: gemini-2.0-flash-exp
Thông tin cập nhật mới nhất Tháng 2 năm 2025
Điểm cắt kiến thức Tháng 8 năm 2024

Bản xem trước Gemini 2.0 Flash về tính năng tạo hình ảnh

Tính năng Tạo hình ảnh bằng Gemini 2.0 Flash (bản dùng thử) mang đến những tính năng tạo hình ảnh được cải thiện, bao gồm cả khả năng tạo và chỉnh sửa hình ảnh theo cách đàm thoại.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-2.0-flash-preview-image-generation
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, hình ảnh, video và văn bản

Đầu ra

Văn bản và hình ảnh

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

32.000

Giới hạn mã thông báo đầu ra

8.192

Khả năng của

Kết quả có cấu trúc

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Không được hỗ trợ

Thực thi mã

Không được hỗ trợ

Tìm kiếm

Không được hỗ trợ

Tạo hình ảnh

Được hỗ trợ

Tạo âm thanh

Không được hỗ trợ

Live API

Không được hỗ trợ

Tư duy

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Xem trước: gemini-2.0-flash-preview-image-generation
  • gemini-2.0-flash-preview-image-generation hiện không được hỗ trợ ở một số quốc gia tại Châu Âu, Trung Đông và Châu Phi

Thông tin cập nhật mới nhất Tháng 5 năm 2025
Điểm cắt kiến thức Tháng 8 năm 2024

Gemini 2.0 Flash-Lite

Mô hình Gemini 2.0 Flash được tối ưu hoá để tiết kiệm chi phí và giảm độ trễ.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-2.0-flash-lite
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, hình ảnh, video và văn bản

Đầu ra

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

8.192

Khả năng của

Kết quả có cấu trúc

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Không được hỗ trợ

Tìm kiếm

Không được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

Tạo âm thanh

Không được hỗ trợ

Live API

Không được hỗ trợ

Batch API

Được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Mới nhất: gemini-2.0-flash-lite
  • Ổn định: gemini-2.0-flash-lite-001
Thông tin cập nhật mới nhất Tháng 2 năm 2025
Điểm cắt kiến thức Tháng 8 năm 2024

Gemini 1.5 Flash

Gemini 1.5 Flash là một mô hình đa phương thức nhanh chóng và linh hoạt để mở rộng quy mô cho nhiều nhiệm vụ đa dạng.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-1.5-flash
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, hình ảnh, video và văn bản

Đầu ra

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

8.192

Quy cách về âm thanh/hình ảnh

Số lượng hình ảnh tối đa cho mỗi câu lệnh

3.600

Thời lượng video tối đa

1 giờ

Độ dài tối đa của âm thanh

Khoảng 9,5 giờ

Khả năng của

Hướng dẫn về hệ thống

Được hỗ trợ

Chế độ JSON

Được hỗ trợ

Giản đồ JSON

Được hỗ trợ

Chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Live API

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Mới nhất: gemini-1.5-flash-latest
  • Bản ổn định mới nhất: gemini-1.5-flash
  • Ổn định:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Ngày ngưng sử dụng Tháng 9 năm 2025
Thông tin cập nhật mới nhất Tháng 9 năm 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B là một mô hình nhỏ được thiết kế cho các tác vụ có độ phức tạp thấp.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-1.5-flash-8b
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, hình ảnh, video và văn bản

Đầu ra

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

8.192

Quy cách về âm thanh/hình ảnh

Số lượng hình ảnh tối đa cho mỗi câu lệnh

3.600

Thời lượng video tối đa

1 giờ

Độ dài tối đa của âm thanh

Khoảng 9,5 giờ

Khả năng của

Hướng dẫn về hệ thống

Được hỗ trợ

Chế độ JSON

Được hỗ trợ

Giản đồ JSON

Được hỗ trợ

Chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Live API

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Mới nhất: gemini-1.5-flash-8b-latest
  • Bản ổn định mới nhất: gemini-1.5-flash-8b
  • Ổn định:
    • gemini-1.5-flash-8b-001
Ngày ngưng sử dụng Tháng 9 năm 2025
Thông tin cập nhật mới nhất Tháng 10 năm 2024

Gemini 1.5 Pro

Dùng thử Gemini 2.5 Pro Preview, mô hình Gemini tiên tiến nhất từ trước đến nay của chúng tôi.

Gemini 1.5 Pro là một mô hình đa phương thức cỡ trung, được tối ưu hoá cho nhiều nhiệm vụ suy luận. 1.5 Pro có thể xử lý cùng lúc lượng lớn dữ liệu, bao gồm 2 giờ video, 19 giờ âm thanh, cơ sở mã có 60.000 dòng mã hoặc 2.000 trang văn bản.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-1.5-pro
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, hình ảnh, video và văn bản

Đầu ra

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

2.097.152

Giới hạn mã thông báo đầu ra

8.192

Quy cách về âm thanh/hình ảnh

Số lượng hình ảnh tối đa cho mỗi câu lệnh

7.200

Thời lượng video tối đa

2 giờ

Độ dài tối đa của âm thanh

Khoảng 19 giờ

Khả năng của

Hướng dẫn về hệ thống

Được hỗ trợ

Chế độ JSON

Được hỗ trợ

Giản đồ JSON

Được hỗ trợ

Chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Live API

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Mới nhất: gemini-1.5-pro-latest
  • Bản ổn định mới nhất: gemini-1.5-pro
  • Ổn định:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Ngày ngưng sử dụng Tháng 9 năm 2025
Thông tin cập nhật mới nhất Tháng 9 năm 2024

Imagen 4

Imagen 4 là mô hình hình ảnh mới nhất của chúng tôi, có khả năng tạo ra hình ảnh có độ chi tiết cao với ánh sáng chân thực, khả năng hiển thị văn bản tốt hơn đáng kể và đầu ra có độ phân giải cao hơn so với các mô hình trước đây.

Chi tiết mô hình
Thuộc tính Mô tả
Mã kiểu máy

Gemini API

imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06

Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Hình ảnh

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

480 mã thông báo (văn bản)

Hình ảnh đầu ra

1 (Cực cao)
1 đến 4 (Chuẩn)

Thông tin cập nhật mới nhất Tháng 6 năm 2025

Imagen 3

Imagen 3 là mô hình chuyển văn bản thành hình ảnh có chất lượng cao nhất của chúng tôi, có khả năng tạo ra hình ảnh chi tiết hơn, ánh sáng chân thực hơn và ít hiện tượng giả tạo gây mất tập trung hơn so với các mô hình trước đây của chúng tôi.

Chi tiết mô hình
Thuộc tính Mô tả
Mã kiểu máy

Gemini API

imagen-3.0-generate-002

Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Hình ảnh

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

Không áp dụng

Hình ảnh đầu ra

Tối đa 4

Thông tin cập nhật mới nhất Tháng 2 năm 2025

Veo 3 (Bản dùng thử)

Veo 3 Preview là mô hình chuyển văn bản thành video mới nhất của chúng tôi, có khả năng tạo video chi tiết kèm âm thanh tích hợp, khả năng tuân thủ câu lệnh nâng cao và chế độ điều khiển camera trực tiếp.

Dùng thử Veo 3

Chi tiết mô hình
Thuộc tính Mô tả
Mã kiểu máy

Gemini API

veo-3.0-generate-preview

Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Video có âm thanh

Giới hạn

Nhập văn bản

1.024 mã thông báo

Video đầu ra

1

Thông tin cập nhật mới nhất Tháng 7 năm 2025

Veo 2

Veo 2 là mô hình tạo video chất lượng cao từ văn bản và hình ảnh, có khả năng tạo video chi tiết, nắm bắt sắc thái nghệ thuật trong câu lệnh của bạn.

Chi tiết mô hình
Thuộc tính Mô tả
Mã kiểu máy

Gemini API

veo-2.0-generate-001

Các loại dữ liệu được hỗ trợ

Input

Văn bản, hình ảnh

Đầu ra

Video

Giới hạn

Nhập văn bản

Không áp dụng

Đầu vào hình ảnh

Mọi độ phân giải và tỷ lệ khung hình của hình ảnh đều được chấp nhận, miễn là kích thước tệp không quá 20 MB

Video đầu ra

Tối đa 2

Thông tin cập nhật mới nhất Tháng 4 năm 2025

Gemini 2.5 Flash Live

Mô hình Gemini 2.5 Flash Live hoạt động với Live API để cho phép các hoạt động tương tác bằng giọng nói và video hai chiều có độ trễ thấp với Gemini. Mô hình này có thể xử lý văn bản, âm thanh và video đầu vào, đồng thời có thể cung cấp văn bản và âm thanh đầu ra.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-live-2.5-flash-preview
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, video và văn bản

Đầu ra

Văn bản và âm thanh

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

8.192

Khả năng của

Kết quả có cấu trúc

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Tìm kiếm

Được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

Tạo âm thanh

Được hỗ trợ

Tư duy

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Xem trước: gemini-live-2.5-flash-preview
Thông tin cập nhật mới nhất Tháng 6 năm 2025
Điểm cắt kiến thức Tháng 1 năm 2025

Gemini 2.0 Flash Live

Mô hình Gemini 2.0 Flash Live hoạt động với Live API để cho phép các hoạt động tương tác bằng giọng nói và video hai chiều có độ trễ thấp với Gemini. Mô hình này có thể xử lý văn bản, âm thanh và video đầu vào, đồng thời có thể cung cấp văn bản và âm thanh đầu ra.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-2.0-flash-live-001
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, video và văn bản

Đầu ra

Văn bản và âm thanh

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

8.192

Khả năng của

Kết quả có cấu trúc

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Tìm kiếm

Được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

Tạo âm thanh

Được hỗ trợ

Tư duy

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Xem trước: gemini-2.0-flash-live-001
Thông tin cập nhật mới nhất Tháng 4 năm 2025
Điểm cắt kiến thức Tháng 8 năm 2024

Gemini Embedding

Mô hình Gemini Embedding đạt được hiệu suất SOTA trên nhiều phương diện chính, bao gồm mã, đa ngôn ngữ và khả năng truy xuất.

Chi tiết mô hình
Thuộc tính Mô tả
Mã kiểu máy

Gemini API

gemini-embedding-001

Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Văn bản nhúng

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

2.048

Kích thước phương diện đầu ra

Linh hoạt, hỗ trợ: 128 – 3072, Nên dùng: 768, 1536, 3072

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Ổn định: gemini-embedding-001
  • Xem trước: gemini-embedding-exp-03-07
Thông tin cập nhật mới nhất Tháng 6 năm 2025

Mô hình nhúng cũ

Nhúng văn bản (cũ)

Vectơ nhúng văn bản được dùng để đo mức độ liên quan của các chuỗi và được sử dụng rộng rãi trong nhiều ứng dụng AI.

Chi tiết mô hình
Thuộc tính Mô tả
Mã kiểu máy

Gemini API

models/text-embedding-004

Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Văn bản nhúng

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

2.048

Kích thước phương diện đầu ra

768

Giới hạn về tốc độ[**] 1.500 yêu cầu mỗi phút
Chế độ cài đặt an toàn có thể điều chỉnh Không được hỗ trợ
Ngày ngưng sử dụng Tháng 1 năm 2026
Thông tin cập nhật mới nhất Tháng 4 năm 2024

AQA

Bạn có thể sử dụng mô hình AQA để thực hiện các tác vụ liên quan đến Trả lời câu hỏi có trích dẫn (AQA) trên một tài liệu, tập hợp văn bản hoặc một tập hợp đoạn văn. Mô hình AQA trả về câu trả lời cho các câu hỏi dựa trên các nguồn được cung cấp, cùng với việc ước tính xác suất trả lời.

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/aqa
Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Văn bản

Ngôn ngữ được hỗ trợ Tiếng Anh
Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

7.168

Giới hạn mã thông báo đầu ra

1.024

Giới hạn về tốc độ[**] 1.500 yêu cầu mỗi phút
Chế độ cài đặt an toàn có thể điều chỉnh Được hỗ trợ
Thông tin cập nhật mới nhất Tháng 12 năm 2023

Hãy xem các ví dụ để khám phá các khả năng của những biến thể mô hình này.

[*] Một mã thông báo tương đương với khoảng 4 ký tự đối với các mô hình Gemini. 100 mã thông báo tương đương khoảng 60 đến 80 từ tiếng Anh.

Mẫu tên phiên bản mô hình

Các mô hình Gemini có ở phiên bản ổn định, xem trước hoặc thử nghiệm. Trong mã của mình, bạn có thể sử dụng một trong các định dạng tên mô hình sau để chỉ định mô hình và phiên bản mà bạn muốn sử dụng.

Ổn định mới nhất

Chỉ đến phiên bản ổn định gần đây nhất được phát hành cho thế hệ và biến thể mô hình được chỉ định.

Để chỉ định phiên bản ổn định mới nhất, hãy sử dụng mẫu sau: <model>-<generation>-<variation>. Ví dụ: gemini-2.0-flash.

Ổn định

Trỏ đến một mô hình ổn định cụ thể. Các mô hình ổn định thường không thay đổi. Hầu hết các ứng dụng phát hành công khai đều nên sử dụng một mô hình ổn định cụ thể.

Để chỉ định một phiên bản ổn định, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-<version>. Ví dụ: gemini-2.0-flash-001.

Xem trước

Trỏ đến một mô hình xem trước có thể không phù hợp để sử dụng trong quá trình sản xuất, đi kèm với giới hạn tốc độ hạn chế hơn, nhưng có thể đã bật tính năng thanh toán.

Để chỉ định một phiên bản xem trước, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-<version>. Ví dụ: gemini-2.5-pro-preview-06-05.

Các mô hình xem trước không ổn định và khả năng cung cấp các điểm cuối mô hình có thể thay đổi.

Thử nghiệm

Chỉ đến một mô hình thử nghiệm có thể không phù hợp để sử dụng trong quá trình sản xuất và đi kèm với giới hạn tốc độ hạn chế hơn. Chúng tôi phát hành các mô hình thử nghiệm để thu thập ý kiến phản hồi và nhanh chóng cung cấp các bản cập nhật mới nhất cho nhà phát triển.

Để chỉ định một phiên bản thử nghiệm, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-<version>. Ví dụ: gemini-2.0-pro-exp-02-05.

Các mô hình thử nghiệm không ổn định và khả năng cung cấp các điểm cuối mô hình có thể thay đổi.

Mô hình thử nghiệm

Ngoài các mô hình ổn định, Gemini API còn cung cấp các mô hình thử nghiệm có thể không phù hợp để sử dụng trong thực tế và có giới hạn tốc độ nghiêm ngặt hơn.

Chúng tôi phát hành các mô hình thử nghiệm để thu thập ý kiến phản hồi, nhanh chóng cung cấp các bản cập nhật mới nhất cho nhà phát triển và làm nổi bật tốc độ đổi mới tại Google. Những gì chúng tôi học được từ các bản thử nghiệm sẽ giúp chúng tôi có thêm kinh nghiệm để phát hành các mô hình trên phạm vi rộng hơn. Bạn có thể thay thế một mô hình thử nghiệm bằng một mô hình khác mà không cần thông báo trước. Chúng tôi không đảm bảo rằng một mô hình thử nghiệm sẽ trở thành mô hình ổn định trong tương lai.

Các mô hình thử nghiệm trước đây

Khi có các phiên bản mới hoặc bản phát hành ổn định, chúng tôi sẽ xoá và thay thế các mô hình thử nghiệm. Bạn có thể tìm thấy các mô hình thử nghiệm trước đây mà chúng tôi đã phát hành trong phần sau cùng với phiên bản thay thế:

Mã kiểu thiết bị Mô hình cơ sở Phiên bản thay thế
gemini-embedding-exp-03-07 Gemini Embedding gemini-embedding-001
gemini-2.5-flash-preview-04-17 Gemini 2.5 Flash gemini-2.5-flash-preview-05-20
gemini-2.0-flash-exp-image-generation Gemini 2.0 Flash gemini-2.0-flash-preview-image-generation
gemini-2.5-pro-preview-06-05 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.5-pro-preview-05-06 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.5-pro-preview-03-25 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.0-flash-thinking-exp-01-21 Gemini 2.5 Flash gemini-2.5-flash-preview-04-17
gemini-2.0-pro-exp-02-05 Gemini 2.0 Pro Experimental gemini-2.5-pro-preview-03-25
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

Ngôn ngữ được hỗ trợ

Các mô hình Gemini được huấn luyện để hoạt động bằng những ngôn ngữ sau:

  • Tiếng Ả Rập (ar)
  • Tiếng Bengal (bn)
  • Tiếng Bulgaria (bg)
  • Tiếng Trung giản thể và phồn thể (zh)
  • Tiếng Croatia (hr)
  • Tiếng Séc (cs)
  • Tiếng Đan Mạch (da)
  • Tiếng Hà Lan (nl)
  • Tiếng Anh (en)
  • Tiếng Estonia (et)
  • Tiếng Phần Lan (fi)
  • Tiếng Pháp (fr)
  • Tiếng Đức (de)
  • Tiếng Hy Lạp (el)
  • Tiếng Do Thái (iw)
  • Tiếng Hindi (hi)
  • Tiếng Hungary (hu)
  • Tiếng Indonesia (id)
  • Tiếng Ý (it)
  • Tiếng Nhật (ja)
  • Tiếng Hàn (ko)
  • Tiếng Latvia (lv)
  • Tiếng Lithuania (lt)
  • Tiếng Na Uy (no)
  • Tiếng Ba Lan (pl)
  • Tiếng Bồ Đào Nha (pt)
  • Tiếng Romania (ro)
  • Tiếng Nga (ru)
  • Tiếng Serbia (sr)
  • Tiếng Slovak (sk)
  • Tiếng Slovenia (sl)
  • Tiếng Tây Ban Nha (es)
  • Tiếng Swahili (sw)
  • Tiếng Thuỵ Điển (sv)
  • Tiếng Thái (th)
  • Tiếng Thổ Nhĩ Kỳ (tr)
  • Tiếng Ukraina (uk)
  • Tiếng Việt (vi)