2.5 Pro
Mô hình tư duy mạnh mẽ nhất của chúng tôi với độ chính xác tối đa khi phản hồi và hiệu suất tiên tiến
- Nhập âm thanh, hình ảnh, video và văn bản, nhận phản hồi bằng văn bản
- Giải quyết các vấn đề khó khăn, phân tích cơ sở dữ liệu lớn và nhiều việc khác
- Phù hợp nhất cho việc lập trình, suy luận phức tạp và hiểu biết đa phương thức
2.5 Flash
Mô hình tốt nhất của chúng tôi về hiệu suất so với giá, cung cấp các chức năng toàn diện.
- Nhập âm thanh, hình ảnh, video và văn bản, sau đó nhận được câu trả lời bằng văn bản
- Mô hình suy nghĩ khi cần; hoặc bạn có thể định cấu hình ngân sách suy nghĩ
- Phù hợp nhất cho các tác vụ có độ trễ thấp, khối lượng lớn và đòi hỏi tư duy
2.5 Flash-Lite
Mô hình Gemini 2.5 Flash được tối ưu hoá để tiết kiệm chi phí và giảm độ trễ.
- Nhập âm thanh, hình ảnh, video và văn bản, sau đó nhận được câu trả lời bằng văn bản
- Mô hình tiết kiệm chi phí nhất, hỗ trợ thông lượng cao
- Phù hợp nhất cho các trường hợp sử dụng theo thời gian thực, độ trễ thấp
Biến thể mô hình
Gemini API cung cấp nhiều mô hình được tối ưu hoá cho các trường hợp sử dụng cụ thể. Sau đây là thông tin tổng quan ngắn gọn về các phiên bản Gemini hiện có:
Biến thể mô hình | Đầu vào | Đầu ra | Được tối ưu hoá cho |
---|---|---|---|
Gemini 2.5 Pro
gemini-2.5-pro |
Âm thanh, hình ảnh, video, văn bản và tệp PDF | Văn bản | Khả năng tư duy và suy luận nâng cao, khả năng hiểu biết đa phương thức, khả năng lập trình nâng cao và nhiều khả năng khác |
Gemini 2.5 Flash
gemini-2.5-flash |
Âm thanh, hình ảnh, video và văn bản | Văn bản | Tư duy thích ứng, hiệu quả chi phí |
Bản xem trước Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite-preview-06-17 |
Văn bản, hình ảnh, video, âm thanh | Văn bản | Mô hình tiết kiệm chi phí nhất, hỗ trợ thông lượng cao |
Âm thanh gốc của Gemini 2.5 Flash
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog |
Âm thanh, video và văn bản | Văn bản và âm thanh xen kẽ | Đầu ra âm thanh trò chuyện tự nhiên, chất lượng cao, có hoặc không cần suy nghĩ |
Bản xem trước Gemini 2.5 Flash TTS
gemini-2.5-flash-preview-tts |
Văn bản | Âm thanh | Tạo âm thanh chuyển văn bản sang lời nói có độ trễ thấp, có thể kiểm soát, một và nhiều người nói |
Gemini 2.5 Pro Preview TTS
gemini-2.5-pro-preview-tts |
Văn bản | Âm thanh | Tạo âm thanh chuyển văn bản sang lời nói có độ trễ thấp, có thể kiểm soát, một và nhiều người nói |
Gemini 2.0 Flash
gemini-2.0-flash |
Âm thanh, hình ảnh, video và văn bản | Văn bản | Các tính năng thế hệ mới, tốc độ và khả năng phát trực tuyến theo thời gian thực. |
Bản xem trước tính năng tạo hình ảnh của Gemini 2.0 Flash
gemini-2.0-flash-preview-image-generation |
Âm thanh, hình ảnh, video và văn bản | Văn bản, hình ảnh | Tạo và chỉnh sửa hình ảnh thông qua cuộc trò chuyện |
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite |
Âm thanh, hình ảnh, video và văn bản | Văn bản | Hiệu quả chi phí và độ trễ thấp |
Gemini 1.5 Flash
gemini-1.5-flash |
Âm thanh, hình ảnh, video và văn bản | Văn bản | Hiệu suất nhanh chóng và linh hoạt trong nhiều loại tác vụ
Không dùng nữa |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
Âm thanh, hình ảnh, video và văn bản | Văn bản | Các tác vụ có khối lượng lớn và trí tuệ nhân tạo thấp hơn
Không dùng nữa |
Gemini 1.5 Pro
gemini-1.5-pro |
Âm thanh, hình ảnh, video và văn bản | Văn bản |
Các nhiệm vụ suy luận phức tạp đòi hỏi nhiều trí tuệ hơn
Không dùng nữa |
Gemini Embedding
gemini-embedding-001 |
Văn bản | Văn bản nhúng | Đo lường mức độ liên quan của các chuỗi văn bản |
Imagen 4
imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06 |
Văn bản | Hình ảnh | Mô hình tạo hình ảnh mới nhất của chúng tôi |
Imagen 3
imagen-3.0-generate-002 |
Văn bản | Hình ảnh | Mô hình tạo hình ảnh chất lượng cao |
Veo 3 (Bản xem trước)
veo-3.0-generate-preview |
Văn bản | Video có âm thanh | Tạo video chất lượng cao có hiệu ứng âm thanh, tiếng ồn xung quanh và lời thoại |
Veo 2
veo-2.0-generate-001 |
Văn bản, hình ảnh | Video | Tạo video chất lượng cao |
Gemini 2.5 Flash Live
gemini-live-2.5-flash-preview |
Âm thanh, video và văn bản | Văn bản, âm thanh | Tương tác thoại và video hai chiều có độ trễ thấp |
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001 |
Âm thanh, video và văn bản | Văn bản, âm thanh | Tương tác thoại và video hai chiều có độ trễ thấp |
Bạn có thể xem hạn mức sử dụng cho từng mô hình trên trang hạn mức sử dụng.
Gemini 2.5 Pro
Gemini 2.5 Pro là mô hình tư duy tiên tiến nhất của chúng tôi, có khả năng suy luận về các vấn đề phức tạp trong mã, toán học và STEM, cũng như phân tích các tập dữ liệu, cơ sở mã và tài liệu lớn bằng cách sử dụng ngữ cảnh dài.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | gemini-2.5-pro |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Âm thanh, hình ảnh, video, văn bản và tệp PDF Đầu ra Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 65.536 |
Khả năng của |
Kết quả có cấu trúc Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Tìm trong phần liên kết thực tế Được hỗ trợ Tạo hình ảnh Không được hỗ trợ Tạo âm thanh Không được hỗ trợ Live API Không được hỗ trợ Tư duy Được hỗ trợ Batch API Được hỗ trợ |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 6 năm 2025 |
Điểm cắt kiến thức | Tháng 1 năm 2025 |
Gemini 2.5 Flash
Mô hình tốt nhất của chúng tôi về hiệu suất so với giá, cung cấp các chức năng toàn diện. 2.5 Flash phù hợp nhất để xử lý quy mô lớn, độ trễ thấp, các tác vụ có khối lượng lớn đòi hỏi tư duy và các trường hợp sử dụng dựa trên tác nhân.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-2.5-flash |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Văn bản, hình ảnh, video, âm thanh Đầu ra Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 65.536 |
Khả năng của |
Tạo âm thanh Không được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Thực thi mã Được hỗ trợ Gọi hàm Được hỗ trợ Tạo hình ảnh Không được hỗ trợ Tìm trong phần liên kết thực tế Được hỗ trợ Kết quả có cấu trúc Được hỗ trợ Tư duy Được hỗ trợ Điều chỉnh Không được hỗ trợ Batch API Được hỗ trợ |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 6 năm 2025 |
Điểm cắt kiến thức | Tháng 1 năm 2025 |
Bản xem trước Gemini 2.5 Flash-Lite
Mô hình Gemini 2.5 Flash được tối ưu hoá để tiết kiệm chi phí và giảm độ trễ.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-2.5-flash-lite-preview-06-17 |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Văn bản, hình ảnh, video và âm thanh Đầu ra Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.000.000 Giới hạn mã thông báo đầu ra 64.000 |
Khả năng của |
Kết quả có cấu trúc Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Ngữ cảnh URL Được hỗ trợ Tìm trong phần liên kết thực tế Được hỗ trợ Tạo hình ảnh Không được hỗ trợ Tạo âm thanh Không được hỗ trợ Live API Không được hỗ trợ Tư duy Được hỗ trợ |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 6 năm 2025 |
Điểm cắt kiến thức | Tháng 1 năm 2025 |
Âm thanh gốc của Gemini 2.5 Flash
Các mô hình hộp thoại âm thanh gốc của chúng tôi, có và không có suy nghĩ, có sẵn thông qua Live API. Các mô hình này mang đến trải nghiệm trò chuyện mang tính tương tác và không có cấu trúc, với lời nhắc về phong cách và quyền kiểm soát.
Dùng thử âm thanh gốc trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-2.5-flash-preview-native-audio-dialog và models/gemini-2.5-flash-exp-native-audio-thinking-dialog |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Âm thanh, video, văn bản Đầu ra Âm thanh và văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 128.000 Giới hạn mã thông báo đầu ra 8.000 |
Khả năng của |
Tạo âm thanh Được hỗ trợ Lưu vào bộ nhớ đệm Không được hỗ trợ Thực thi mã Không được hỗ trợ Gọi hàm Được hỗ trợ Tạo hình ảnh Không được hỗ trợ Tìm trong phần liên kết thực tế Được hỗ trợ Kết quả có cấu trúc Không được hỗ trợ Tư duy Được hỗ trợ Điều chỉnh Không được hỗ trợ |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 5 năm 2025 |
Điểm cắt kiến thức | Tháng 1 năm 2025 |
Bản xem trước tính năng chuyển văn bản sang lời nói của Gemini 2.5 Flash
Gemini 2.5 Flash Preview TTS là mô hình chuyển văn bản sang lời nói có hiệu suất cao so với mức giá, mang lại khả năng kiểm soát và tính minh bạch cao cho các quy trình công việc có cấu trúc như tạo podcast, sách nói, hỗ trợ khách hàng, v.v. Giới hạn số lượng yêu cầu của Gemini 2.5 Flash sẽ nghiêm ngặt hơn vì đây là một mô hình thử nghiệm/dùng thử.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-2.5-flash-preview-tts |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Văn bản Đầu ra Âm thanh |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 8.000 Giới hạn mã thông báo đầu ra 16.000 |
Khả năng của |
Kết quả có cấu trúc Không được hỗ trợ Lưu vào bộ nhớ đệm Không được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Không được hỗ trợ Thực thi mã Không được hỗ trợ Tìm kiếm Không được hỗ trợ Tạo âm thanh Được hỗ trợ Live API Không được hỗ trợ Tư duy Không được hỗ trợ |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 5 năm 2025 |
Bản xem trước tính năng chuyển văn bản sang lời nói của Gemini 2.5 Pro
Gemini 2.5 Pro Preview TTS là mô hình chuyển văn bản sang lời nói mạnh mẽ nhất của chúng tôi, mang lại khả năng kiểm soát và tính minh bạch cao cho các quy trình công việc có cấu trúc như tạo podcast, sách nói, hỗ trợ khách hàng và nhiều quy trình khác. Giới hạn về tốc độ của Gemini 2.5 Pro bị hạn chế hơn vì đây là một mô hình thử nghiệm/xem trước.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-2.5-pro-preview-tts |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Văn bản Đầu ra Âm thanh |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 8.000 Giới hạn mã thông báo đầu ra 16.000 |
Khả năng của |
Kết quả có cấu trúc Không được hỗ trợ Lưu vào bộ nhớ đệm Không được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Không được hỗ trợ Thực thi mã Không được hỗ trợ Tìm kiếm Không được hỗ trợ Tạo âm thanh Được hỗ trợ Live API Không được hỗ trợ Tư duy Không được hỗ trợ |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 5 năm 2025 |
Gemini 2.0 Flash
Gemini 2.0 Flash mang đến các tính năng thế hệ mới và khả năng cải tiến, bao gồm tốc độ vượt trội, khả năng sử dụng công cụ gốc và cửa sổ ngữ cảnh 1 triệu token.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-2.0-flash |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Âm thanh, hình ảnh, video và văn bản Đầu ra Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 8.192 |
Khả năng của |
Kết quả có cấu trúc Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Tìm kiếm Được hỗ trợ Tạo hình ảnh Không được hỗ trợ Tạo âm thanh Không được hỗ trợ Live API Được hỗ trợ Tư duy Thử nghiệm Batch API Được hỗ trợ |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 2 năm 2025 |
Điểm cắt kiến thức | Tháng 8 năm 2024 |
Bản xem trước Gemini 2.0 Flash về tính năng tạo hình ảnh
Tính năng Tạo hình ảnh bằng Gemini 2.0 Flash (bản dùng thử) mang đến những tính năng tạo hình ảnh được cải thiện, bao gồm cả khả năng tạo và chỉnh sửa hình ảnh theo cách đàm thoại.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-2.0-flash-preview-image-generation |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Âm thanh, hình ảnh, video và văn bản Đầu ra Văn bản và hình ảnh |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 32.000 Giới hạn mã thông báo đầu ra 8.192 |
Khả năng của |
Kết quả có cấu trúc Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Không được hỗ trợ Thực thi mã Không được hỗ trợ Tìm kiếm Không được hỗ trợ Tạo hình ảnh Được hỗ trợ Tạo âm thanh Không được hỗ trợ Live API Không được hỗ trợ Tư duy Không được hỗ trợ |
Phiên bản |
gemini-2.0-flash-preview-image-generation hiện không được hỗ trợ ở một số quốc gia tại Châu Âu, Trung Đông và Châu Phi |
Thông tin cập nhật mới nhất | Tháng 5 năm 2025 |
Điểm cắt kiến thức | Tháng 8 năm 2024 |
Gemini 2.0 Flash-Lite
Mô hình Gemini 2.0 Flash được tối ưu hoá để tiết kiệm chi phí và giảm độ trễ.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-2.0-flash-lite |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Âm thanh, hình ảnh, video và văn bản Đầu ra Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 8.192 |
Khả năng của |
Kết quả có cấu trúc Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Không được hỗ trợ Tìm kiếm Không được hỗ trợ Tạo hình ảnh Không được hỗ trợ Tạo âm thanh Không được hỗ trợ Live API Không được hỗ trợ Batch API Được hỗ trợ |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 2 năm 2025 |
Điểm cắt kiến thức | Tháng 8 năm 2024 |
Gemini 1.5 Flash
Gemini 1.5 Flash là một mô hình đa phương thức nhanh chóng và linh hoạt để mở rộng quy mô cho nhiều nhiệm vụ đa dạng.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-1.5-flash |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Âm thanh, hình ảnh, video và văn bản Đầu ra Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 8.192 |
Quy cách về âm thanh/hình ảnh |
Số lượng hình ảnh tối đa cho mỗi câu lệnh 3.600 Thời lượng video tối đa 1 giờ Độ dài tối đa của âm thanh Khoảng 9,5 giờ |
Khả năng của |
Hướng dẫn về hệ thống Được hỗ trợ Chế độ JSON Được hỗ trợ Giản đồ JSON Được hỗ trợ Chế độ cài đặt an toàn có thể điều chỉnh Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Live API Không được hỗ trợ |
Phiên bản |
|
Ngày ngưng sử dụng | Tháng 9 năm 2025 |
Thông tin cập nhật mới nhất | Tháng 9 năm 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B là một mô hình nhỏ được thiết kế cho các tác vụ có độ phức tạp thấp.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-1.5-flash-8b |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Âm thanh, hình ảnh, video và văn bản Đầu ra Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 8.192 |
Quy cách về âm thanh/hình ảnh |
Số lượng hình ảnh tối đa cho mỗi câu lệnh 3.600 Thời lượng video tối đa 1 giờ Độ dài tối đa của âm thanh Khoảng 9,5 giờ |
Khả năng của |
Hướng dẫn về hệ thống Được hỗ trợ Chế độ JSON Được hỗ trợ Giản đồ JSON Được hỗ trợ Chế độ cài đặt an toàn có thể điều chỉnh Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Live API Không được hỗ trợ |
Phiên bản |
|
Ngày ngưng sử dụng | Tháng 9 năm 2025 |
Thông tin cập nhật mới nhất | Tháng 10 năm 2024 |
Gemini 1.5 Pro
Dùng thử Gemini 2.5 Pro Preview, mô hình Gemini tiên tiến nhất từ trước đến nay của chúng tôi.
Gemini 1.5 Pro là một mô hình đa phương thức cỡ trung, được tối ưu hoá cho nhiều nhiệm vụ suy luận. 1.5 Pro có thể xử lý cùng lúc lượng lớn dữ liệu, bao gồm 2 giờ video, 19 giờ âm thanh, cơ sở mã có 60.000 dòng mã hoặc 2.000 trang văn bản.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-1.5-pro |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Âm thanh, hình ảnh, video và văn bản Đầu ra Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 2.097.152 Giới hạn mã thông báo đầu ra 8.192 |
Quy cách về âm thanh/hình ảnh |
Số lượng hình ảnh tối đa cho mỗi câu lệnh 7.200 Thời lượng video tối đa 2 giờ Độ dài tối đa của âm thanh Khoảng 19 giờ |
Khả năng của |
Hướng dẫn về hệ thống Được hỗ trợ Chế độ JSON Được hỗ trợ Giản đồ JSON Được hỗ trợ Chế độ cài đặt an toàn có thể điều chỉnh Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Live API Không được hỗ trợ |
Phiên bản |
|
Ngày ngưng sử dụng | Tháng 9 năm 2025 |
Thông tin cập nhật mới nhất | Tháng 9 năm 2024 |
Imagen 4
Imagen 4 là mô hình hình ảnh mới nhất của chúng tôi, có khả năng tạo ra hình ảnh có độ chi tiết cao với ánh sáng chân thực, khả năng hiển thị văn bản tốt hơn đáng kể và đầu ra có độ phân giải cao hơn so với các mô hình trước đây.
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy |
Gemini API
|
Các loại dữ liệu được hỗ trợ |
Input Văn bản Đầu ra Hình ảnh |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 480 mã thông báo (văn bản) Hình ảnh đầu ra 1 (Cực cao) |
Thông tin cập nhật mới nhất | Tháng 6 năm 2025 |
Imagen 3
Imagen 3 là mô hình chuyển văn bản thành hình ảnh có chất lượng cao nhất của chúng tôi, có khả năng tạo ra hình ảnh chi tiết hơn, ánh sáng chân thực hơn và ít hiện tượng giả tạo gây mất tập trung hơn so với các mô hình trước đây của chúng tôi.
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy |
Gemini API
|
Các loại dữ liệu được hỗ trợ |
Input Văn bản Đầu ra Hình ảnh |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào Không áp dụng Hình ảnh đầu ra Tối đa 4 |
Thông tin cập nhật mới nhất | Tháng 2 năm 2025 |
Veo 3 (Bản dùng thử)
Veo 3 Preview là mô hình chuyển văn bản thành video mới nhất của chúng tôi, có khả năng tạo video chi tiết kèm âm thanh tích hợp, khả năng tuân thủ câu lệnh nâng cao và chế độ điều khiển camera trực tiếp.
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy |
Gemini API
|
Các loại dữ liệu được hỗ trợ |
Input Văn bản Đầu ra Video có âm thanh |
Giới hạn |
Nhập văn bản 1.024 mã thông báo Video đầu ra 1 |
Thông tin cập nhật mới nhất | Tháng 7 năm 2025 |
Veo 2
Veo 2 là mô hình tạo video chất lượng cao từ văn bản và hình ảnh, có khả năng tạo video chi tiết, nắm bắt sắc thái nghệ thuật trong câu lệnh của bạn.
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy |
Gemini API
|
Các loại dữ liệu được hỗ trợ |
Input Văn bản, hình ảnh Đầu ra Video |
Giới hạn |
Nhập văn bản Không áp dụng Đầu vào hình ảnh Mọi độ phân giải và tỷ lệ khung hình của hình ảnh đều được chấp nhận, miễn là kích thước tệp không quá 20 MB Video đầu ra Tối đa 2 |
Thông tin cập nhật mới nhất | Tháng 4 năm 2025 |
Gemini 2.5 Flash Live
Mô hình Gemini 2.5 Flash Live hoạt động với Live API để cho phép các hoạt động tương tác bằng giọng nói và video hai chiều có độ trễ thấp với Gemini. Mô hình này có thể xử lý văn bản, âm thanh và video đầu vào, đồng thời có thể cung cấp văn bản và âm thanh đầu ra.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-live-2.5-flash-preview |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Âm thanh, video và văn bản Đầu ra Văn bản và âm thanh |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 8.192 |
Khả năng của |
Kết quả có cấu trúc Được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Tìm kiếm Được hỗ trợ Tạo hình ảnh Không được hỗ trợ Tạo âm thanh Được hỗ trợ Tư duy Không được hỗ trợ |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 6 năm 2025 |
Điểm cắt kiến thức | Tháng 1 năm 2025 |
Gemini 2.0 Flash Live
Mô hình Gemini 2.0 Flash Live hoạt động với Live API để cho phép các hoạt động tương tác bằng giọng nói và video hai chiều có độ trễ thấp với Gemini. Mô hình này có thể xử lý văn bản, âm thanh và video đầu vào, đồng thời có thể cung cấp văn bản và âm thanh đầu ra.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/gemini-2.0-flash-live-001 |
Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Âm thanh, video và văn bản Đầu ra Văn bản và âm thanh |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 8.192 |
Khả năng của |
Kết quả có cấu trúc Được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Tìm kiếm Được hỗ trợ Tạo hình ảnh Không được hỗ trợ Tạo âm thanh Được hỗ trợ Tư duy Không được hỗ trợ |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 4 năm 2025 |
Điểm cắt kiến thức | Tháng 8 năm 2024 |
Gemini Embedding
Mô hình Gemini Embedding đạt được hiệu suất SOTA trên nhiều phương diện chính, bao gồm mã, đa ngôn ngữ và khả năng truy xuất.
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy |
Gemini API
|
Các loại dữ liệu được hỗ trợ |
Input Văn bản Đầu ra Văn bản nhúng |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 2.048 Kích thước phương diện đầu ra Linh hoạt, hỗ trợ: 128 – 3072, Nên dùng: 768, 1536, 3072 |
Phiên bản |
|
Thông tin cập nhật mới nhất | Tháng 6 năm 2025 |
Mô hình nhúng cũ
Nhúng văn bản (cũ)
Vectơ nhúng văn bản được dùng để đo mức độ liên quan của các chuỗi và được sử dụng rộng rãi trong nhiều ứng dụng AI.
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy |
Gemini API
|
Các loại dữ liệu được hỗ trợ |
Input Văn bản Đầu ra Văn bản nhúng |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 2.048 Kích thước phương diện đầu ra 768 |
[**] | Giới hạn về tốc độ1.500 yêu cầu mỗi phút |
Chế độ cài đặt an toàn có thể điều chỉnh | Không được hỗ trợ |
Ngày ngưng sử dụng | Tháng 1 năm 2026 |
Thông tin cập nhật mới nhất | Tháng 4 năm 2024 |
AQA
Bạn có thể sử dụng mô hình AQA để thực hiện các tác vụ liên quan đến Trả lời câu hỏi có trích dẫn (AQA) trên một tài liệu, tập hợp văn bản hoặc một tập hợp đoạn văn. Mô hình AQA trả về câu trả lời cho các câu hỏi dựa trên các nguồn được cung cấp, cùng với việc ước tính xác suất trả lời.
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã kiểu máy | models/aqa |
Các loại dữ liệu được hỗ trợ |
Input Văn bản Đầu ra Văn bản |
Ngôn ngữ được hỗ trợ | Tiếng Anh |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 7.168 Giới hạn mã thông báo đầu ra 1.024 |
[**] | Giới hạn về tốc độ1.500 yêu cầu mỗi phút |
Chế độ cài đặt an toàn có thể điều chỉnh | Được hỗ trợ |
Thông tin cập nhật mới nhất | Tháng 12 năm 2023 |
Hãy xem các ví dụ để khám phá các khả năng của những biến thể mô hình này.
[*] Một mã thông báo tương đương với khoảng 4 ký tự đối với các mô hình Gemini. 100 mã thông báo tương đương khoảng 60 đến 80 từ tiếng Anh.
Mẫu tên phiên bản mô hình
Các mô hình Gemini có ở phiên bản ổn định, xem trước hoặc thử nghiệm. Trong mã của mình, bạn có thể sử dụng một trong các định dạng tên mô hình sau để chỉ định mô hình và phiên bản mà bạn muốn sử dụng.
Ổn định mới nhất
Chỉ đến phiên bản ổn định gần đây nhất được phát hành cho thế hệ và biến thể mô hình được chỉ định.
Để chỉ định phiên bản ổn định mới nhất, hãy sử dụng mẫu sau: <model>-<generation>-<variation>
. Ví dụ: gemini-2.0-flash
.
Ổn định
Trỏ đến một mô hình ổn định cụ thể. Các mô hình ổn định thường không thay đổi. Hầu hết các ứng dụng phát hành công khai đều nên sử dụng một mô hình ổn định cụ thể.
Để chỉ định một phiên bản ổn định, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-<version>
. Ví dụ: gemini-2.0-flash-001
.
Xem trước
Trỏ đến một mô hình xem trước có thể không phù hợp để sử dụng trong quá trình sản xuất, đi kèm với giới hạn tốc độ hạn chế hơn, nhưng có thể đã bật tính năng thanh toán.
Để chỉ định một phiên bản xem trước, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-<version>
. Ví dụ: gemini-2.5-pro-preview-06-05
.
Các mô hình xem trước không ổn định và khả năng cung cấp các điểm cuối mô hình có thể thay đổi.
Thử nghiệm
Chỉ đến một mô hình thử nghiệm có thể không phù hợp để sử dụng trong quá trình sản xuất và đi kèm với giới hạn tốc độ hạn chế hơn. Chúng tôi phát hành các mô hình thử nghiệm để thu thập ý kiến phản hồi và nhanh chóng cung cấp các bản cập nhật mới nhất cho nhà phát triển.
Để chỉ định một phiên bản thử nghiệm, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-<version>
. Ví dụ: gemini-2.0-pro-exp-02-05
.
Các mô hình thử nghiệm không ổn định và khả năng cung cấp các điểm cuối mô hình có thể thay đổi.
Mô hình thử nghiệm
Ngoài các mô hình ổn định, Gemini API còn cung cấp các mô hình thử nghiệm có thể không phù hợp để sử dụng trong thực tế và có giới hạn tốc độ nghiêm ngặt hơn.
Chúng tôi phát hành các mô hình thử nghiệm để thu thập ý kiến phản hồi, nhanh chóng cung cấp các bản cập nhật mới nhất cho nhà phát triển và làm nổi bật tốc độ đổi mới tại Google. Những gì chúng tôi học được từ các bản thử nghiệm sẽ giúp chúng tôi có thêm kinh nghiệm để phát hành các mô hình trên phạm vi rộng hơn. Bạn có thể thay thế một mô hình thử nghiệm bằng một mô hình khác mà không cần thông báo trước. Chúng tôi không đảm bảo rằng một mô hình thử nghiệm sẽ trở thành mô hình ổn định trong tương lai.
Các mô hình thử nghiệm trước đây
Khi có các phiên bản mới hoặc bản phát hành ổn định, chúng tôi sẽ xoá và thay thế các mô hình thử nghiệm. Bạn có thể tìm thấy các mô hình thử nghiệm trước đây mà chúng tôi đã phát hành trong phần sau cùng với phiên bản thay thế:
Mã kiểu thiết bị | Mô hình cơ sở | Phiên bản thay thế |
---|---|---|
gemini-embedding-exp-03-07 |
Gemini Embedding | gemini-embedding-001 |
gemini-2.5-flash-preview-04-17 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-05-20 |
gemini-2.0-flash-exp-image-generation |
Gemini 2.0 Flash | gemini-2.0-flash-preview-image-generation |
gemini-2.5-pro-preview-06-05 |
Gemini 2.5 Pro | gemini-2.5-pro |
gemini-2.5-pro-preview-05-06 |
Gemini 2.5 Pro | gemini-2.5-pro |
gemini-2.5-pro-preview-03-25 |
Gemini 2.5 Pro | gemini-2.5-pro |
gemini-2.0-flash-thinking-exp-01-21 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-04-17 |
gemini-2.0-pro-exp-02-05 |
Gemini 2.0 Pro Experimental | gemini-2.5-pro-preview-03-25 |
gemini-2.0-flash-exp |
Gemini 2.0 Flash | gemini-2.0-flash |
gemini-exp-1206 |
Gemini 2.0 Pro | gemini-2.0-pro-exp-02-05 |
gemini-2.0-flash-thinking-exp-1219 |
Gemini 2.0 Flash Thinking | gemini-2.0-flash-thinking-exp-01-21 |
gemini-exp-1121 |
Gemini | gemini-exp-1206 |
gemini-exp-1114 |
Gemini | gemini-exp-1206 |
gemini-1.5-pro-exp-0827 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-pro-exp-0801 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-flash-8b-exp-0924 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
gemini-1.5-flash-8b-exp-0827 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
Ngôn ngữ được hỗ trợ
Các mô hình Gemini được huấn luyện để hoạt động bằng những ngôn ngữ sau:
- Tiếng Ả Rập (
ar
) - Tiếng Bengal (
bn
) - Tiếng Bulgaria (
bg
) - Tiếng Trung giản thể và phồn thể (
zh
) - Tiếng Croatia (
hr
) - Tiếng Séc (
cs
) - Tiếng Đan Mạch (
da
) - Tiếng Hà Lan (
nl
) - Tiếng Anh (
en
) - Tiếng Estonia (
et
) - Tiếng Phần Lan (
fi
) - Tiếng Pháp (
fr
) - Tiếng Đức (
de
) - Tiếng Hy Lạp (
el
) - Tiếng Do Thái (
iw
) - Tiếng Hindi (
hi
) - Tiếng Hungary (
hu
) - Tiếng Indonesia (
id
) - Tiếng Ý (
it
) - Tiếng Nhật (
ja
) - Tiếng Hàn (
ko
) - Tiếng Latvia (
lv
) - Tiếng Lithuania (
lt
) - Tiếng Na Uy (
no
) - Tiếng Ba Lan (
pl
) - Tiếng Bồ Đào Nha (
pt
) - Tiếng Romania (
ro
) - Tiếng Nga (
ru
) - Tiếng Serbia (
sr
) - Tiếng Slovak (
sk
) - Tiếng Slovenia (
sl
) - Tiếng Tây Ban Nha (
es
) - Tiếng Swahili (
sw
) - Tiếng Thuỵ Điển (
sv
) - Tiếng Thái (
th
) - Tiếng Thổ Nhĩ Kỳ (
tr
) - Tiếng Ukraina (
uk
) - Tiếng Việt (
vi
)