Uruchamianie Gemma w Kubernetes Engine

Google Cloud Kubernetes Engine oferuje szeroki zakres opcji wdrażania, które umożliwiają uruchamianie modeli Gemma z wysoką wydajnością i niskim opóźnieniem przy użyciu preferowanych frameworków programistycznych. Zapoznaj się z tymi przewodnikami dotyczącymi wdrożenia HuggingFace, vLLM, TensorRT-LLM na GPU oraz wykonywania kodu na TPU z JetStream, a także z przewodnikami dotyczącymi stosowania i dostrajania:

Wdrażanie i obsługa

Analizowanie danych

Dostrój