Gemma 4：最強開放模型重磅發布，性能密度創新高

今天，我們正式推出Gemma 4——迄今為止最智能的開放模型。Gemma 4專為高級推理和智能體工作流而設計，在智能密度方面實現了前所未有的突破。自首代產品發布以來，開發者已下載Gemma超過4億次，構建了超過10萬個變體的活躍生態系統。我們深入了解創新者的需求，Gemma 4就是我們的答案：在Apache 2.0許可證下提供突破性能力。

贊助商廣告

基於與Gemini 3相同的世界級研究和技術構建，Gemma 4是您硬體上可運行的最強模型系列。它們與我們的Gemini模型相輔相成，為開發者提供業界最強大的開放和專有工具組合。

行業領先能力與移動優先AI

我們發布四種規格的Gemma 4：高效2B（E2B）、高效4B（E4B）、26B混合專家（MoE）和31B密集型。整個系列超越簡單對話，能夠處理複雜邏輯和智能體工作流。大型模型在同等規模中表現卓越，31B模型在業界標準Arena AI文本排行榜中排名全球開放模型第3位，26B模型位列第6。Gemma 4的表現超越了體積大20倍的模型。對開發者而言，這種新的智能密度意味著以更少的硬體開銷實現前沿能力。

在邊緣計算方面，E2B和E4B模型重新定義設備端實用性，優先考慮多模態能力、低延遲處理和無縫生態系統集成。

強大、易用、開放

為推動下一代開創性研究和產品，我們專門調整了Gemma 4模型規格，使其能在各種硬體上高效運行和微調——從全球數十億Android設備到筆記本GPU，再到開發工作站和加速器。

通過使用這些高度優化的模型，您可以微調Gemma 4以在特定任務上實現頂尖性能。我們已經看到這種方法的巨大成功；例如，INSAIT創建了開創性的保加利亞語優先語言模型（BgGPT），我們與耶魯大學合作開發Cell2Sentence-Scale以發現癌症治療新途徑等。

以下是Gemma 4成為我們最強開放模型系列的特色：

高級推理：具備多步驟規劃和深度邏輯能力，Gemma 4在需要此類能力的數學和指令遵循基準測試中表現顯著提升。

贊助商廣告

智能體工作流：原生支持函數調用、結構化JSON輸出和原生系統指令，讓您能構建可與不同工具和API交互並可靠執行工作流的自主智能體。

代碼生成：Gemma 4支持高質量離線代碼，將您的工作站變成本地優先的AI代碼助手。

視覺和音頻：所有模型都原生處理影片和圖像，支持可變解析度，在OCR和圖表理解等視覺任務中表現出色。此外，E2B和E4B模型具備原生音頻輸入功能，用於語音識別和理解。

更長上下文：無縫處理長篇內容。邊緣模型具有128K上下文窗口，大型模型可達256K，讓您能在單個提示中傳遞代碼庫或長文檔。

140多種語言：在超過140種語言上原生訓練，Gemma 4幫助開發者為全球受眾構建包容性高性能應用。

適配多樣化硬體的通用模型

我們發布的Gemma 4模型權重針對特定硬體和用例定製，確保您在任何需要的地方都能獲得前沿推理能力。

為研究人員和開發者提供在可及硬體上的頂尖推理能力，我們的未量化bfloat16權重可高效適配單個80GB NVIDIA H100 GPU。對於本地設置，量化版本可在消費級GPU上原生運行，為IDE、編程助手和智能體工作流提供支持。26B混合專家（MoE）專注延遲優化，推理時僅激活總參數中的38億個，實現極快的每秒Token數，而31B密集型最大化原始質量，為微調提供強大基礎。

從頭設計以實現最大計算和記憶體效率，這些模型在推理時激活有效的20億和40億參數占用，以保持RAM和電池續航。通過與Google Pixel團隊以及高通科技和聯發科等移動硬體領導者的密切合作，這些多模態模型可在手機、樹莓派、NVIDIA Jetson Orin Nano等邊緣設備上完全離線運行，延遲接近零。Android開發者現在可以在AICore開發者預覽版中構建智能體流程原型，與Gemini Nano 4向前兼容。

開源許可證

您提供了反饋，我們傾聽了。構建AI未來需要協作方式，我們相信在沒有限制性障礙的情況下賦能開發者生態系統。因此，Gemma 4在商業友好的Apache 2.0許可證下發布。

贊助商廣告

這個開源許可證為完整的開發者靈活性和數字主權提供基礎；讓您完全控制數據、基礎設施和模型。它允許您自由構建並在任何環境中安全部署，無論是本地部署還是雲端。

建立在信任與安全基礎上

這些模型經歷了與我們專有模型相同的嚴格基礎設施安全協議。選擇Gemma 4，企業和主權組織獲得可信、透明的基礎，在滿足最高安全性和可靠性標準的同時提供頂尖能力。

選擇生態系統

立即開始實驗：立即訪問Gemma 4並開始構建。在Google AI Studio（31B和26B MoE）或Google AI Edge Gallery（E4B和E2B）中探索Gemma 4。對於Android開發，使用它在Android Studio中為智能體模式提供支持，並使用ML Kit GenAI Prompt API開始為Android構建生產應用。

使用您喜愛的工具：首日支持Hugging Face（Transformers、TRL、Transformers.js、Candle）、LiteRT-LM、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM和NeMo、LM Studio、Unsloth、SGLang、Cactus、Basetan、Docker、MaxText、Tunix、Keras，您可以靈活選擇最適合項目的工具。

下載模型：從Hugging Face、Kaggle或Ollama獲取模型權重。

定製Gemma 4以滿足特定需求：使用您偏好的平台（如Google Colab、Vertex AI或遊戲GPU）訓練和調整模型。

在Google Cloud上擴展到生產：雖然本地設備端推理適合離線使用，Google Cloud消除了所有計算限制。通過Vertex AI、Cloud Run、GKE、主權雲、TPU加速服務和受監管工作負載的最高合規保證進行部署。

在多個硬體平台上加速AI開發：Gemma 4針對業界領先硬體開箱即用優化。在從NVIDIA Jetson Orin Nano到Blackwell GPU的NVIDIA AI基礎設施上體驗最大性能，通過開源ROCm(TM)堆棧與AMD GPU集成，或在Trillium和Ironwood TPU上部署以實現大規模和效率。

參與影響力競賽：加入Kaggle上的Gemma 4 Good挑戰賽，構建在世界上創造有意義積極變化的產品。

Q&A

Q1：Gemma 4有哪些不同規格的模型？

A：Gemma 4發布四種規格：高效2B（E2B）、高效4B（E4B）、26B混合專家（MoE）和31B密集型。E2B和E4B專為邊緣設備優化，支持多模態和音頻輸入；26B MoE專注延遲優化，推理時僅激活38億參數；31B密集型追求最高質量，適合微調。

贊助商廣告

Q2：Gemma 4相比其他開放模型性能如何？

A：Gemma 4在性能上表現卓越，31B模型在Arena AI文本排行榜中排名全球開放模型第3位，26B模型位列第6。更重要的是，Gemma 4的表現超越了體積大20倍的模型，在智能密度方面實現了突破，讓開發者能以更少硬體開銷獲得前沿能力。

Q3：如何開始使用Gemma 4？

A：您可以通過多種方式開始使用：在Google AI Studio或Google AI Edge Gallery中直接體驗，從Hugging Face、Kaggle或Ollama下載模型權重，使用Google Colab或Vertex AI進行定製訓練。Gemma 4支持140多種語言，提供128K-256K上下文窗口，並在Apache 2.0許可證下開源。