宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Gemma 4:最強開放模型重磅發布,性能密度創新高

2026年04月03日 首頁 » 熱門科技

今天,我們正式推出Gemma 4——迄今為止最智能的開放模型。Gemma 4專為高級推理和智能體工作流而設計,在智能密度方面實現了前所未有的突破。自首代產品發布以來,開發者已下載Gemma超過4億次,構建了超過10萬個變體的活躍生態系統。我們深入了解創新者的需求,Gemma 4就是我們的答案:在Apache 2.0許可證下提供突破性能力。

基於與Gemini 3相同的世界級研究和技術構建,Gemma 4是您硬體上可運行的最強模型系列。它們與我們的Gemini模型相輔相成,為開發者提供業界最強大的開放和專有工具組合。

行業領先能力與移動優先AI

我們發布四種規格的Gemma 4:高效2B(E2B)、高效4B(E4B)、26B混合專家(MoE)和31B密集型。整個系列超越簡單對話,能夠處理複雜邏輯和智能體工作流。大型模型在同等規模中表現卓越,31B模型在業界標準Arena AI文本排行榜中排名全球開放模型第3位,26B模型位列第6。Gemma 4的表現超越了體積大20倍的模型。對開發者而言,這種新的智能密度意味著以更少的硬體開銷實現前沿能力。

在邊緣計算方面,E2B和E4B模型重新定義設備端實用性,優先考慮多模態能力、低延遲處理和無縫生態系統集成。

強大、易用、開放

為推動下一代開創性研究和產品,我們專門調整了Gemma 4模型規格,使其能在各種硬體上高效運行和微調——從全球數十億Android設備到筆記本GPU,再到開發工作站和加速器。

通過使用這些高度優化的模型,您可以微調Gemma 4以在特定任務上實現頂尖性能。我們已經看到這種方法的巨大成功;例如,INSAIT創建了開創性的保加利亞語優先語言模型(BgGPT),我們與耶魯大學合作開發Cell2Sentence-Scale以發現癌症治療新途徑等。

以下是Gemma 4成為我們最強開放模型系列的特色:

高級推理:具備多步驟規劃和深度邏輯能力,Gemma 4在需要此類能力的數學和指令遵循基準測試中表現顯著提升。

智能體工作流:原生支持函數調用、結構化JSON輸出和原生系統指令,讓您能構建可與不同工具和API交互並可靠執行工作流的自主智能體。

代碼生成:Gemma 4支持高質量離線代碼,將您的工作站變成本地優先的AI代碼助手。

視覺和音頻:所有模型都原生處理影片和圖像,支持可變解析度,在OCR和圖表理解等視覺任務中表現出色。此外,E2B和E4B模型具備原生音頻輸入功能,用於語音識別和理解。

更長上下文:無縫處理長篇內容。邊緣模型具有128K上下文窗口,大型模型可達256K,讓您能在單個提示中傳遞代碼庫或長文檔。

140多種語言:在超過140種語言上原生訓練,Gemma 4幫助開發者為全球受眾構建包容性高性能應用。

適配多樣化硬體的通用模型

我們發布的Gemma 4模型權重針對特定硬體和用例定製,確保您在任何需要的地方都能獲得前沿推理能力。

為研究人員和開發者提供在可及硬體上的頂尖推理能力,我們的未量化bfloat16權重可高效適配單個80GB NVIDIA H100 GPU。對於本地設置,量化版本可在消費級GPU上原生運行,為IDE、編程助手和智能體工作流提供支持。26B混合專家(MoE)專注延遲優化,推理時僅激活總參數中的38億個,實現極快的每秒Token數,而31B密集型最大化原始質量,為微調提供強大基礎。

從頭設計以實現最大計算和記憶體效率,這些模型在推理時激活有效的20億和40億參數占用,以保持RAM和電池續航。通過與Google Pixel團隊以及高通科技和聯發科等移動硬體領導者的密切合作,這些多模態模型可在手機、樹莓派、NVIDIA Jetson Orin Nano等邊緣設備上完全離線運行,延遲接近零。Android開發者現在可以在AICore開發者預覽版中構建智能體流程原型,與Gemini Nano 4向前兼容。

開源許可證

您提供了反饋,我們傾聽了。構建AI未來需要協作方式,我們相信在沒有限制性障礙的情況下賦能開發者生態系統。因此,Gemma 4在商業友好的Apache 2.0許可證下發布。

這個開源許可證為完整的開發者靈活性和數字主權提供基礎;讓您完全控制數據、基礎設施和模型。它允許您自由構建並在任何環境中安全部署,無論是本地部署還是雲端。

建立在信任與安全基礎上

這些模型經歷了與我們專有模型相同的嚴格基礎設施安全協議。選擇Gemma 4,企業和主權組織獲得可信、透明的基礎,在滿足最高安全性和可靠性標準的同時提供頂尖能力。

選擇生態系統

立即開始實驗:立即訪問Gemma 4並開始構建。在Google AI Studio(31B和26B MoE)或Google AI Edge Gallery(E4B和E2B)中探索Gemma 4。對於Android開發,使用它在Android Studio中為智能體模式提供支持,並使用ML Kit GenAI Prompt API開始為Android構建生產應用。

使用您喜愛的工具:首日支持Hugging Face(Transformers、TRL、Transformers.js、Candle)、LiteRT-LM、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM和NeMo、LM Studio、Unsloth、SGLang、Cactus、Basetan、Docker、MaxText、Tunix、Keras,您可以靈活選擇最適合項目的工具。

下載模型:從Hugging Face、Kaggle或Ollama獲取模型權重。

定製Gemma 4以滿足特定需求:使用您偏好的平台(如Google Colab、Vertex AI或遊戲GPU)訓練和調整模型。

在Google Cloud上擴展到生產:雖然本地設備端推理適合離線使用,Google Cloud消除了所有計算限制。通過Vertex AI、Cloud Run、GKE、主權雲、TPU加速服務和受監管工作負載的最高合規保證進行部署。

在多個硬體平台上加速AI開發:Gemma 4針對業界領先硬體開箱即用優化。在從NVIDIA Jetson Orin Nano到Blackwell GPU的NVIDIA AI基礎設施上體驗最大性能,通過開源ROCm(TM)堆棧與AMD GPU集成,或在Trillium和Ironwood TPU上部署以實現大規模和效率。

參與影響力競賽:加入Kaggle上的Gemma 4 Good挑戰賽,構建在世界上創造有意義積極變化的產品。

Q&A

Q1:Gemma 4有哪些不同規格的模型?

A:Gemma 4發布四種規格:高效2B(E2B)、高效4B(E4B)、26B混合專家(MoE)和31B密集型。E2B和E4B專為邊緣設備優化,支持多模態和音頻輸入;26B MoE專注延遲優化,推理時僅激活38億參數;31B密集型追求最高質量,適合微調。

Q2:Gemma 4相比其他開放模型性能如何?

A:Gemma 4在性能上表現卓越,31B模型在Arena AI文本排行榜中排名全球開放模型第3位,26B模型位列第6。更重要的是,Gemma 4的表現超越了體積大20倍的模型,在智能密度方面實現了突破,讓開發者能以更少硬體開銷獲得前沿能力。

Q3:如何開始使用Gemma 4?

A:您可以通過多種方式開始使用:在Google AI Studio或Google AI Edge Gallery中直接體驗,從Hugging Face、Kaggle或Ollama下載模型權重,使用Google Colab或Vertex AI進行定製訓練。Gemma 4支持140多種語言,提供128K-256K上下文窗口,並在Apache 2.0許可證下開源。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新