谷歌今日宣布,其DeepMind AI研究部門正式發布Gemma 4,這是最新一代開源大語言模型。該模型採用Apache 2.0許可證發布,相比早期Gemma版本的受限許可證,這次實現了真正的開源。
Gemma與Gemini同樣都是大語言模型,但這裡我們討論的是AI處理引擎,而非聊天機器人界面。Gemma和Gemini都基於相同的研究和技術開發。區別在於Gemini是基於訂閱的封閉產品,而Gemma是可免費下載並在本地運行的開源模型。
本地運行AI模型而無需付費的能力為各種應用帶來了益處。許多用戶希望在家中運行AI,無需依賴雲端,且完全免費。
本地運行能力對於有數據主權或保密要求的企業尤其重要。例如,醫療服務提供商可能面臨監管限制,無法與公有雲提供商共享患者數據,但仍希望從AI中受益。通過在本地運行整個系統,無數據發送到雲端,但AI能力仍然可用。
從智慧型手機到各種物聯網和邊緣設備,許多設備可能只有間歇性網路連接(或完全沒有)。能夠在無額外成本和無需連接外網的情況下運行AI操作,在靈活性、安全性和成本控制方面提供了顯著優勢。
因此,雖然你可能在聊天界面中運行Gemini,但可以在樹莓派上安裝Gemma來監控工廠流程並實時做出決策,避免往返雲端的延遲。
早期版本的Gemma採用Gemma使用條款聲明許可,而非正式的開源許可結構。谷歌允許用戶下載Gemma,在本地使用並進行修改,但限制使用範圍為批准類別,並限制重新分發。
這種方式允許該模型系列被稱為"開放"但不是"開源"。使用Gemma有很多自由度,但谷歌仍保持控制權。
相比之下,Apache 2.0許可證授予近乎完全的自由。用戶和開發者可以將軟體用於任何目的,無論是個人、商業還是企業用途,且無需支付版稅。如果分發軟體,需要包含Apache 2.0許可證副本並提供必要的軟體歸屬聲明。
用戶和開發者可以自由修改和重新分發代碼,有權創建衍生作品並分發原版和修改版本。
Apache 2.0許可證還有一些有趣的專利相關保護和處罰條款。在保護方面,Apache 2.0許可的用戶獲得涵蓋貢獻的任何專利許可,因此專利訴訟不能僅因使用軟體而針對用戶。另一方面,如果你起訴某人聲稱軟體侵犯了你的專利,你將自動失去使用該軟體的許可。
谷歌不再為Gemma 4使用自己的使用條款。相反,他們在Apache 2.0許可證下許可Gemma 4,這意味著用戶和開發者可以無限制地以任何方式使用和分發該模型。
自2024年2月Gemma發布兩年來,這個開源模型獲得了相當大的採用。
據谷歌DeepMind研究副總裁Clement Farabet和集團產品經理Olivier Lacombe表示,"自首代產品發布以來,開發者已下載Gemma超過4億次,構建了一個擁有超過10萬個變體的充滿活力的Gemma生態系統。"
現在,Gemma 4作為純開源軟體發布,這意味著我們可以預期採用率將超過過去26個月所見的情況。我們不僅可以預期看到Gemma 4被更多項目採用,而且現在確實可以將AI與能夠從強大板載模型中受益的產品、服務和設備捆綁在一起。
Gemma 4實際上是一個四模型套件。其中兩個模型專為配備強大GPU(如英偉達
H100)的高端伺服器設計。這些模型稱為26B和31B,具有大參數占用空間。26B版本專注於減少延遲,在推理時激活其總參數集的子集。31B模型旨在最大化原始功能和質量,將其所有能力應用於任何要求解決的問題。
另外兩個模型專為低端設計。稱為E2B和E4B,這些模型面向移動和物聯網設備,儘管它們在家用PC上也能很好運行。這些模型分別具有20億和40億參數占用空間,限制設備影響,以便在移動和邊緣設備上高效運行。
據谷歌的Farabet和Lacombe表示,"與我們的谷歌Pixel團隊以及高通科技和聯發科等移動硬體領導者密切合作,這些多模態模型在手機、樹莓派和Jetson Nano等邊緣設備上完全離線運行,延遲接近零。"
公司表示所有模型都支持以下功能:文本生成、多語言支持、代碼生成和理解、數學推理、圖像理解和文檔解析。
在他們的部落格文章中,Farabet和Lacombe說:"Gemma 4的表現超越了20倍大小的模型。對開發者來說,這種新的智能參數比水平意味著以顯著更少的硬體開銷實現前沿級別的能力。"
Q&A
Q1:Gemma 4與Gemini有什麼區別?
A:Gemma 4是開源大語言模型,可免費下載並在本地運行,而Gemini是基於訂閱的封閉產品。兩者都基於相同的研究和技術開發,但Gemma 4給用戶更多自由度,無需依賴雲端服務。
Q2:Apache 2.0許可證為什麼比之前的許可更好?
A:Apache 2.0許可證授予近乎完全的自由,用戶可將軟體用於任何目的且無需支付版稅,可以自由修改和重新分發代碼。而之前的Gemma使用條款限制使用範圍並限制重新分發,谷歌仍保持控制權。
Q3:Gemma 4包含哪些不同的模型版本?
A:Gemma 4包含四個模型:26B和31B專為高端伺服器設計,其中26B專注減少延遲,31B追求最大功能;E2B和E4B專為移動和物聯網設備設計,參數分別為20億和40億,可在手機、樹莓派等邊緣設備上高效運行。






