MTIA展現成果
Facebook母公司Meta正在測試第一顆自主研發、用於訓練AI系統的RISC-V架構晶片,定製化設計的晶片符合Meta運算需求,並降低對NVIDIA等晶片大廠的依賴。
路透社引述2名知情人士消息指出,Meta開始小規模部署自研晶片,並計劃在完成測試後量產,為自家服務提供支持。
一名知情人士表示,Meta新晶片是一款AI加速器,僅處理AI任務,可比同樣用於AI工作負載的GPU更省電。另一知情人士則稱,Meta正與台積電合作生產自研晶片。
測試部署是在自研晶片完成設計定案(即所謂tape-out)後展開,表示其設計送交晶片代工廠進行生產。一次tape-out成本可達數千萬美元,大約需要3-6個月完成,且無法保證測試必定成功。萬一失敗,Meta需要找出晶片設計問題並重新tape-out步驟。
這款自研晶片專為AI訓練設計,也就是用來處理大量數據文件,預期將采HBM3或HBM3E內存。定製化設計下,對晶片尺寸、功耗及性能優化。性能方面,這款需要在每瓦性能表現能與NVIDIA最新GPU(如H200、B200,甚至是下一代B300等)競爭。
然而針對此事,Meta與台積電均拒絕發布任何評論。
自研晶片是Meta長期計劃的一部分,目的是降低AI基礎設施所帶來的成本。實際上,Meta預估2025年總支出介於1,140-1,190億美元之間,其中資本支出高達650億美元,主要用於構建AI基礎設施。
2024年Meta公開MTIA v1後繼產品,暫稱下一代MTIA(Next Gen MTIA)。(Source:Meta)
這款自研晶片是MTIA(Meta Training and Inference Accelerator)系列最新成果,這項開發計劃經歷波折,直到2024年Meta開始使用MTIA進行推理工作,用於決定Facebook與Instagram動態消息顯示的內容推薦系統。Meta高層表示,希望2026年開始在AI訓練階段使用自家晶片。
「我們正在研究如何訓練推薦系統,最終考慮如何對生成式AI進行訓練和推理」,Meta首席產品官Chris Cox在上周舉行的摩根史坦利科技、媒體和電信大會表示。他形容Meta的晶片開發任務目前處於「從走路到爬行再到奔跑」的階段,內部認為用於內容推薦系統的第一代推理晶片是一大成功。
Meta之前曾在一次小規模測試部署中,推出一款自研推理晶片,但由於表現不佳而取消,轉而在2022年下單採購數十億美元的NVIDIA GPU。自此之後,Meta成為NVIDIA一大客戶,累積大量GPU用於訓練模型,包括用於內容推薦與廣告系統、以及大型語言模型Llama,同時也為每天使用Meta旗下社交媒體超過30億人執行推理工作。
(首圖來源:shutterstock)