英偉達在今年的GTC 2026上,發布了Groq 3 LPU
,採用了三星4nm工藝製造,屬於Vera Rubin平台
的第7款晶片。Groq 3 LPU將與之前公布的其他6款晶片一起協同運作,構成一台強大的AI超級電腦,可為AI的各個階段提供動力——從大規模預訓練、後訓練、測試階段擴展到實時智能體式推理。熟悉英偉達數據中心產品的人可能會提出一個問題,去年9月推出的Rubin CPX去哪裡了?

Rubin CPX
是一款專為大規模上下文推理而設計的新款GPU,是英偉達第一款專為大規模上下文AI應用場景打造的CUDA GPU,其中模型可以同時對數百萬個tokens進行推理。去年10月GTC DC 2025大會上展示的路線圖裡,可以看到Rubin CPX的身影。
如果再對照這次GTC 2026展示的路線圖,會發現Rubin CPX被移除了,但是卻包含了LP30 LPU
及對應的Groq 3 LPX機架,這表明英偉達規劃的方向很可能發生了變化,現在已經將重點放在了後者。按照英偉達的說法,LPU是以極低的延遲提供顯著的推理性能,其中依賴內部的SRAM
,而SRAM比任何DRAM速度都要更快、延遲更低、功耗也更低。


圖:上為GTC DC 2025上的路線圖,下為這次GTC 2026上的路線圖
根據英偉達公布的數據,LP30配有512MB的SRAM,可提供1.2 PFLOPS的FP8算力,而Rubin CPX配有128GB的GDDR7,可提供30 PetaFLOPS的NVFP4算力,可是延遲要高得多。






