宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

探秘慶陽算力樞紐:「燧弘華創+聯想」樹立智能計算新標杆

2025年03月31日 首頁 » 熱門科技

慶陽,作為全國一體化算力網路國家樞紐節點和國家數據中心集群,是「東數西算」工程的重要樞紐,也是冉冉升起的「中國算谷」。

走進慶陽算力網路國家樞紐節點的燧弘華創智算中心機房,一場算力的變革悄然上演——燧弘華創與聯想聯合部署的AI伺服器集群中單機伺服器,在3000並發下實現DeepSeek探秘慶陽算力樞紐:「燧弘華創 聯想」樹立智能計算新標杆 671B大模型極限吞吐超8000 tokens/s,刷新了行業標杆。

這一成績的背後,離不開聯想萬全異構智算平台。通過訪存優化、顯存優化、PCIe 5.0全互聯架構創新以及精選SGLang框架中性能最優算子等諸多領先創新方式,將單機伺服器運行DeepSeek的性能提升到新的高度。

從「可用」到「好用」 「一橫五縱」加速創新生態

自現象級「國民大模型」DeepSeek 橫空出世以來,算力格局與 AI 應用格局均被極大改變,前所未有地降低了大模型部署成本,極大拓展了覆蓋面,以較低水平達到國際領先。在全國政協委員、中科院計算所研究員張雲泉看來,DeepSeek 的誕生標誌著 AI 領域迎來新的技術突破,尤其在低算力訓練與高效率模型優化方面成果顯著,將推動 AI 技術朝著更高效、更普惠的方向發展。

張雲泉認為,這一突破促使全球市場重新審視大模型發展的成本曲線,推動晶片、雲計算等基礎設施加速升級。他還提到,在此趨勢下,平台化建設需加力。通過平台賦能,能為更多創業者提供支持,藉助平台建設創新生態,讓各方在同一生態與平台上共同發展、借力前行,降低成本與開銷。

全國政協委員,中科院計算所研究員張雲泉

「聯想萬全異構智算平台,便是這樣的平台」張雲泉說。

萬全異構智算平台在聯想的技術布局中占據重要地位,自2024 年推出後便成為焦點。該平台整合了伺服器、存儲、網路等資源,形成適用於各種 AI 場景的集群方案。

聯想中國基礎設施業務群戰略總監黃山表示,作為領先的AI基礎設施提供商,聯想憑藉聯想萬全異構智算平台應對智算挑戰,以領先的液冷技術持續解決能效和能耗難題,為千行萬業輸送真正 「好用」 的算力。

探秘慶陽算力樞紐:「燧弘華創 聯想」樹立智能計算新標杆

聯想中國基礎設施業務群戰略總監 黃山

黃山坦言,萬全異構智算平台是聯想AI基礎設施「一橫五縱」戰略中的核心,一直以來,聯想持續全力推進「一橫五縱」戰略布局,全面推出覆蓋萬全異構智算平台,以及涵蓋伺服器、存儲、數據網路、軟體及超融合、支持運維服務等在內的全方位基礎設施解決方案。

「一橫五縱」 指的是以萬全異構智算平台(一橫)為核心,以伺服器、存儲、數據網路、軟體及超融合、邊緣計算五大產品(五縱)為依託,為市場帶來覆蓋通用、AI、科學算力等全場景的算力支持。這些基礎組件相互協作,將為整個AI 體系提供穩定支撐。

通過萬全異構智算平台,可實現對算力的統一管理調度。其中包括對各家 GPU 的基礎軟體站、算子庫驅動 SDK 的集成,算力庫的共同開發,以及對 HPC 和 AI 的統一管理,其核心聚焦於 AI 計算加速的底層技術。這一架構使得聯想能夠將下層的各類設施產品整合為完整的算力輸出方案,並通過深度調優手段,達成最優的計算效率。這種全面且精細的布局,為聯想在智能體應用等前沿領域的拓展提供了有力保障。

「聯想作為領先的AI基礎設施提供商,憑藉聯想萬全異構智算平台應對智算挑戰,以領先的液冷技術持續解決能效和能耗難題,正為千行萬業輸送真正 「好用」 的算力,從而有力推動智能化轉型和產業升級。」黃山說。

五大「異構創新」 加速DeepSeek高效落地

在加速DeepSeek大模型落地中,萬全異構智算平台展現出強大的優勢。

其一,多元異構混合算力納管。萬全異構智算平台展現出了強大的兼容性,能夠納管來自眾多合作夥伴的不同算力晶片。通過設計抽象算力模型和使用接口,該平台成功隱藏了異構 AI 晶片底層硬體和 AI 軟體棧的差異,極大地簡化了異構混合 AI 算力的使用流程,讓用戶能夠輕鬆駕馭複雜的算力資源。

其二,GPU核心態虛擬化。在GPU 驅動層,平台創新性地開發了核心態虛擬化算法。藉助自研的核心態顯存隔離、時間片輪轉算法以及算力調度等技術,在每個時間片調度周期內對顯存和算力進行精準隔離。這一技術的優勢在於,它能將一塊物理 GPU 設備虛擬成多塊邏輯設備,供多個用戶同時使用,且用戶幾乎無感知。更為重要的是,它將虛擬化造成的 GPU 算力損耗控制在了 5% 以下,顯著提升了集群內 GPU 的整體利用率。

其三,大模型訓練的彈性容錯。在大模型等 AI 任務的大規模分布式訓練、微調場景中,萬全異構智算平台內置的高效分布式訓練容錯機制(斷點續訓)發揮著關鍵作用。當節點發生軟硬體故障時,該系統能夠自動快速回滾到上一次檢查點,確保訓練任務的正常推進。通過自研的 AI 硬體故障預測、實時故障感知、檢查點優化等技術,大大加速了斷點續訓的故障恢復過程,為大模型訓練的穩定性和連續性提供了有力保障。

「我們採用異步方式,先在內存中進行日誌記錄(log down)並執行檢查點(check point)操作。由於這一檢查點操作是異步的,因此對整個訓練過程的干擾極小。」聯想中國基礎設施業務群戰略總監黃山強調。

聯想中國基礎設施業務群高級產品經理郭晉兵舉例說:「通過異步多級緩存,得以保存訓練的中間狀態,故障恢復時從斷點同步重啟,從而減少訓練中斷損耗。故障恢復耗時僅0.01毫秒,比傳統開源方案快20-30倍。」

探秘慶陽算力樞紐:「燧弘華創 聯想」樹立智能計算新標杆

聯想中國基礎設施業務群高級產品經理  郭晉兵

其四,AI 高層編譯訓推優化。萬全異構智算平台內置的AI高層編譯優化工具鏈獨具特色。其自研的全新動態形狀捕獲和 IR 表達機制,能夠對數據流和控制流子任務進行高效拆分。通過全自動化的計算圖優化,並自動生成匹配特定架構的高性能算子,在確保計算精度的前提下,大幅提升了計算效率,為 AI 模型的訓練和推理提供了強大的支持。

其五,高性能互連與集合通信。該平台的自研高性能集合通信庫同樣亮點十足。它巧妙利用多層次異構拓撲感知和硬體互聯特性,結合網路擁塞主動探測和避免技術,以及針對 AI 等應用負載領域特性相關的通信、計算調度優化等技術,有效降低了通信開銷,顯著提升了 AI 和 HPC 任務的整體運行性能。

探秘慶陽算力樞紐:「燧弘華創 聯想」樹立智能計算新標杆

聯想與燧弘華創的「東數西算」實踐

自2023 年起,燧弘華創便深耕甘肅,積極投身於慶陽數據中心的建設工作中。

作為慶陽算力集群的先行者,燧弘華創憑藉其燧弘慶陽綠色智算中心,以及在慶陽市構建AI全產業鏈生態的卓越成就,榮獲了「全國一體化算力網路國家樞紐節點(甘肅·慶陽)首批萬P算力建設突出貢獻企業」的榮譽稱號。

2023年,經甘肅省政府引入,燧弘華創的前身弘信電子與慶陽市政府合作簽署了戰略協議,成為慶陽算力樞紐節點的重要組成部分,並與合作夥伴聯想一道,為甘肅算力產業的騰飛貢獻力量。

燧弘華創執行總裁唐鋒透露,自2023年起,燧弘華創深耕甘肅,助力慶陽從「東數西算」樞紐末位躍升至全國第一方陣。 

燧弘華創執行總裁  唐鋒

在技術優勢與產業實踐的深度融合中,慶陽「東數西算」樞紐展現出強勁的算力進化動能。而聯想萬全異構智算平台的性能創新,以及聯想問天伺服器的強大算力基座,不僅為超智融合技術落地提供了硬體支撐,更通過軟硬協同優化打通了算力資源高效調用的關鍵路徑。

黃山回憶說:「當時,慶陽數據中心正面臨轉型。此前,一直致力於開展裸金屬業務,後來則計劃向大廠以外的客戶出租資源。在此過程中,雲服務能力、底層調優能力以及自主運維能力成為必備要素。

「就慶陽本地而言,在雲服務領域,合作方並非僅有聯想一家。但在底層調優能力方面,聯想憑藉領先優勢成為慶陽的重點合作對象。」黃山坦言。

據悉,2024年9月,255台聯想問天WA 5480 G38卡GPU伺服器,完成在慶陽國家級樞紐節點的交付,總的GPU卡部署數量達2040卡,智算能力達到1275P。聯想問天WA 5480 G3伺服器搭載了第四代英特爾®至強®可擴展處理器,其擁有強大的計算能力,同時內置了眾多加速器,如英特爾®高級矩陣擴展(Intel® AMX)加速器可大幅提升AI訓練和推理性能,是智算中心建設的首選。

英特爾高性能計算行業總監張東升表示:「超智融合技術作為近年來全球計算領域熱點話題,其核心思想是將超算與智算的能力相結合,以滿足在人工智慧高速發展背景下的各行業多元算力需求。」

探秘慶陽算力樞紐:「燧弘華創 聯想」樹立智能計算新標杆

英特爾高性能計算行業總監 張東升

在應用落地和調優方面,郭晉兵現場演示了聯想萬全異構智算平台如何加速DeepSeek大模型落地。聯想及其生態夥伴在慶陽搭建的聯想萬全異構智算平台,在管理142節點千卡進行DeepSeek後訓練時,以調優技術使得訓練MFU高達60%以上,在訓練期間人為加入多類故障後進行故障斷點續訓的時間小於1分鐘。

郭晉兵同時展示了通過聯想萬全異構智算平台的核心態虛擬化技術,以單GPU卡運行100個模型任務的實例。此外,郭晉兵還演示了DeepSeek 671B FP8單機8卡性能,極限總吞吐高達8000 tokens/s!通過現場演示,聯想萬全異構智算平台已驗證其在推理加速、訓練優化、斷點續訓、核心級虛擬化等大模型推理優化場景具有明顯優勢。

談及未來,黃山表示,2024 年,聯想主要服務於大型智算中心,燧弘華創、北大、吉利等都是典型的優質客戶,進入 2025 年,聯想將與智算中心攜手服務千行百業。以推理服務、智能體開放平台,以及智能體開發平台,進一步拓展生態布局,並自下而上地構建完善行業標準。

黃山強調說:「近期,聯想與異構智算產業生態聯盟聯合發布了業界方案白皮書。新的一年,我們還將共同制定高性能大模型訊推標準等行業標準,持續推動行業規範化發展。

「此外,作為全國第一批倡導的AIPC探秘慶陽算力樞紐:「燧弘華創 聯想」樹立智能計算新標杆的企業,聯想目前已經實現在端側部署DeepSeek7B、32B的產品升級,同時通過異構算力,不斷豐富私有化部署和本地化部署的AI體驗。」黃山說。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新