宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

當架構為AI而生,Arm Lumex CSS成為移動計算新基石

2025年09月17日 首頁 » 熱門科技

AI的想像力正在無限擴張,但要把它落地為真實體驗,卻不僅是模型突破那麼簡單,還意味著硬體與軟體體系的重構。隨著加速晶片解決方案層出不窮,性能上限不斷被刷新,但也帶來前所未有的複雜性、更繁重的系統集成以及成本的持續攀升,工程團隊與商業模式都面臨巨大的壓力。

這些變量匯聚在一起,塑造了Arm計算平台的演進方向。

「人工智慧正以前所未有的速度推動計算技術的演進。」Arm高級副總裁兼終端事業部總經理Chris Bergey說道。無論是模型、框架,還是應用場景,幾乎以「每周變化」的節奏快速發展,這意味著計算能力不僅需要不斷擴展,還必須保持足夠的靈活性,才能跟上創新的步伐。

在這種快速疊代的背景下,算力的競爭已經不再只是單點性能的比拼,而是平台化、體系化的持續進化。Arm選擇在架構層面重新定義計算底座,用靈活、可擴展的方式回應AI的不確定性與爆發力。

當架構為AI而生ArmLumexCSS成為移動計算新基石

Arm高級副總裁兼終端事業部總經理Chris Bergey

打開移動設備AI創新的全新入口

Arm Unlocked 2025 AI峰會上海站上,Arm 推出了全新Lumex計算子系統 (Compute Subsystem, CSS) 平台,該平台集成了搭載第二代可伸縮矩陣擴展 (SME2) 技術的最高性能Arm CPU、GPU及系統IP。助力生態夥伴更快將AI設備推向市場,同時支持桌面級移動遊戲、實時翻譯、智能助手及個性化應用等多樣的豐富體驗。

Arm Lumex CSS平台聚焦移動設備領域,致力於為從旗艦智慧型手機到平板電腦等移動設備,提供頂級CPU與GPU性能,成為支撐下一代AI與個人計算發展的核心底座。

Lumex CSS是完整的「AI優先」平台,標誌著Arm的平台戰略和Armv9計算架構的又一次進化。從Armv8到搭載SVE2的Armv9架構,Arm始終將「可擴展性」作為推動AI在各類設備廣泛應用的關鍵。如今,搭載SME2的Armv9.3架構在AI計算領域實現了又一次重要突破。

CPU方面,全新的Arm C1-Ultra是迄今性能最強的CPU產品,與上一代 Arm Cortex-X925 CPU相比,為設備帶來高達25%的單線程峰值性能提升,能夠輕鬆應對最嚴苛的AI與計算負載。針對功耗敏感場景,經過能效優化的Arm C1-Pro在同等性能下較 Cortex-A725帶來多達 12%的能效提升,為輕量化與長續航應用提供了理想選擇。

GPU方面,Mali G1-Ultra在性能和能效之間實現了平衡,推理性能最高提升20%的同時,每幀功耗降低 9%,為新一代移動設備帶來更流暢的圖形與AI體驗。

當架構為AI而生ArmLumexCSS成為移動計算新基石

目前搭載Arm GPU的晶片出貨量已突破120億顆,Arm不僅深度參與移動圖形領域,更持續引領行業前行。全新Mali G1-Ultra通過先進光線追蹤技術,將桌面級遊戲體驗帶到移動端,重新定義智慧型手機圖形處理標準。

本次 Lumex CSS 的最大亮點在於,Arm 為全線 C1 CPU 集成了 SME2 技術,該技術可有效提升端側 AI 功能運行速度。對於 Arm 合作夥伴和開發者生態系統而言,相較於未啟用 SME2 特性的硬體,這些提升能顯著加速不同工作負載和用例中的 AI 性能。在Whisper Base上語音識別延遲降低4.7倍,在Google Gemma 3模型上進行經典大語言模型的聊天交互時,AI性能提升4.7倍,在Stability AI Stable Audio模型上生成音頻,速度提升2.8倍。對於開發者和終端用戶而言,這些改進不僅是數據上的提升,更意味著全新的交互方式與體驗邊界正在被重塑。

此外,Arm Lumex CSS平台通過KleidiAI與各大主流框架的集成,包括PyTorch ExecuTorch、Google LiteRT、阿里巴巴MNN及微軟ONNX Runtime,開發者無需修改任何代碼,即可自動取得 SME2的加速能力。

Arm Lumex CSS平台,為擴展而生,為AI時代而設計,是驅動未來移動創新的全新起點。Chris Bergey強調,無論是OEM廠商,還是應用開發者,Arm Lumex CSS平台都將成為在關鍵邊緣場景中交付個性化、私密化、高性能AI的核心工具。

將創新前沿落地到用戶體驗中

在智能終端與移動計算的演進進程中,Arm一直是不可或缺的技術引擎。隨著全新Arm Lumex CSS平台及其與SME2技術的原生集成,產業鏈上下游正在以前所未有的深度聯動,將前沿創新落地到用戶體驗中。

在vivo高級副總裁、首席技術官施玉堅看來,智慧型手機產業的每一次躍遷,都離不開Arm 在微架構與計算技術方面的持續突破。作為首個與Arm共建聯合實驗室的終端品牌,vivo不僅與晶片平台廠商協作,在手機中率先落地Arm的先進計算技術,更將真實用戶場景引入微架構優化,實現從底層特性到最終體驗的全鏈路打磨。

在SME2的探索上,vivo從2023年起便著手研究其在多類AI任務中的適用路徑,並在自研的VCAP計算加速平台上全面支持SME2指令集。在全局離線翻譯等場景中,SME2的引入讓性能突破過往最優上限,實現額外20%性能收益。

Arm最新一代的高性能計算技術以及SME2等先進特性,將在即將發布的全新X系列旗艦產品上得到完整呈現。

如果說vivo的探索體現了從硬體底層到終端體驗的打磨,那麼支付寶的實踐,則顯示了 SME2在超大規模應用中的價值。作為日均執行超過100億次推理任務的超級應用,支付寶的端側AI引擎xNN正快速拓展生成式模型與代理模型的推理能力。在與Arm的合作中,KleidiAI與SME2技術被集成進xNN,顯著優化了推理效率和功耗表現。

同時,支付寶團隊也在研發低比特量化策略,藉助KleidiAI的靈活性,定製出適合自身業務需求的量化方案,進一步壓縮模型規模、提升部署效率。

在Arm、vivo與支付寶三方聯合推動下,基於SME2的大語言模型推理在預填充階段性能提升超過40%,在解碼階段提升超過25%。這不僅標誌著CPU後端能力的躍升,更意味著運行大模型的設備覆蓋範圍被大幅拓展,讓更多用戶能夠直接在終端享受到生成式AI的實時、私密與低成本體驗。

支付寶終端技術負責人翁欣旦相信,隨著xNN的持續演進,以及與SME2的深度融合,支付寶有望在更多場景進一步發揮AI的潛能,構建更智能、更安全、更個性化的服務生態。

無論是vivo將SME2融入手機底層架構優化,還是支付寶藉助SME2擴展端側大模型推理能力,兩者都展現了Arm生態的協同力量:以硬體為底座、以場景為驅動,在移動計算與 AI的交匯點不斷突破邊界。隨著Arm Lumex CSS平台與SME2的普及,產業鏈合力正在加速推動智慧型手機和超級應用進入一個全新的AI原生時代。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新