Arm 控股有限公司(納斯達(dá)克股票代碼:ARM,以下簡稱 Arm)今日宣布推出全新 Arm? Lumex? 計(jì)算子系統(tǒng) (Compute Subsystem, CSS) 平臺(tái),這是一套專為旗艦級(jí)智能手機(jī)及下一代個(gè)人電腦加速其人工智能 (AI) 體驗(yàn)的先進(jìn)計(jì)算平臺(tái)。Lumex CSS 平臺(tái)集成了搭載第二代可伸縮矩陣擴(kuò)展 (SME2) 技術(shù)的最高性能 Arm CPUGPU 及系統(tǒng) IP,不僅能助力生態(tài)伙伴更快將 AI 設(shè)備推向市場,還可支持桌面級(jí)移動(dòng)游戲、實(shí)時(shí)翻譯、智能助手及個(gè)性化應(yīng)用等多樣的豐富體驗(yàn)。

Arm 高級(jí)副總裁兼終端事業(yè)部總經(jīng)理 Chris Bergey 表示:“AI 已不再僅僅是一項(xiàng)技術(shù)功能,它已成為下一代移動(dòng)與消費(fèi)技術(shù)的支撐底座。依托 Arm Lumex 平臺(tái),我們持續(xù)提升端側(cè) AI 體驗(yàn),以滿足用戶日益增長的需求與期待。為此,我們正積極將 SME2 技術(shù)擴(kuò)展至每一個(gè) CPU 平臺(tái)。預(yù)計(jì)到 2030 年,SME 與 SME2 技術(shù)將為超過 30 億臺(tái)設(shè)備新增超 100 億TOPS 的計(jì)算能力,為端側(cè) AI 性能帶來指數(shù)級(jí)躍升?!?/p>

合作伙伴可靈活選擇使用 Arm Lumex 的方式,為其打造系統(tǒng)級(jí)芯片 (SoCs)。例如,他們可直接采用 Arm 交付的平臺(tái),并借助為其需求定制的先進(jìn)物理實(shí)現(xiàn)方案,從而獲得縮短產(chǎn)品上市時(shí)間和快速兌現(xiàn)性能價(jià)值等雙重優(yōu)勢(shì);或者,合作伙伴也可根據(jù)他們的目標(biāo)市場,對(duì)平臺(tái)寄存器傳輸級(jí) (RTL) 設(shè)計(jì)進(jìn)行配置,并自行完成核心模塊的硬化工作。

全新 Arm Lumex 平臺(tái)包含以下核心組件:

搭載 SME2 技術(shù)的 CPU:助力實(shí)現(xiàn)全場景 AI 加速

搭載 SME2 的 Arm C1 CPU 集群,為實(shí)際場景中的 AI 驅(qū)動(dòng)型任務(wù)帶來了顯著的 AI 性能提升,包括:

全新的 Arm CPU 在 AI 計(jì)算能力上的飛躍,讓實(shí)時(shí)的端側(cè) AI 推理成為現(xiàn)實(shí),為用戶在音頻生成、計(jì)算機(jī)視覺及情境助手等多種交互場景中帶來更流暢、更快速的體驗(yàn)。

在實(shí)際場景中,SME2 技術(shù)將響應(yīng)速度與運(yùn)行效率提升至全新水平。例如,在“智能瑜伽教練”演示應(yīng)用中,得益于 SME2 技術(shù),該應(yīng)用的文本轉(zhuǎn)語音生成速度提升了 2.4 倍,這意味著用戶能即時(shí)獲得姿勢(shì)反饋與指導(dǎo),且全程不用擔(dān)心設(shè)備的電池續(xù)航問題。此外,通過 Arm、支付寶與 vivo 的三方合作下,將大語言模型 (LLM) 的交互響應(yīng)時(shí)間縮短了多達(dá) 40%,充分證明了 SME2 可為終端設(shè)備帶來更快速的實(shí)時(shí)生成式 AI 體驗(yàn)。

SME2 技術(shù)的價(jià)值不僅在于速度的提升,更在于釋放出傳統(tǒng) CPU 無法企及的 AI 驅(qū)動(dòng)功能。例如,在搭載 SME2 的單個(gè)核心上運(yùn)行神經(jīng)攝像頭降噪功能,可以在 1080P 分辨率下實(shí)現(xiàn)幀率超 120 幀/秒 (fps),或在 4K 分辨率下實(shí)現(xiàn)幀率達(dá) 30fps。這使得智能手機(jī)用戶即使身處光線最暗的場景,也能捕捉到更銳利、清晰的圖像,進(jìn)而在日常設(shè)備上獲得更流暢的操作交互與更豐富的使用體驗(yàn)。

不同于受到延遲、成本及隱私問題等挑戰(zhàn)的云優(yōu)先 AI,Lumex 將智能引入設(shè)備端,能夠在本地實(shí)現(xiàn)更快、更安全且隨時(shí)可用的智能體驗(yàn)。SME2 已經(jīng)廣受業(yè)界領(lǐng)先生態(tài)伙伴的采用,包括阿里巴巴、支付寶、三星 System LSI、騰訊及 vivo。

為全線產(chǎn)品層級(jí)賦予架構(gòu)自由

Arm Lumex 為合作伙伴提供了充分的自由度,使其能從高端智能手機(jī)、PC 到新興 AI 優(yōu)先設(shè)備的各類產(chǎn)品中,實(shí)現(xiàn)峰值性能、持續(xù)能效與芯片面積之間的靈活平衡。

CPU主要優(yōu)勢(shì)性能與能效提升理想應(yīng)用場景
Arm C1-Ultra旗艦級(jí)峰值性能單線程性能提升 25%,IPC 性能同比實(shí)現(xiàn)兩位數(shù)增長大模型推理、計(jì)算攝影、內(nèi)容創(chuàng)作、生成 式 AI
Arm C1-Premium兼具 C1-Ultra 性能且面積效率更優(yōu)相較于 C1-Ultra 面積縮減 35%次旗艦移動(dòng)設(shè)備市場、語音助手、多任務(wù)處理
Arm C1-Pro持久高能效持續(xù)性能提升 16%視頻播放、流式推理
Arm C1-Nano極致能效效率提升 26%,面積更小可穿戴設(shè)備、超小型設(shè)備

Mali GPU:實(shí)現(xiàn)桌面級(jí)游戲體驗(yàn)和更快的 AI 推理

隨著搭載 Arm GPU 的芯片累計(jì)出貨量突破 120 億顆,Arm 持續(xù)穩(wěn)居手游體驗(yàn)領(lǐng)域的核心地位。全新的 Arm Mali G1-Ultra GPU 進(jìn)一步突破移動(dòng)游戲的性能邊界,為手游玩家?guī)砀弑U?、主機(jī)級(jí)畫質(zhì)。這一突破得益于全新的第二代光線追蹤 (Ray Tracing Unit v2, RTUv2) 技術(shù),該技術(shù)顯著提升光照、陰影與反射效果,使其光線追蹤性能相較前代提升了兩倍。在 AI 工作負(fù)載方面,Mali G1-Ultra 可將推理性能提升最高 20%,顯著增強(qiáng)各類實(shí)時(shí)應(yīng)用的響應(yīng)速度。

在各類圖形基準(zhǔn)測(cè)試中,Mali G1-Ultra 較前代產(chǎn)品實(shí)現(xiàn)了 20% 的性能提升,為《暗區(qū)突圍:無限》、《堡壘之夜》、《原神》、《崩壞:星穹鐵道》等主流游戲帶來了全面的性能增強(qiáng)。同時(shí),Mali G1-Premium 與 Mali G1-Pro 兩款 GPU,也為硬件資源受限的設(shè)備提供了更出色的性能與能效表現(xiàn)。

開發(fā)者友好的端側(cè) AI 解決方案

開發(fā)者可在 Arm Lumex 平臺(tái)上獲取開機(jī)即用的 AI 開發(fā)體驗(yàn)。通過 KleidiAI 與各大主流框架的集成,包括 PyTorch ExecuTorch、Google LiteRT、阿里巴巴 MNN微軟 ONNX Runtime,開發(fā)者無需修改任何代碼,即可自動(dòng)取得 SME2 的加速能力。

對(duì)于需要構(gòu)建跨平臺(tái)應(yīng)用的開發(fā)者而言,Lumex 帶來了全新的可遷移性:

Apple、三星和 MediaTek 等科技領(lǐng)軍企業(yè),正積極集成 AI 加速功能,推動(dòng)端側(cè) AI 向更快速、更高效的方向發(fā)展。其中,Apple 正憑借該能力為“蘋果智能” (Apple Intelligence) 提供核心支撐;三星與 MediaTek 則借助 Google Gemini 提升翻譯、摘要、個(gè)人助手等實(shí)時(shí) AI 應(yīng)用的響應(yīng)速度與運(yùn)行效率。

Arm LumexAI 時(shí)代的平臺(tái)級(jí)智能

Arm Lumex 不僅是 Arm 面向消費(fèi)計(jì)算市場的最先進(jìn) CSS 平臺(tái),更是開啟新時(shí)代智能 AI 體驗(yàn)的基石。無論是 OEM 廠商還是開發(fā)者,Lumex 均可提供所需工具,助力其在關(guān)鍵端側(cè)場景實(shí)現(xiàn)兼具個(gè)性化、隱私保障與高性能的 AI 體驗(yàn)。作為專為 AI 時(shí)代打造平臺(tái), Arm Lumex 將成為未來移動(dòng)創(chuàng)新的全新起點(diǎn)。

分享到

lixiangjing

算力豹主編