本月刊是精心策劃的專欄,為您緩緩展開2025年8月份以來算力世界以及人工智能領(lǐng)域的精彩篇章,涵蓋公司新聞、產(chǎn)品動態(tài)、政策發(fā)布與會議活動四大板塊。
文字編輯|李祥敬
01
公司新聞
華為宣布CANN全面開源開放,共建昇騰生態(tài)
近日,昇騰計(jì)算產(chǎn)業(yè)發(fā)展峰會在北京召開。來自AI領(lǐng)軍企業(yè)、伙伴、高校與科研機(jī)構(gòu)的代表共同探討了如何更好地構(gòu)建開源開放的昇騰生態(tài),加速AI創(chuàng)新和發(fā)展。
華為輪值董事長徐直軍在主題演講中強(qiáng)調(diào):華為AI戰(zhàn)略的核心是算力,并堅(jiān)持昇騰硬件變現(xiàn)。徐直軍在會上宣布華為昇騰硬件使能CANN全面開源開放,Mind系列應(yīng)用使能套件及工具鏈全面開源,支持用戶自主的深度挖潛和自定義開發(fā),加速廣大開發(fā)者的創(chuàng)新步伐,讓昇騰更好用、更易用。
與會代表和華為共同發(fā)起了《CANN開源開放生態(tài)共建倡議》,以凝聚產(chǎn)業(yè)力量,共探AI邊界,共建昇騰生態(tài)。
ChatGPT用戶數(shù)暴漲至7億創(chuàng)紀(jì)錄新高,OpenAI年化收入飆升至120億美元
OpenAI正在經(jīng)歷前所未有的爆炸式增長。該公司周一宣布,其旗艦產(chǎn)品ChatGPT的周活躍用戶數(shù)已達(dá)到7億,同比增長超過四倍,這一數(shù)字標(biāo)志著AI應(yīng)用領(lǐng)域的又一個重要里程碑。
ChatGPT的用戶增長呈現(xiàn)出驚人的加速趨勢。除了周活躍用戶數(shù)的大幅攀升,其日均用戶消息量也突破了30億條大關(guān)。相比去年同期2.5倍的增長率,這一數(shù)據(jù)顯示出用戶活躍度的持續(xù)提升和對AI工具依賴程度的加深。
在商業(yè)化層面,OpenAI同樣交出了亮眼的成績單。其付費(fèi)商業(yè)用戶數(shù)量從今年6月的300萬激增至500萬,增長幅度超過66%。這一數(shù)據(jù)反映出企業(yè)和教育機(jī)構(gòu)對AI工具的接受度正在快速提升,商業(yè)市場對于AI應(yīng)用的需求呈現(xiàn)出強(qiáng)勁的增長態(tài)勢。
谷歌DeepMind發(fā)布Genie 3:一句話生成可玩的3D世界!實(shí)時交互世界模型開啟AGI新紀(jì)元
2025年8月6日,谷歌DeepMind正式發(fā)布Genie 3世界模型,首個支持實(shí)時交互的生成式環(huán)境引擎。它基于文本、圖像或視頻輸入,以每秒24幀的速率創(chuàng)建長達(dá)數(shù)分鐘的高保真動態(tài)世界。
相比前代Genie 2僅能維持10-20秒的360P畫面,此次升級被英偉達(dá)科學(xué)家Jim Fan譽(yù)為 “游戲引擎2.0時代”的降臨。
谷歌DeepMind Genie 3與Genie 2、由神經(jīng)模型驅(qū)動的游戲引擎GameNGen、視頻生成模型Veo對比,最突出的特點(diǎn)是其生成時長翻倍增長,且能做到針對已生成的環(huán)境修改。
百度智能云宣布推出全球首批AI數(shù)字員工
百度AI Day開放日上,百度智能云推出全球首批AI數(shù)字員工,覆蓋營銷經(jīng)理、還款助理等核心業(yè)務(wù)職能。它們依托百度智能云AI全棧能力,融合大模型、數(shù)字人技術(shù)及行業(yè)經(jīng)驗(yàn),具備“懂業(yè)務(wù)、給結(jié)果、可進(jìn)化”特性,能精準(zhǔn)賦能垂直業(yè)務(wù)場景,成為企業(yè)可信賴的數(shù)字業(yè)務(wù)伙伴。
百度副總裁阮瑜稱,大模型能力快速迭代,推動AI從Copilot向Agent形態(tài)躍遷,未來智能體將以“數(shù)字員工”形態(tài)參與企業(yè)運(yùn)行,推動組織生產(chǎn)力變革。石崢表示,企業(yè)需要能扛KPI的Agent,百度智能云融合客悅智能客服與曦靈數(shù)字人技術(shù),基于大模型Agent架構(gòu)打造出國內(nèi)首批AI數(shù)字員工,實(shí)現(xiàn)從功能執(zhí)行到業(yè)務(wù)決策的質(zhì)變。
在招聘行業(yè),招聘顧問能實(shí)現(xiàn)外呼邀約等全流程閉環(huán),面試參加率提升40%;教培行業(yè),課程顧問可承接招生咨詢等重復(fù)勞動,讓教育顧問專注高價值轉(zhuǎn)化,員工效率提升40%。目前,數(shù)字員工已應(yīng)用于百度客服中心,實(shí)現(xiàn)7×24小時高效處理咨詢,用戶申保成功率提升60%、服務(wù)時效提升18h。石崢認(rèn)為,人機(jī)協(xié)同是主流趨勢,未來或?qū)崿F(xiàn)多數(shù)字員工協(xié)同解決復(fù)雜任務(wù)。
從閉源到開源,OpenAI重磅推出gpt-oss-120b與20b,開發(fā)者狂歡!
OpenAI宣布推出兩款開源權(quán)重語言模型——gpt-oss-120b和gpt-oss-20b,這是自2019年GPT-2發(fā)布以來,OpenAI首次回歸開源領(lǐng)域。此舉不僅標(biāo)志著OpenAI戰(zhàn)略的重大轉(zhuǎn)向,也為全球AI開發(fā)者提供了強(qiáng)大的推理工具,加速AI技術(shù)的普及與創(chuàng)新。
根據(jù)OpenAI官方公告,gpt-oss-120b和gpt-oss-20b采用Apache2.0許可證發(fā)布,允許開發(fā)者自由下載、修改和用于商業(yè)用途。這兩款模型分別是1170億參數(shù)和210億參數(shù)的混合專家(MoE)架構(gòu),分別激活51億和36億參數(shù),兼顧高效推理與低資源消耗。
特斯拉解散Dojo超級計(jì)算機(jī)團(tuán)隊(duì),放棄自研芯片轉(zhuǎn)向英偉達(dá)合作
特斯拉正式解散其Dojo超級計(jì)算機(jī)項(xiàng)目團(tuán)隊(duì),結(jié)束了這家電動汽車制造商在自動駕駛技術(shù)領(lǐng)域自主研發(fā)芯片的努力。據(jù)報道,這一決定標(biāo)志著特斯拉AI戰(zhàn)略的重大轉(zhuǎn)向。
Dojo項(xiàng)目負(fù)責(zé)人Peter Bannon已經(jīng)離開公司,剩余團(tuán)隊(duì)成員將被重新分配到特斯拉內(nèi)部其他數(shù)據(jù)中心和計(jì)算項(xiàng)目中。這一變化是在約20名員工離職創(chuàng)立AI公司DensityAI之后發(fā)生的。
新成立的DensityAI由前Dojo負(fù)責(zé)人Ganesh Venkataramanan以及前特斯拉員工Bill Chang和Ben Floering共同創(chuàng)立,該公司正在開發(fā)面向機(jī)器人、AI代理和汽車應(yīng)用的數(shù)據(jù)中心芯片、硬件和軟件解決方案。
亞馬遜推出全球最大AI模型平臺Amazon Bedrock
在2023年AI行業(yè)激戰(zhàn)正酣、各大公司競相爭奪“最強(qiáng)模型”稱號之際,亞馬遜云科技(AWS)卻獨(dú)辟蹊徑,提出了“選擇大于一切”的戰(zhàn)略理念。該戰(zhàn)略強(qiáng)調(diào),在AI應(yīng)用中,適合的模型才是至關(guān)重要的。為實(shí)現(xiàn)這一目標(biāo),亞馬遜推出了AmazonBedrock平臺,旨在為企業(yè)打造一個如同超市般便捷的AI模型選擇環(huán)境。
這一新平臺被業(yè)界譽(yù)為“模型超市”,它集成了多種AI模型,企業(yè)可根據(jù)自身需求和場景,靈活挑選最合適的解決方案。亞馬遜深刻認(rèn)識到,企業(yè)所追求的并非單一的最強(qiáng)大模型,而是能夠適應(yīng)不同場景的多元化模型組合。
風(fēng)雪壓“我”兩三年,“我”比HBM還值錢
當(dāng)AI模型參數(shù)突破萬億級,HBM已從“配件”升級為“算力核心”。華為8月12日發(fā)布的UCM技術(shù)以顛覆性架構(gòu)撕開一道裂縫。
該成果聚焦通過算法優(yōu)化、架構(gòu)創(chuàng)新及軟硬件協(xié)同,減少對HBM的依賴。HBM作為AI計(jì)算核心組件,長期受海外技術(shù)壟斷和產(chǎn)能限制,華為的技術(shù)突破或緩解國內(nèi)AI產(chǎn)業(yè)供應(yīng)鏈壓力,降低算力成本。
英偉達(dá)發(fā)布Cosmos Reason推動機(jī)器人智能化發(fā)展
在最近舉行的SIGGRAPH國際計(jì)算機(jī)圖形學(xué)和交互技術(shù)會議上英偉達(dá)展示了一系列針對機(jī)器人開發(fā)者的新技術(shù),其中最引人注目的是其推出的開源物理AI模型——Cosmos Reason。該模型參數(shù)量達(dá)到70億,旨在為機(jī)器人提供更高效的視覺推理能力。
英偉達(dá)指出,自從OpenAI推出CLIP模型以來,視覺語言模型在計(jì)算機(jī)視覺領(lǐng)域取得了顯著進(jìn)展,尤其是在物體識別和模式識別等任務(wù)中。然而,傳統(tǒng)模型在面對復(fù)雜的多步驟任務(wù)時往往力不從心,特別是在處理模糊或新穎的現(xiàn)實(shí)情境時。Cosmos Reason憑借其卓越的記憶和理解能力,使機(jī)器人能夠像人類一樣進(jìn)行推理,從而在現(xiàn)實(shí)世界中做出更加合理的行動決策。
馬斯克與阿爾特曼的愛恨情仇開辟新戰(zhàn)場,OpenAI殺入腦機(jī)接口大戰(zhàn)!
隨著GPT-5的發(fā)布,OpenAI在技術(shù)開發(fā)上面也陷入了瓶頸之中,但是阿爾特曼的動作從未停止,據(jù)《金融時報》報道,OpenAI及其聯(lián)合創(chuàng)始人阿爾特曼正準(zhǔn)備投資一家名為Merge Labs的創(chuàng)業(yè)公司,該公司的目標(biāo)與伊隆?馬斯克的Neuralink一致,都是連接人腦與計(jì)算機(jī)。
此外馬斯克在社交平臺發(fā)文稱,蘋果公司涉嫌通過限制措施,使除美國開放人工智能研究中心(OpenAI)外的任何人工智能公司都無法在其應(yīng)用商店排行榜中登頂,稱此為“明確的反壟斷違規(guī)行為”。馬斯克表示,其旗下xAI公司將立即采取法律行動。
兩人的恩怨情仇因這兩件事再度引爆!展開了一場技術(shù)空窗期下,“樸實(shí)無華的商業(yè)斗爭”。
智譜視覺推理模型GLM-4.5V開源,全球100B級最佳視覺推理模型
智譜AI正式發(fā)布并開源新一代視覺推理模型GLM-4.5V,官方數(shù)據(jù)顯示,其在41個公開視覺多模態(tài)基準(zhǔn)測試中達(dá)到同級別開源模型SOTA性能。該模型已同步在GitHub、Hugging Face和魔搭社區(qū)開源,采用MIT開源協(xié)議,支持商業(yè)使用(項(xiàng)目地址:https://github.com/zai-org/GLM-V/)。
從技術(shù)架構(gòu)上看,GLM-4.5V由視覺編碼器、MLP適配器和語言解碼器三部分構(gòu)成。模型通過引入三維旋轉(zhuǎn)位置編碼(3D-RoPE),顯著增強(qiáng)了對多模態(tài)信息中三維空間關(guān)系的感知和推理能力。同時,它支持64K tokens的多模態(tài)長上下文輸入,并采用三維卷積來提升視頻處理的效率。這些設(shè)計(jì)使得模型不僅能處理圖像,也能理解視頻內(nèi)容,并對高分辨率以及極端寬高比的圖像具有更強(qiáng)的處理能力和穩(wěn)健性。
阿里達(dá)摩院宣布開源具身智能“三大件” 開源機(jī)器人上下文協(xié)議RynnRCP
在世界機(jī)器人大會上,阿里達(dá)摩院宣布開源三項(xiàng)自研核心技術(shù):VLA模型RynnVLA-001-7B、世界理解模型RynnEC及機(jī)器人上下文協(xié)議RynnRCP,旨在推動數(shù)據(jù)、模型與機(jī)器人本體的兼容適配,打通具身智能開發(fā)流程。
具身智能領(lǐng)域發(fā)展迅速,但面臨開發(fā)碎片化、適配困難等挑戰(zhàn)。達(dá)摩院引入MCP理念,提出并開源RCP,推動不同數(shù)據(jù)、模型與本體無縫對接。其打造的RynnRCP是完整機(jī)器人服務(wù)協(xié)議和框架,已支持多款熱門模型和機(jī)械臂,支持范圍持續(xù)擴(kuò)展。
昇騰+SGLang強(qiáng)強(qiáng)聯(lián)手!大模型推理“狂飆”低延遲時代
2025年8月,經(jīng)過SGLang社區(qū)與昇騰的共同努力,將SGLang的靈活編程框架與昇騰強(qiáng)大的異構(gòu)算力深度融合,使能SGLang在昇騰上無縫運(yùn)行大模型推理,并正式面向用戶推出基于SGLang的大EP集群推理解決方案。當(dāng)前用戶可獲取最新release版本的SGLang以體驗(yàn)低延遲、高吞吐的推理系統(tǒng)。
IDC報告:2024年中國AI公有云服務(wù)市場規(guī)模激增,阿里云蟬聯(lián)中國市場第一
根據(jù)IDC最新發(fā)布的《中國AIP公有云服務(wù)市場份額,2024:全面向生成式AI演進(jìn)》報告,2024年中國AIP公有云服務(wù)市場規(guī)模預(yù)計(jì)將達(dá)到195.9億元人民幣,較2023年增長55.3%。這一增長主要得益于生成式AI應(yīng)用的不斷拓展以及機(jī)器學(xué)習(xí)需求的顯著提升,推動了云服務(wù)市場的迅猛發(fā)展。
在各個細(xì)分市場中,計(jì)算機(jī)視覺公有云服務(wù)市場表現(xiàn)尤為突出,2024年市場規(guī)模預(yù)計(jì)達(dá)到81.0億元,同比增長33.7%。在這一領(lǐng)域,騰訊云和百度智能云分別占據(jù)市場第一和第二的位置,充分展現(xiàn)了它們在技術(shù)和應(yīng)用方面的優(yōu)勢。
與此同時,對話式AI公有云服務(wù)市場也呈現(xiàn)出強(qiáng)勁的增長態(tài)勢,2024年市場規(guī)模預(yù)計(jì)為20.9億元,較2023年增長39.5%。在這一市場中,阿里云和百度智能云同樣位列前兩名,彰顯了它們在智能交互領(lǐng)域的強(qiáng)大競爭力。
《黑神話:鐘馗》即將來襲:國產(chǎn)3A巨制如何再次挑戰(zhàn)算力極限?
2025年8月20日,游戲科學(xué)(Game Science)創(chuàng)始人馮驥與美術(shù)總監(jiān)楊奇通過社交媒體宣布,團(tuán)隊(duì)將暫時延緩《黑神話:悟空》的DLC開發(fā),轉(zhuǎn)而將精力投入到一款名為《黑神話:鐘馗》的新作中 。這一消息迅速引爆了游戲圈。
《黑神話:鐘馗》的曝光預(yù)示著國產(chǎn)3A游戲?qū)⒃俅翁魬?zhàn)計(jì)算機(jī)算力的極限?;谇白鳌逗谏裨挘何蚩铡匪鶚淞⒌母呒夹g(shù)壁壘,新作有望在圖形渲染、物理模擬和世界構(gòu)建等多個維度實(shí)現(xiàn)技術(shù)飛躍。這不僅意味著更精細(xì)的光線追蹤、更復(fù)雜的物理算法(如物質(zhì)點(diǎn)法MPM)和更龐大的無縫開放世界,也預(yù)示著對玩家PC硬件,特別是GPU的并行計(jì)算能力、CPU的邏輯處理能力和高速存儲設(shè)備,將提出前所未有的嚴(yán)苛要求。這場由軟件創(chuàng)新驅(qū)動的硬件“軍備競賽”,將推動游戲產(chǎn)業(yè)與硬件廠商進(jìn)行更深度的協(xié)同,共同定義下一代游戲的技術(shù)標(biāo)準(zhǔn)。
拿Money“鋪出一條AI路”:軟銀豪賭AI全產(chǎn)業(yè)鏈,孫正義的“人工超級智能”野心
2025年,軟銀集團(tuán)以資本為杠桿,在全球AI算力產(chǎn)業(yè)鏈掀起了一場前所未有的投資風(fēng)暴。其創(chuàng)始人孫正義以“人工超級智能(ASI)”為終極目標(biāo),通過一系列橫跨芯片設(shè)計(jì)、制造、數(shù)據(jù)中心和AI應(yīng)用的垂直整合投資,構(gòu)建一個由軟銀主導(dǎo)的AI全產(chǎn)業(yè)鏈生態(tài)。這場豪賭的核心在于,軟銀不再滿足于作為財務(wù)投資者,而是要成為AI時代的“行業(yè)組織者”,通過控制從底層硬件到頂層應(yīng)用的全鏈條,在未來的技術(shù)競爭中占據(jù)絕對主導(dǎo)地位。
智元機(jī)器人以全鏈條布局加速具身智能商用落地
2025年8月21日,智元機(jī)器人首屆合作伙伴大會在上海舉行,主題為“與智同行 共啟新元”。大會通過戰(zhàn)略發(fā)布、場景化解決方案展示和機(jī)器人體驗(yàn),展現(xiàn)了智元在“產(chǎn)品、技術(shù)、商業(yè)、生態(tài)、資本、團(tuán)隊(duì)”的全鏈條布局。依托“一體三智”架構(gòu)與全系列產(chǎn)品矩陣,智元與合作伙伴攜手,加快具身智能商業(yè)化進(jìn)程,推動產(chǎn)業(yè)從“技術(shù)探索”邁向“規(guī)模商用”。
“先進(jìn)存力AI推理工作組”成立,共同推進(jìn)AI普惠千行百業(yè)
2025中國算力大會上,由中國信息通信研究院聯(lián)合華為數(shù)據(jù)存儲、科大訊飛、浪潮、曙光、沐曦、清微智能、中國移動、中國電信、中國聯(lián)通等企業(yè)共同成立的“先進(jìn)存力AI推理工作組”。該工作組旨在推動AI推理領(lǐng)域的“存算協(xié)同、生態(tài)共建”,標(biāo)志著我國AI推理產(chǎn)業(yè)進(jìn)入新階段。華為數(shù)據(jù)存儲產(chǎn)品線戰(zhàn)略與業(yè)務(wù)發(fā)展部總裁王旭東參與了成立儀式。
在代理AI和物理AI推動下,全球芯片市場預(yù)計(jì)將突破1萬億美元大關(guān)
根據(jù)分析公司Counterpoint Research發(fā)布的一份新報告,人工智能的迅速發(fā)展正推動全球半導(dǎo)體市場迎來前所未有的增長。該報告預(yù)測,隨著代理AI和物理AI的興起,全球芯片市場的收入預(yù)計(jì)將在未來數(shù)年內(nèi)突破1萬億美元。這一數(shù)字幾乎是當(dāng)前市場規(guī)模的兩倍,預(yù)計(jì)到2024年,市場收入將達(dá)到6560億美元。
連續(xù)虧損近十年!營收今年增長43倍,“中國小英偉達(dá)” 寒武紀(jì)的逆襲之路
一家連續(xù)虧損八年、累計(jì)虧損近50億元的企業(yè),卻在2025年夏季創(chuàng)下股價千元、市值5500億的神話,寒武紀(jì)的狂飆突進(jìn)堪稱中國AI芯片領(lǐng)域最具爭議性的現(xiàn)象。
2025年8月26日,寒武紀(jì)交出了一份令人瞠目的半年報:營收28.81億元,同比增長4347.82%;凈利潤10.38億元,成功扭虧為盈。這份財報背后,是這家被譽(yù)為“中國英偉達(dá)”的AI芯片公司從瀕臨絕境到絕地重生的瘋狂逆轉(zhuǎn)。
IBM與AMD“聯(lián)姻”沖刺量子計(jì)算,重新定義計(jì)算的未來,打造AI新生態(tài)
全球科技產(chǎn)業(yè)正面臨一道日益擴(kuò)大的“算力鴻溝”,一邊是暴漲的人工智能與數(shù)字化轉(zhuǎn)型需求,另一邊是傳統(tǒng)計(jì)算架構(gòu)性能增長的放緩。在這場算力競賽中,IBM與AMD的強(qiáng)強(qiáng)聯(lián)合試圖開辟一條全新路徑。
老牌美國科技巨頭IBM與AI算力芯片全球排名第二的AMD發(fā)布公告,宣布將共同開發(fā)被稱為“量子中心超級計(jì)算”(quantum-centric supercomputing)的下一代計(jì)算架構(gòu),并豪言此舉或?qū)ⅰ爸匦露x計(jì)算的未來”。
這一被稱為“量子中心化超級計(jì)算”的新型架構(gòu),旨在突破傳統(tǒng)計(jì)算的性能極限,為復(fù)雜AI工作負(fù)載提供前所未有的處理能力。
馬斯克從不缺席AI趨勢!xAI入局AI編程,主打“快速且經(jīng)濟(jì)”,還限時7天免費(fèi)薅羊毛!
埃隆·馬斯克旗下人工智能公司xAI正式進(jìn)軍AI編程領(lǐng)域,推出全新智能代碼生成模型Grok Code Fast 1。這款主打“快速且經(jīng)濟(jì)”的編程模型,正在掀起AI輔助編程的效率革命。
據(jù)悉,Grok Code Fast 1將在包括Cursor、GitHub Copilot、Cline、opencode、Windsurf、Roo Code和Kilo Code在內(nèi)的主流智能編程平臺上限時免費(fèi)開放。
另據(jù)xAI方面表示,該模型的“核心優(yōu)勢在于以經(jīng)濟(jì)實(shí)惠的精簡架構(gòu)實(shí)現(xiàn)強(qiáng)勁性能,使其成為快速、低成本處理常見編碼任務(wù)的靈活之選”。
百度未來五年計(jì)劃培養(yǎng)1000萬AI人才
近日,國務(wù)院常務(wù)會議審議通過了《關(guān)于深入實(shí)施 “人工智能 +” 行動的意見》,為中國人工智能技術(shù)與產(chǎn)業(yè)的深度融合以及規(guī)模化商業(yè)應(yīng)用指明了方向。百度副總裁石清華表示,《意見》的出臺標(biāo)志著中國在人工智能領(lǐng)域邁入全面融合、深化應(yīng)用的新階段。
作為國內(nèi)領(lǐng)先的人工智能公司,百度在過去十年中已累計(jì)投入超過1800億元人民幣用于研發(fā)。此前,百度已經(jīng)提前完成了培養(yǎng)500萬AI人才的目標(biāo),并在此基礎(chǔ)上,宣布未來五年將再培養(yǎng)1000萬AI人才。這個計(jì)劃不僅體現(xiàn)了百度對人工智能人才培養(yǎng)的重視,也顯示出其推動行業(yè)發(fā)展的決心。
02
產(chǎn)品動態(tài)
Qwen3卷王名正實(shí)歸,又又又開源新模型了!Qwen3-Coder-Flash,33GB內(nèi)存跑出GPT-4級生產(chǎn)力
2025年8月1日,阿里巴巴通義千問團(tuán)隊(duì)正式開源Qwen3-Coder-Flash(全稱Qwen3-Coder-30B-A3B-Instruct),這款被開發(fā)者社區(qū)稱為“甜品級”的編程模型在性能與效率的平衡木上完成了一次漂亮的后空翻。
它采用30.5億參數(shù)MoE架構(gòu),卻只需激活其中3.3億參數(shù),如同一個精密的神經(jīng)網(wǎng)絡(luò)開關(guān)系統(tǒng),在保證強(qiáng)大智能的同時實(shí)現(xiàn)了驚人的運(yùn)行效率。
階躍星辰最新一代基礎(chǔ)大模型Step3正式開源
階躍星辰團(tuán)隊(duì)推出新一代開源基礎(chǔ)大模型Step3,專為企業(yè)和開發(fā)者平衡性能與成本設(shè)計(jì),適配推理時代應(yīng)用場景,可在Github等平臺下載。
該模型采用MoE架構(gòu),參數(shù)規(guī)模龐大,具備出色的視覺感知與復(fù)雜推理能力,能處理跨領(lǐng)域知識理解等任務(wù)。經(jīng)MFA和AFD優(yōu)化,推理效率顯著提升,同時開源的StepMesh通信庫提供跨硬件部署支持。
核心結(jié)構(gòu)上,Step3運(yùn)用自研MFA注意力機(jī)制,降低資源消耗,實(shí)現(xiàn)高效推理,可在特定顯卡配置下完成大吞吐量任務(wù)。多模態(tài)處理通過優(yōu)化視覺編碼器減少計(jì)算量,提升效率。訓(xùn)練過程分階段進(jìn)行,結(jié)合多樣語料與清洗策略,增強(qiáng)模型性能。
系統(tǒng)架構(gòu)方面,Step3重構(gòu)解碼流程,采用高性能AFD方案與多級流水線調(diào)度,提升吞吐效率。StepMesh通信庫保障跨卡高效傳輸,適配多種硬件。實(shí)測性能優(yōu)于同類模型,特定場景下增益顯著。
中文亂碼成歷史!阿里通義千問開源Qwen-Image,AI生圖迎來文本精準(zhǔn)時代
8月5日凌晨,阿里巴巴通義千問團(tuán)隊(duì)宣布開源其首個圖像生成基礎(chǔ)模型Qwen-Image,這一基于20億參數(shù)的多模態(tài)擴(kuò)散變換器(MMDiT)模型在復(fù)雜文本渲染和精確圖像編輯領(lǐng)域?qū)崿F(xiàn)重大突破。
重磅升級!Claude Opus4.1橫空出世,編程能力直沖74.5%新高
人工智能公司Anthropic正式發(fā)布其旗艦?zāi)P虲laude Opus4的升級版——Claude Opus4.1。此次更新旨在全面提升模型的agentic任務(wù)、真實(shí)世界編程和推理能力,尤其是在編程和數(shù)據(jù)分析方面的表現(xiàn)引人注目。
根據(jù)官方信息,Claude Opus4.1的最大亮點(diǎn)在于其驚人的編程性能提升。在SWE-bench Verified編程評測中,其表現(xiàn)高達(dá)74.5%,這一成績顯示了其在處理復(fù)雜代碼問題上的強(qiáng)大實(shí)力。GitHub的反饋也印證了這一點(diǎn),開發(fā)者們普遍認(rèn)為Opus4.1在多文件代碼重構(gòu)等任務(wù)上表現(xiàn)優(yōu)于其前身。此外,日本電商巨頭Rakuten Group也指出,新模型能夠更精準(zhǔn)地定位大型代碼庫中的錯誤,有效減少不必要的更改和潛在bug。
小紅書發(fā)布開源多模態(tài)大模型dots.vlm1,以NaViT視覺編碼器領(lǐng)跑行業(yè)
小紅書Hi Lab近日發(fā)布并開源首個自研多模態(tài)大模型dots.vlm1。該模型以12億參數(shù)的NaViT視覺編碼器和DeepSeek V3大語言模型為基礎(chǔ),從零開始完整訓(xùn)練,在多模態(tài)視覺理解與推理能力上表現(xiàn)卓越,性能已接近當(dāng)前領(lǐng)先的閉源模型Gemini2.5Pro和Seed-VL1.5,標(biāo)志著開源多模態(tài)模型性能邁上新臺階。
dots.vlm1的核心優(yōu)勢在于其原生自研的NaViT視覺編碼器。不同于傳統(tǒng)基于成熟模型微調(diào)的方式,NaViT從零訓(xùn)練且支持動態(tài)分辨率,能更好地適應(yīng)多樣化的真實(shí)圖像場景。該模型結(jié)合純視覺與文本視覺雙重監(jiān)督,極大提升了泛化能力,處理表格、圖表、公式、文檔等非典型結(jié)構(gòu)化圖片時表現(xiàn)尤為出色。
阿里新發(fā)布Qwen3-4B模型:小巧強(qiáng)勁,手機(jī)也能跑AI!
阿里巴巴通義千問團(tuán)隊(duì)推出全新Qwen3-4B系列模型,包括Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507兩個版本。這一發(fā)布標(biāo)志著小型語言模型(SLM)技術(shù)的重要突破,為移動端AI應(yīng)用開辟了新的發(fā)展路徑。
新發(fā)布的模型最大特色在于實(shí)現(xiàn)了性能與體積的平衡優(yōu)化。盡管參數(shù)規(guī)模相對較小,但這些模型能夠高效運(yùn)行在智能手機(jī)等移動設(shè)備上,有效解決了傳統(tǒng)大模型對硬件資源的高依賴問題。
在技術(shù)規(guī)格方面,Qwen3-4B-Instruct-2507在通用能力上取得顯著進(jìn)展。該模型具備更強(qiáng)的指令理解和執(zhí)行能力,響應(yīng)速度明顯提升,特別適用于內(nèi)容創(chuàng)作和工具調(diào)用等實(shí)際應(yīng)用場景。值得注意的是,模型的上下文處理能力已擴(kuò)展至256K,使其能夠處理長文本任務(wù),這在同規(guī)模模型中表現(xiàn)突出。
MiniMax Speech 2.5語音生成模型上線:多語種表現(xiàn)力更強(qiáng)
MiniMax宣布推出新一代語音生成模型Speech2.5,這一升級版模型在全球語音技術(shù)領(lǐng)域再次樹立了新的標(biāo)桿,進(jìn)一步鞏固了其作為全球最強(qiáng)語音模型的地位。Speech2.5在多語種表現(xiàn)力、音色復(fù)刻以及語種覆蓋范圍等方面均實(shí)現(xiàn)了顯著提升。
與今年5月發(fā)布的Speech02相比,Speech2.5在多語種表現(xiàn)力上取得了飛躍性進(jìn)步,尤其在中文方面繼續(xù)保持全球最強(qiáng)水平,同時英文及其他多語種的表現(xiàn)也得到了全面提升。該模型在字錯率、相似度和自然韻律度等方面均超越了前代產(chǎn)品,用戶可以在40種語言之間輕松切換,無論是商務(wù)會議、日常對話還是英文播客,都能提供更加自然流暢的語音體驗(yàn),徹底擺脫了以往語音合成中常見的“機(jī)械感”。
一文帶您了解GPT-5,OpenAI數(shù)據(jù)狂飆背后,卻揭露了AI腳步放緩的殘酷現(xiàn)實(shí)
今年,OpenAI備受大眾矚目的重磅產(chǎn)品終于登場。北京時間8月8日凌晨一點(diǎn),OpenAI正式對外宣布,推出新一代旗艦級人工智能(AI)模型——GPT-5。這款模型堪稱OpenAI首個“一體化”的AI系統(tǒng),它創(chuàng)新性地將o系列模型的強(qiáng)大推理能力與GPT系列模型的快速響應(yīng)特性完美融合。
但萬眾矚目下GPT-5的升級遠(yuǎn)遠(yuǎn)沒達(dá)到大眾的預(yù)期,盡管奧特曼宣稱GPT-5是“邁向AGI的關(guān)鍵一步”,實(shí)際卻沒有什么顛覆性的改變。其改進(jìn)幅度無法媲美GPT-3到GPT-4的飛躍。而這恰恰折射出數(shù)據(jù)狂飆背后,本質(zhì)問題漸漸浮現(xiàn)。
馬斯克旗下xAI宣布Grok 4 AI模型永久免費(fèi)開放
xAI公司宣布了一個震驚全球的消息:Grok4人工智能模型將對全球所有用戶永久免費(fèi)開放。這一決定標(biāo)志著xAI在人工智能領(lǐng)域邁出了重要一步,為全球用戶提供了一個無需支付費(fèi)用即可使用的先進(jìn)AI工具。
Grok4的免費(fèi)開放不是試用,也不是限時優(yōu)惠,而是真正的永久免費(fèi)。xAI為用戶提供了兩種使用模式:Auto模式和Expert模式。在Auto模式下,系統(tǒng)會根據(jù)用戶問題的復(fù)雜度自動判斷是否需要使用Grok4進(jìn)行高級推理。如果用戶想要更多的控制權(quán),可以隨時切換到Expert模式,讓每個查詢都通過Grok4處理。
智元機(jī)器人發(fā)布機(jī)器人世界模型開源平臺——Genie Envisioner
智元機(jī)器人在上海宣布推出面向真實(shí)世界機(jī)器人操控的統(tǒng)一世界模型平臺——Genie Envisioner(GE)。這一創(chuàng)新平臺突破了傳統(tǒng)機(jī)器人學(xué)習(xí)系統(tǒng)分階段開發(fā)的模式,將未來幀預(yù)測、策略學(xué)習(xí)與仿真評估整合進(jìn)以視頻生成為核心的閉環(huán)架構(gòu),實(shí)現(xiàn)了機(jī)器人從“看”到“想”再到“動”的端到端推理與執(zhí)行?;诩s3000小時的真實(shí)機(jī)器人操控視頻數(shù)據(jù),GE在跨平臺泛化和長時序任務(wù)執(zhí)行上展現(xiàn)出顯著優(yōu)勢,為具身智能發(fā)展開辟了從視覺理解到動作執(zhí)行的全新技術(shù)路徑。
GE的核心突破在于構(gòu)建了基于世界模型的視覺中心建模范式。與主流的視覺-語言-行動(VLA)方法不同,GE直接在視覺空間中建模機(jī)器人與環(huán)境的交互動態(tài),完整保留了操控過程中的空間結(jié)構(gòu)和時序演化信息。這種建模范式不僅賦予了GE高效的跨本體泛化能力,使其能夠在極少量數(shù)據(jù)下實(shí)現(xiàn)跨平臺遷移,還在長時序任務(wù)的精確執(zhí)行能力上展現(xiàn)出巨大優(yōu)勢。例如,在折疊紙盒等超長步驟任務(wù)中,GE-Act的成功率遠(yuǎn)超現(xiàn)有頂尖方法。
PS技術(shù)哪家強(qiáng)?阿里通義來幫忙,Qwen-Image-Edit,AI圖像編輯神器!
中文海報中的細(xì)小文字精準(zhǔn)替換、書法作品逐字修正、品牌IP角色多風(fēng)格轉(zhuǎn)換,這些曾讓專業(yè)設(shè)計(jì)師耗費(fèi)數(shù)小時的操作,如今通過一句指令即可完成。
8月19日凌晨,阿里通義千問團(tuán)隊(duì)開源了其最新圖像編輯模型Qwen-Image-Edit,這是繼月初發(fā)布Qwen-Image后,在多模態(tài)AI領(lǐng)域的又一重磅突破。該模型基于200億參數(shù)的Qwen-Image進(jìn)一步訓(xùn)練,首次實(shí)現(xiàn)了語義控制與外觀編輯的雙重能力。
在數(shù)字內(nèi)容爆發(fā)式增長的時代,Qwen-Image-Edit的誕生標(biāo)志著AI圖像處理從生成向精準(zhǔn)編輯演進(jìn)的關(guān)鍵轉(zhuǎn)折。它不僅繼承了Qwen-Image在中文文本渲染上的優(yōu)勢,更將這一能力擴(kuò)展至編輯領(lǐng)域。
DeepSeek V3.1正式發(fā)布:長文檔分析、代碼理解能力大幅增強(qiáng)
8月19日晚間DeepSeek官方宣布線上模型版本已升級至V3.1,其最顯著的改進(jìn)是上下文長度拓展至128K,相當(dāng)于可處理10萬至13萬漢字的超長文本,這一特性使其適用于長文檔分析、代碼庫理解及多輪對話場景。
智譜AutoGLM上線:給每個手機(jī)都裝上通用Agent
8月20日,智譜宣布發(fā)布全球首個手機(jī)Agent——AutoGLM 2.0,由國產(chǎn)模型GLM-4.5與GLM-4.5V驅(qū)動,具備推理、代碼和多模態(tài)處理能力,能夠在多種設(shè)備和場景中運(yùn)行,幫助用戶執(zhí)行操作。
DeepSeek安利的“UE8M0 FP8”:下一代國產(chǎn)算力標(biāo)準(zhǔn)?
“UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計(jì)?!痹贒eepSeek-V3.1發(fā)布文章的置頂評論中,這句簡短的技術(shù)說明迅速在AI圈引發(fā)熱議。
這不僅僅是一次模型升級,更是中國AI算力自主化道路上的重要里程碑。DeepSeek此次的技術(shù)選擇,首次從軟件層面反向定義國產(chǎn)芯片標(biāo)準(zhǔn),為擺脫對外部算力的依賴提供了關(guān)鍵支撐。
如果把AI產(chǎn)業(yè)比作一條高速公路,過去三十年我們擅長把路修寬(擴(kuò)大算力規(guī)模),卻一直在用別國設(shè)計(jì)的“車道寬度”(FP32/FP16/BF16 等國際標(biāo)準(zhǔn))。DeepSeek這一次把車道縮到8bit,卻通過UE8M0把動態(tài)范圍放大32倍,等于在原有路基上憑空多修了兩條應(yīng)急車道——不增加制造成本,卻讓國產(chǎn)芯片第一次能把大模型“開”得又快又穩(wěn)。
馬斯克xAI開源Grok 2.5:Grok 3將于半年后開源
近日,埃隆·馬斯克在社交平臺X上宣布,其人工智能公司xAI已正式開源Grok2.5模型,向公眾開放了該模型的源代碼。這一舉措是馬斯克推動技術(shù)開放理念的又一具體實(shí)踐,也為人工智能領(lǐng)域的發(fā)展開辟了新的路徑。
黃仁勛給機(jī)器人送“禮物”了!英偉達(dá)Jetson Thor掀起物理AI的浪潮
英偉達(dá)為機(jī)器人打造的“新大腦”Jetson Thor正式發(fā)售,性能飆升7.5倍,能耗卻僅為130瓦,宇樹、優(yōu)必選等中國廠商已搶先采用,2萬多元的售價背后是中國市場對高性能AI芯片的迫切需求。
北京時間8月25日晚,英偉達(dá)宣布其專為機(jī)器人及自動駕駛計(jì)算平臺設(shè)計(jì)的系統(tǒng)級芯片Thor正式量產(chǎn)上市。
這款基于Blackwell架構(gòu)的芯片,被譽(yù)為“機(jī)器人的新大腦”,單顆AI算力在FP8標(biāo)準(zhǔn)下達(dá)到1035TFLOPS,在FP4標(biāo)準(zhǔn)下更是高達(dá)2070TFLOPS,性能是上一代Orin的7.5倍,能效比提升3.5倍。
03
政策發(fā)布
宇樹科技王興興獲聘首席科學(xué)家,杭州布局具身智能新高地
8月4日,杭州高新區(qū)(濱江)舉辦人工智能產(chǎn)業(yè)創(chuàng)新高地建設(shè)推進(jìn)大會,正式啟動了杭州具身智能應(yīng)用中試基地。在此次大會上,備受矚目的機(jī)器人公司宇樹科技的CEO王興興被授予首席科學(xué)家聘書,將主導(dǎo)該基地的技術(shù)與科研方向。
該中試基地旨在打通科研成果與產(chǎn)業(yè)化之間的“最后一公里”,它將建設(shè)包括能力供給中心、模型訓(xùn)練中心、場景驗(yàn)證中心和測試認(rèn)證中心在內(nèi)的四大核心功能區(qū)。通過這一系列布局,杭州高新區(qū)希望形成“算力+數(shù)據(jù)+模型+場景應(yīng)用”的完整鏈條,培育新質(zhì)生產(chǎn)力,最終打造一個具有全國示范效應(yīng)的具身智能全體系高地。
為確保具身智能產(chǎn)業(yè)的快速發(fā)展,杭州高新區(qū)推出了多項(xiàng)強(qiáng)有力的支持政策。
在數(shù)據(jù)要素方面,政府將提供每年高達(dá)5000萬元的“語料券”,并為企業(yè)年度基礎(chǔ)設(shè)施使用費(fèi)用提供最高50% 的補(bǔ)助,以鼓勵企業(yè)在人工智能大模型研發(fā)和應(yīng)用中利用數(shù)據(jù)資源。
在算力要素方面,高新區(qū)每年將安排最高1億元的“算力券”,為企業(yè)的算力使用費(fèi)用提供最高60% 的補(bǔ)助,旨在緩解企業(yè)在AI研發(fā)中對高算力的需求壓力。
此外,大會還發(fā)布了涵蓋生產(chǎn)制造、金融貿(mào)易、醫(yī)療健康等五大領(lǐng)域的人工智能典型場景需求,并啟動了杭州數(shù)谷數(shù)據(jù)創(chuàng)新中心和浙江省人形機(jī)器人未來產(chǎn)業(yè)先導(dǎo)區(qū)的建設(shè),進(jìn)一步完善了杭州在人工智能領(lǐng)域的產(chǎn)業(yè)布局。
04
會議活動
2025世界機(jī)器人大會,千款機(jī)器人“打工”火出圈,其幕后英雄算力功不可沒
北京亦莊,立秋后的雨水未能澆滅科技熱情。2025世界機(jī)器人大會在雨中開幕。200余家企業(yè)、1500件展品、100多款全球首發(fā)新品匯聚于此,規(guī)模創(chuàng)歷屆之最。
與往屆不同,今年展館內(nèi)少了些“花拳繡腿”,多了真實(shí)工作場景的轟鳴:優(yōu)必選Walker S2在流水線上自主完成3分鐘換電后立即重返工位;宇樹R1機(jī)器人流暢完成咖啡拉花全套動作;星海圖機(jī)器人正為觀眾現(xiàn)場鋪床疊被。
隨著2025年世界機(jī)器人大會正如火如荼地開展。其中,人形機(jī)器人的場景化應(yīng)用落地進(jìn)程顯著加快——它們不再局限于“站樁”式的靜態(tài)展示,而是積極投身于探索能夠替代人類執(zhí)行任務(wù)的實(shí)際場景與解決方案,其核心競爭力集中體現(xiàn)在“能否迅速勝任工作”上,目前工廠搬運(yùn)等模擬應(yīng)用場景已大量涌現(xiàn)。在探尋合適落地場景的過程中,“先上崗實(shí)踐、再進(jìn)入家庭服務(wù)”已成為推動機(jī)器人廣泛普及的現(xiàn)實(shí)路徑。
當(dāng)鋼鐵之軀踏上運(yùn)動賽道,具身智能“元年”還會帶給我們哪些驚喜?
8月14日夜晚,全球范圍內(nèi)首個以人形機(jī)器人作為參賽核心的綜合性體育盛事——“2025世界人形機(jī)器人運(yùn)動會”,在北京的國家速滑館“冰絲帶”盛大啟幕。此次盛會吸引了來自16個國家的280支精英參賽隊(duì)伍匯聚京城。
在8月15日至17日這短短三天內(nèi),他們將圍繞競技賽、表演賽、場景賽及外圍賽四大類共計(jì)26個精彩賽項(xiàng),展開多達(dá)487場的激烈角逐,全方位展示了人形機(jī)器人在智能決策、運(yùn)動協(xié)作等尖端科技領(lǐng)域的最新突破與成就。
此番盛會,是北京在成功舉辦“世界機(jī)器人大會”“人形機(jī)器人半程馬拉松”等科技盛宴之后,再次以科技之名,向世界發(fā)出的璀璨邀請,讓全球的目光再次聚焦于這座古老而又現(xiàn)代的城市,共同見證人形機(jī)器人時代的輝煌啟航。
2025開放計(jì)算技術(shù)大會落幕 百度與浪潮信息榮膺開放計(jì)算最佳實(shí)踐標(biāo)桿
8月7日,2025開放計(jì)算技術(shù)大會在北京圓滿落幕。這場由開放計(jì)算社區(qū)OCP及開放標(biāo)準(zhǔn)組織OCTC聯(lián)合主辦,以“開放變革:筑基、擴(kuò)展、進(jìn)化”為主題的行業(yè)盛會,匯聚了中國移動、字節(jié)跳動、阿里云、三星、浪潮信息、清華大學(xué)、百度等超千位知名學(xué)者、技術(shù)專家及企業(yè)代表,圍繞計(jì)算、存儲、網(wǎng)絡(luò)、液冷等基礎(chǔ)設(shè)施底層架構(gòu)的技術(shù)創(chuàng)新,算法與算力系統(tǒng)、硬件和軟件的協(xié)同創(chuàng)新,以及開放計(jì)算技術(shù)賦能人工智能熱門應(yīng)用等議題開放分享,成為全球AI數(shù)據(jù)中心領(lǐng)域的重要風(fēng)向標(biāo)。
大會期間,OCP Foundation特別公布了2025開放計(jì)算最佳創(chuàng)新代表、最佳實(shí)踐標(biāo)桿、最佳生態(tài)貢獻(xiàn)企業(yè)名單,以激勵在開放計(jì)算領(lǐng)域做出杰出貢獻(xiàn)的企業(yè)。其中,浪潮信息與百度榮膺最佳實(shí)踐標(biāo)桿,憑借其在技術(shù)創(chuàng)新、標(biāo)準(zhǔn)構(gòu)建及實(shí)踐落地等方面的卓越表現(xiàn),成為開放計(jì)算創(chuàng)新實(shí)踐的典范。
鄂爾多斯聚“算”成勢:WEC2025世界算力博覽會成功舉行
8月13日—16日,WEC2025世界算力博覽會在鄂爾多斯國際會展中心成功舉行,本屆博覽會由中國計(jì)算機(jī)學(xué)會、全國信標(biāo)委算力標(biāo)準(zhǔn)工作組、北京并行科技股份有限公司、鄂爾多斯市高新技術(shù)產(chǎn)業(yè)投資有限責(zé)任公司聯(lián)合發(fā)起,匯集71家廠商參展,創(chuàng)歷年新高。
今年展會落地“東數(shù)西算” 工程關(guān)鍵節(jié)點(diǎn)城市——鄂爾多斯,首次實(shí)現(xiàn) “算力技術(shù)” 與 “綠色能源” 的深度融合,吸引來自產(chǎn)學(xué)研用等業(yè)界人士及各行各業(yè)的技術(shù)愛好者的積極參與,集中展示算力產(chǎn)業(yè)前沿技術(shù)和創(chuàng)新成果,涵蓋人工智能、算力、網(wǎng)絡(luò)等重點(diǎn)領(lǐng)域。
看2025中國算力大會如何為算力產(chǎn)業(yè)鏈注入“新鮮血液”!這些關(guān)鍵信息,不要錯過
8月23日,山西大同召開的2025中國算力大會主論壇上,工信部副部長熊繼軍宣布了一系列令人矚目的數(shù)據(jù):截至2025年6月底,我國在用算力中心標(biāo)準(zhǔn)機(jī)架達(dá)1085萬架,智能算力規(guī)模達(dá)788 EFLOPS(每秒百億億次浮點(diǎn)運(yùn)算),存力總規(guī)模超過1680EB。
這些數(shù)字背后是中國算力產(chǎn)業(yè)每年約30%的快速增長,尤其是智能算力需求呈現(xiàn)爆發(fā)式增長。2025中國算力大會的召開,明確了算力作為數(shù)字經(jīng)濟(jì)時代核心生產(chǎn)力的戰(zhàn)略地位,并從政策、技術(shù)、生態(tài)等多方面深刻影響了算力產(chǎn)業(yè)鏈的各個環(huán)節(jié)。