螞蟻開源技術(shù)委員會副主席王旭介紹全球大模型開源開發(fā)生態(tài)全景與趨勢告

報告指出,大模型開源生態(tài)正處于高速迭代階段。統(tǒng)計顯示,在全景圖收錄的項目中,有62%誕生于2022年10月“GPT時刻”(即OpenAI發(fā)布ChatGPT引發(fā)全球關(guān)注的時間節(jié)點)之后,這些項目的平均“年齡”僅30個月。這一數(shù)據(jù)直觀地反映出,自生成式AI熱潮興起以來,開源社區(qū)在短時間內(nèi)涌現(xiàn)出大量新項目,技術(shù)更新?lián)Q代極為迅速。

值得關(guān)注的是,報告揭示了中美在大模型開源策略上的路線分化:中國的科技廠商更傾向于開放模型權(quán)重的開源路線,而美國的頭部廠商大多仍采用閉源模式。這意味著中國的開源貢獻者更愿意將訓(xùn)練好的大模型參數(shù)公開共享,讓全球開發(fā)者可以像搭積木一樣自由組合這些“數(shù)字積木”來構(gòu)建新應(yīng)用。王旭指出,中國在“積木共享”上的積極性正讓全球開源生態(tài)更加充滿活力。

報告還總結(jié)了當(dāng)前大模型技術(shù)發(fā)展的幾大關(guān)鍵方向:

2

AI編碼工具爆發(fā):

開發(fā)者效率革命

新版報告中最引人注目的趨勢之一,是AI編程工具的爆發(fā)式增長。這類由大模型驅(qū)動的工具能夠自動生成和修改代碼,大幅提升程序員的開發(fā)效率,已成為當(dāng)下開源社區(qū)中最熱門的領(lǐng)域。從形態(tài)上看,AI編碼工具主要分為兩類:一類是命令行工具(CLI),例如Google近期推出的Gemini CLI;另一類是集成開發(fā)環(huán)境插件,例如名為Cline的IDE插件。前者以輕便靈活見長,深受喜歡命令行的開發(fā)者青睞;后者則注重與現(xiàn)有開發(fā)流程的深度整合,方便在IDE中直接使用。

數(shù)據(jù)顯示,2025年新出現(xiàn)的AI編碼工具平均獲得了3萬以上的開發(fā)者“星標(biāo)”關(guān)注,表明社區(qū)對這類工具的熱情之高。其中,Google的Gemini CLI開源僅3個月,GitHub星標(biāo)數(shù)已突破6萬,成為增長最快的項目之一。王旭團隊觀察到一個有趣現(xiàn)象:“做模型的廠商喜歡從命令行工具切入,而注重用戶體驗的團隊則從集成開發(fā)環(huán)境入手?!边@兩條不同路徑正共同推動著編程效率的“革命”。

這種工具熱潮的背后,反映出全球開發(fā)者對于“AI助手”的迫切需求。報告指出,隨著大模型能力的不斷提升,未來程序員可能會將更多重復(fù)性、機械性的編碼工作交給AI工具處理,從而將自身精力聚焦于更具創(chuàng)造性的設(shè)計和復(fù)雜問題的解決上。 這一趨勢有望重塑軟件開發(fā)行業(yè)的分工模式——程序員的角色將更多地從代碼編寫者轉(zhuǎn)變?yōu)锳I工具的使用者和問題拆解者,人機協(xié)作將成為常態(tài)。

3

深度解讀

云計算與AI融合趨勢

在本次外灘大會上,螞蟻開源還同步發(fā)布了“2025大模型發(fā)展時間線全景圖”。該時間線全景圖系統(tǒng)梳理了2025年1月至今全球主流廠商發(fā)布的大模型產(chǎn)品動態(tài),既包括開放了模型參數(shù)的開源模型,也涵蓋了閉源商用模型,并在圖中標(biāo)注了每個模型的參數(shù)規(guī)模、支持模態(tài)等關(guān)鍵信息。通過這一全景時間線,開發(fā)者和行業(yè)觀察者可以一目了然地了解今年以來各家科技公司在大模型領(lǐng)域的激烈競爭態(tài)勢和技術(shù)演進脈絡(luò)。

時間線全景圖顯示,進入2025年后,大模型領(lǐng)域的競爭日趨白熱化:從年初開始,每隔幾周就有重量級的新模型發(fā)布。參數(shù)規(guī)模上,既有繼續(xù)挑戰(zhàn)千億、萬億級參數(shù)的巨量模型,也出現(xiàn)了針對特定場景優(yōu)化的中等規(guī)模模型;模態(tài)方面,多模態(tài)模型密集涌現(xiàn),不少新發(fā)布的模型具備了圖像識別生成、語音對話等跨模態(tài)能力。同時,開源社區(qū)與商業(yè)公司形成了互動:一方面,開源模型為商業(yè)應(yīng)用提供了底層支撐;另一方面,商業(yè)公司的新模型也在一定程度上刺激了開源二次開發(fā)的熱潮。

三、未來展望與建議

綜合報告的洞察,可以預(yù)見未來幾年全球大模型開源生態(tài)將繼續(xù)蓬勃發(fā)展,并呈現(xiàn)出以下值得關(guān)注的走向:

首先,開源與閉源的競合關(guān)系將更加復(fù)雜。中國廠商的積極開源有望推動更多大模型權(quán)重和代碼開放共享,形成更繁榮的開源社區(qū);而美國科技巨頭雖然暫時傾向于閉源,但在競爭壓力和社區(qū)需求下,不排除逐步開放部分模型或接口的可能。兩種路線的競爭與互補,將共同塑造AI技術(shù)的發(fā)展方向。

其次,開發(fā)者生態(tài)將進一步壯大。中美印等國的開發(fā)者將在開源社區(qū)中扮演更重要的角色,多元文化和背景的貢獻者合作將催生出更具創(chuàng)新力的項目。報告中中美開發(fā)者合計占比超四成的數(shù)據(jù)表明,加強國際開發(fā)者交流與協(xié)作,有助于提升整個生態(tài)的活力和創(chuàng)造力。

再次,AI輔助開發(fā)將成為開發(fā)者標(biāo)配工具。隨著AI編碼工具的成熟和普及,未來的軟件開發(fā)流程將發(fā)生深刻變革。對于企業(yè)而言,應(yīng)積極擁抱這一趨勢,將AI助手納入開發(fā)工具鏈,提高團隊效率;對于開發(fā)者個人來說,則需要不斷學(xué)習(xí)新工具的使用方法,提升與AI協(xié)同工作的能力,以適應(yīng)行業(yè)變革。

最后,技術(shù)標(biāo)準(zhǔn)和倫理規(guī)范需同步跟進。大模型開源生態(tài)的快速發(fā)展也帶來了諸如模型安全、隱私保護、評估標(biāo)準(zhǔn)不統(tǒng)一等問題。行業(yè)參與者應(yīng)共同努力,制定開源模型的評測基準(zhǔn)和倫理準(zhǔn)則,確保大模型技術(shù)朝著負(fù)責(zé)任、可信賴的方向發(fā)展。

結(jié)語:

總而言之,《全球大模型開源開發(fā)生態(tài)全景與趨勢報告》2.0版的發(fā)布,為業(yè)界提供了一份全面詳實的“大模型開源地圖”。在這張地圖中,我們看到了全球開發(fā)者的智慧匯聚,看到了技術(shù)演進的清晰脈絡(luò),也看到了未來無限的創(chuàng)新可能。正如王旭所言,中國在開源共享方面的積極投入正在為全球AI生態(tài)注入活力??梢灶A(yù)見,在開放合作的氛圍下,大模型技術(shù)將加速迭代,并更好地賦能各行各業(yè)。展望未來,開源社區(qū)與產(chǎn)業(yè)界的良性互動必將推動人工智能邁向新的高度。

分享到

lixiangjing

算力豹主編

相關(guān)推薦