文字編輯|宋雨涵

1

重磅更新

輕量模型的“重型武器”

Gemini 2.5 Pro(穩(wěn)定版)

定位旗艦級復雜任務(wù)處理,支持多模態(tài)輸入(文本/圖像/音頻/視頻/代碼)和百萬級上下文窗口(可解析整本《三體》或3小時視頻),專注高精度編程、科學推理與長文檔分析。新增“深度思考”(Deep Think)模式,通過遞歸分析提升復雜問題解決能力,在USAMO數(shù)學競賽、LiveCodeBench編程測試中超越GPT-4.5等競品。

Gemini 2.5 Flash(穩(wěn)定版)

主打效率與成本平衡,輸入/輸出定價調(diào)整為 $0.3/$2.5/百萬Token(原預覽版為$0.15/$3.5),取消“思考/非思考”雙軌計費,統(tǒng)一為單一定價簡化成本控制。支持動態(tài)思考預算控制(0-24K Token),根據(jù)任務(wù)復雜度自動調(diào)整推理資源,在保證精度的同時降低70%計算負載。

Gemini 2.5 Flash-Lite(預覽版)

支持百萬Token上下文與多模態(tài)輸入,默認關(guān)閉“思考”功能以優(yōu)化速度,但可按需啟用。演示實時生成操作系統(tǒng)內(nèi)核能力,用戶點擊圖標后動態(tài)生成非確定性UI界面(如文件夾內(nèi)容實時變化),顛覆傳統(tǒng)軟件開發(fā)流程。

性價比核彈:輸入/輸出成本僅?$0.1/$0.4/百萬Token(約¥0.7/¥2.9),較前代Flash輸出成本降低62%,創(chuàng)行業(yè)新低。

首個在TPU v5p架構(gòu)上訓練的模型系列

Gemini2.5系列模型運用了稀疏混合專家(MoE)架構(gòu),具備原生支持文本、視覺以及音頻輸入的能力。稀疏MoE模型的工作原理是,通過學習將不同的token動態(tài)分配到參數(shù)子集(即專家)中,為每個輸入token激活特定的模型參數(shù)子集。這種機制讓模型總?cè)萘颗c每個token的計算及服務(wù)成本實現(xiàn)了分離。

在應對訓練不穩(wěn)定性的挑戰(zhàn)時,Gemini2.5模型系列著重在增強大規(guī)模訓練穩(wěn)定性、優(yōu)化信號傳播以及改進動態(tài)方面取得了突出成果。該系列模型是在Gemini1.5處理長上下文查詢?nèi)〉贸晒Φ幕A(chǔ)上構(gòu)建的,并融入了新的建模技術(shù),使得Gemini2.5Pro在處理長達1Mtokens的長上下文輸入序列時,性能超越了Gemini1.5Pro。無論是Gemini2.5Pro還是Gemini2.5Flash,都能夠處理長格式文本、完整的代碼庫,以及長格式的音頻和視頻數(shù)據(jù)。

Gemini2.5模型系列是谷歌首個在TPUv5p架構(gòu)上進行訓練的模型系列。谷歌采用同步數(shù)據(jù)并行訓練方式,在分布于多個數(shù)據(jù)中心的谷歌TPUv5p加速器的多個8960芯片pod上進行并行化訓練。其預訓練數(shù)據(jù)集規(guī)模龐大且類型多樣,廣泛覆蓋多個領(lǐng)域和模態(tài),包含公開可用的Web文檔、各種編程語言的代碼、圖像、音頻(涵蓋語音及其他音頻類型)以及視頻。這里需要說明的是,Gemini2.0的數(shù)據(jù)收集截止日期為2024年6月,而Gemini2.5的截止日期為2025年1月。

谷歌還采用了新方法來提升數(shù)據(jù)過濾和去重的質(zhì)量,其訓練后數(shù)據(jù)集由精心收集和審核的指令調(diào)優(yōu)數(shù)據(jù)構(gòu)成,是多模態(tài)數(shù)據(jù)的集合,除包含人類偏好和工具使用數(shù)據(jù)外,還有成對的指令和響應。谷歌研究報道指出,在后訓練階段,他們借助模型來輔助監(jiān)督微調(diào)(SFT)、獎勵建模(RM)和強化學習(RL)階段,以此實現(xiàn)更高效、更精細的數(shù)據(jù)質(zhì)量控制。此外,谷歌增加了分配給RL的訓練計算資源,并結(jié)合對可驗證獎勵和基于模型的生成獎勵的關(guān)注,以提供更復雜、更具可擴展性的反饋信號。RL過程的算法改進提升了長時間訓練期間的穩(wěn)定性。

Gemini推理模型通過強化學習進行訓練,能夠在推理時利用額外的計算資源來得出更精確的答案。生成的模型具備“思考”能力,在回答問題或查詢之前,會進行數(shù)萬次正向傳遞。

2

價格屠刀:

0.7元如何重構(gòu)行業(yè)生態(tài)?

此次更新在價格方面,Gemini-2.5-Flash-Lite比Gemini-2.5-Flash便宜30%-60%,輸入價格為0.1美元(折合人民幣約0.7元)/百萬tokens,輸出價格為0.4美元(折合人民幣約2.9元)/百萬tokens。

谷歌還宣布了Gemini 2.5 Flash的最新定價,模型的思考和非思考價格相同,輸入價格為0.3美元(折合人民幣約2.2元)/百萬tokens,輸出價格為2.5美元(折合人民幣約17.9元)/百萬tokens。

我們再來看看主流模型定價格局(20256月)

模型輸入成本/百萬token輸出成本/百萬token性價比定位
Gemini 2.5 Flash-Lite$0.1 (≈¥0.7)$0.4 (≈¥2.9)極致性價比
Gemini 2.5 Flash$0.3$2.5均衡型
OpenAI GPT-4 Turbo$10$30高性能高成本
OpenAI GPT-4o-mini$1.1$4.4輕量競品
DeepSeek-R1$1.0$16.0 (≈¥22)開源性價比代表
Claude 3.7 Sonnet$3.0$15.0中高端

定價背后的三重革命

?技術(shù)民主化加速:頂尖AI從“實驗室奢侈品”變?yōu)椤伴_發(fā)者日用品”,一瓶礦泉水錢處理千萬字時代正式開啟;

?競爭維度升維:模型戰(zhàn)場從“純性能PK”轉(zhuǎn)向“效能+成本+生態(tài)”綜合較量,谷歌借云基建優(yōu)勢碾壓純軟件廠商;

③?行業(yè)標準重置:$0.1/百萬token成為新心理錨點,倒逼全行業(yè)優(yōu)化架構(gòu)——沒有MoE與超算集群的玩家,或許將或?qū)⒂谰贸鼍?/strong>。

未來展望:

價格戰(zhàn)只是開始,生態(tài)戰(zhàn)才是終局

谷歌此次”放核彈”絕非孤立事件。結(jié)合近期動作:

1、硬件協(xié)同:搭配Tensor?G5芯片的Pixel?10系列將在Q3發(fā)布,GFL將作為默認AI助手

    2、開發(fā)者激勵:推出”AI?Startup?Fund”計劃,承諾前100萬次調(diào)用免費

    3、開源布局:GFL的蒸餾技術(shù)論文將在CVPR2025發(fā)表

    這標志著AI競爭從單點技術(shù)突破,升級為”硬件-模型-生態(tài)”的立體戰(zhàn)爭。對于企業(yè)用戶而言,真正的價值不在于API價格,而是能否構(gòu)建端到端解決方案

    結(jié)語:

    谷歌此次”價格核爆”式的發(fā)布,不僅是一款新產(chǎn)品的亮相,更標志著AI行業(yè)進入了一個全新的發(fā)展階段。當千億參數(shù)模型以0.7元/百萬token的價格提供時,我們不禁要問:AI民主化的拐點是否已經(jīng)到來?

    這一輪”價格戰(zhàn)”背后,是AI基礎(chǔ)設(shè)施成熟度的重要里程碑。如同云計算在2010年代初期的發(fā)展軌跡,當計算資源價格突破某個臨界點后,會催生大量新型應用和創(chuàng)新模式??梢灶A見,GFL的低成本高性能將加速各行業(yè)AI應用滲透,特別是在傳統(tǒng)企業(yè)數(shù)字化、醫(yī)療健康、教育普惠等領(lǐng)域。

    分享到

    lixiangjing

    算力豹主編

    相關(guān)推薦