文字編輯|宋雨涵
1
重磅更新
輕量模型的“重型武器”
Gemini 2.5 Pro(穩(wěn)定版)
定位旗艦級復雜任務(wù)處理,支持多模態(tài)輸入(文本/圖像/音頻/視頻/代碼)和百萬級上下文窗口(可解析整本《三體》或3小時視頻),專注高精度編程、科學推理與長文檔分析。新增“深度思考”(Deep Think)模式,通過遞歸分析提升復雜問題解決能力,在USAMO數(shù)學競賽、LiveCodeBench編程測試中超越GPT-4.5等競品。
Gemini 2.5 Flash(穩(wěn)定版)
主打效率與成本平衡,輸入/輸出定價調(diào)整為 $0.3/$2.5/百萬Token(原預覽版為$0.15/$3.5),取消“思考/非思考”雙軌計費,統(tǒng)一為單一定價簡化成本控制。支持動態(tài)思考預算控制(0-24K Token),根據(jù)任務(wù)復雜度自動調(diào)整推理資源,在保證精度的同時降低70%計算負載。
Gemini 2.5 Flash-Lite(預覽版)
支持百萬Token上下文與多模態(tài)輸入,默認關(guān)閉“思考”功能以優(yōu)化速度,但可按需啟用。演示實時生成操作系統(tǒng)內(nèi)核能力,用戶點擊圖標后動態(tài)生成非確定性UI界面(如文件夾內(nèi)容實時變化),顛覆傳統(tǒng)軟件開發(fā)流程。
性價比核彈:輸入/輸出成本僅?$0.1/$0.4/百萬Token(約¥0.7/¥2.9),較前代Flash輸出成本降低62%,創(chuàng)行業(yè)新低。
首個在TPU v5p架構(gòu)上訓練的模型系列
Gemini2.5系列模型運用了稀疏混合專家(MoE)架構(gòu),具備原生支持文本、視覺以及音頻輸入的能力。稀疏MoE模型的工作原理是,通過學習將不同的token動態(tài)分配到參數(shù)子集(即專家)中,為每個輸入token激活特定的模型參數(shù)子集。這種機制讓模型總?cè)萘颗c每個token的計算及服務(wù)成本實現(xiàn)了分離。
在應對訓練不穩(wěn)定性的挑戰(zhàn)時,Gemini2.5模型系列著重在增強大規(guī)模訓練穩(wěn)定性、優(yōu)化信號傳播以及改進動態(tài)方面取得了突出成果。該系列模型是在Gemini1.5處理長上下文查詢?nèi)〉贸晒Φ幕A(chǔ)上構(gòu)建的,并融入了新的建模技術(shù),使得Gemini2.5Pro在處理長達1Mtokens的長上下文輸入序列時,性能超越了Gemini1.5Pro。無論是Gemini2.5Pro還是Gemini2.5Flash,都能夠處理長格式文本、完整的代碼庫,以及長格式的音頻和視頻數(shù)據(jù)。
Gemini2.5模型系列是谷歌首個在TPUv5p架構(gòu)上進行訓練的模型系列。谷歌采用同步數(shù)據(jù)并行訓練方式,在分布于多個數(shù)據(jù)中心的谷歌TPUv5p加速器的多個8960芯片pod上進行并行化訓練。其預訓練數(shù)據(jù)集規(guī)模龐大且類型多樣,廣泛覆蓋多個領(lǐng)域和模態(tài),包含公開可用的Web文檔、各種編程語言的代碼、圖像、音頻(涵蓋語音及其他音頻類型)以及視頻。這里需要說明的是,Gemini2.0的數(shù)據(jù)收集截止日期為2024年6月,而Gemini2.5的截止日期為2025年1月。
谷歌還采用了新方法來提升數(shù)據(jù)過濾和去重的質(zhì)量,其訓練后數(shù)據(jù)集由精心收集和審核的指令調(diào)優(yōu)數(shù)據(jù)構(gòu)成,是多模態(tài)數(shù)據(jù)的集合,除包含人類偏好和工具使用數(shù)據(jù)外,還有成對的指令和響應。谷歌研究報道指出,在后訓練階段,他們借助模型來輔助監(jiān)督微調(diào)(SFT)、獎勵建模(RM)和強化學習(RL)階段,以此實現(xiàn)更高效、更精細的數(shù)據(jù)質(zhì)量控制。此外,谷歌增加了分配給RL的訓練計算資源,并結(jié)合對可驗證獎勵和基于模型的生成獎勵的關(guān)注,以提供更復雜、更具可擴展性的反饋信號。RL過程的算法改進提升了長時間訓練期間的穩(wěn)定性。
Gemini推理模型通過強化學習進行訓練,能夠在推理時利用額外的計算資源來得出更精確的答案。生成的模型具備“思考”能力,在回答問題或查詢之前,會進行數(shù)萬次正向傳遞。
2
價格屠刀:
0.7元如何重構(gòu)行業(yè)生態(tài)?
此次更新在價格方面,Gemini-2.5-Flash-Lite比Gemini-2.5-Flash便宜30%-60%,輸入價格為0.1美元(折合人民幣約0.7元)/百萬tokens,輸出價格為0.4美元(折合人民幣約2.9元)/百萬tokens。
谷歌還宣布了Gemini 2.5 Flash的最新定價,模型的思考和非思考價格相同,輸入價格為0.3美元(折合人民幣約2.2元)/百萬tokens,輸出價格為2.5美元(折合人民幣約17.9元)/百萬tokens。
我們再來看看主流模型定價格局(2025年6月)
模型 | 輸入成本/百萬token | 輸出成本/百萬token | 性價比定位 |
Gemini 2.5 Flash-Lite | $0.1 (≈¥0.7) | $0.4 (≈¥2.9) | 極致性價比 |
Gemini 2.5 Flash | $0.3 | $2.5 | 均衡型 |
OpenAI GPT-4 Turbo | $10 | $30 | 高性能高成本 |
OpenAI GPT-4o-mini | $1.1 | $4.4 | 輕量競品 |
DeepSeek-R1 | $1.0 | $16.0 (≈¥22) | 開源性價比代表 |
Claude 3.7 Sonnet | $3.0 | $15.0 | 中高端 |
定價背后的“三重革命”
①?技術(shù)民主化加速:頂尖AI從“實驗室奢侈品”變?yōu)椤伴_發(fā)者日用品”,一瓶礦泉水錢處理千萬字時代正式開啟;
②?競爭維度升維:模型戰(zhàn)場從“純性能PK”轉(zhuǎn)向“效能+成本+生態(tài)”綜合較量,谷歌借云基建優(yōu)勢碾壓純軟件廠商;
③?行業(yè)標準重置:$0.1/百萬token成為新心理錨點,倒逼全行業(yè)優(yōu)化架構(gòu)——沒有MoE與超算集群的玩家,或許將或?qū)⒂谰贸鼍?/strong>。
未來展望:
價格戰(zhàn)只是開始,生態(tài)戰(zhàn)才是終局
谷歌此次”放核彈”絕非孤立事件。結(jié)合近期動作:
1、硬件協(xié)同:搭配Tensor?G5芯片的Pixel?10系列將在Q3發(fā)布,GFL將作為默認AI助手
2、開發(fā)者激勵:推出”AI?Startup?Fund”計劃,承諾前100萬次調(diào)用免費
3、開源布局:GFL的蒸餾技術(shù)論文將在CVPR2025發(fā)表
這標志著AI競爭從單點技術(shù)突破,升級為”硬件-模型-生態(tài)”的立體戰(zhàn)爭。對于企業(yè)用戶而言,真正的價值不在于API價格,而是能否構(gòu)建端到端解決方案。
結(jié)語:
谷歌此次”價格核爆”式的發(fā)布,不僅是一款新產(chǎn)品的亮相,更標志著AI行業(yè)進入了一個全新的發(fā)展階段。當千億參數(shù)模型以0.7元/百萬token的價格提供時,我們不禁要問:AI民主化的拐點是否已經(jīng)到來?
這一輪”價格戰(zhàn)”背后,是AI基礎(chǔ)設(shè)施成熟度的重要里程碑。如同云計算在2010年代初期的發(fā)展軌跡,當計算資源價格突破某個臨界點后,會催生大量新型應用和創(chuàng)新模式??梢灶A見,GFL的低成本高性能將加速各行業(yè)AI應用滲透,特別是在傳統(tǒng)企業(yè)數(shù)字化、醫(yī)療健康、教育普惠等領(lǐng)域。