文字編輯|宋雨涵

1

OpenAI定價(jià)策略遭挑戰(zhàn)

技術(shù)代差難掩成本短板

2月28日,OpenAI發(fā)布GPT-4.5預(yù)覽版,開發(fā)者API定價(jià)飆升至每百萬Token 75美元,較前代暴漲30倍,引發(fā)行業(yè)震蕩。分析指出,其定價(jià)策略本質(zhì)是“以價(jià)換質(zhì)”,試圖通過技術(shù)壁壘維持高端市場壟斷地位。然而數(shù)據(jù)顯示,GPT-4.5的輸入成本為DeepSeek常規(guī)服務(wù)的280倍,若對比后者在緩存命中場景的淡季折扣價(jià),價(jià)差甚至超過1000倍。

“OpenAI的純Transformer堆疊架構(gòu)已逼近邊際成本極限?!币晃籄I基礎(chǔ)設(shè)施分析師表示,“密集計(jì)算模式導(dǎo)致其單機(jī)推理效率難以突破,而DeepSeek的分布式架構(gòu)打開了新的降本空間。”

2

技術(shù)揭秘

跨節(jié)點(diǎn)專家并行重構(gòu)算力效率

3月1日,DeepSeek官方親自揭秘了DeepSeek-V3/R1推理系統(tǒng)。并且公開披露了模型推理系統(tǒng)的成本利潤為545%。

同時(shí),DeepSeek還指出,實(shí)際上沒有這么多收入,因?yàn)?nbsp;V3 的定價(jià)更低,同時(shí)收費(fèi)服務(wù)只占了一部分,另外夜間還會(huì)有折扣。

針對模型成本問題,DeepSeek在文中提到,DeepSeek-V3/R1推理服務(wù)的優(yōu)化目標(biāo)是:提高吞吐量和降低延遲。

吞吐量躍升

EP技術(shù)將批處理規(guī)模擴(kuò)大至傳統(tǒng)單機(jī)的數(shù)十倍,GPU矩陣計(jì)算效率提升超90%;

延遲銳減

每臺(tái)GPU僅需處理少量專家模塊,內(nèi)存訪問需求降低70%,端到端推理延遲壓縮至毫秒級(jí)。

多機(jī)分布式推理不再是理論構(gòu)想。”

DeepSeek其核心邏輯是:通過動(dòng)態(tài)負(fù)載均衡算法,讓計(jì)算、存儲(chǔ)、通信壓力在集群中智能分配,單機(jī)性能天花板被徹底打破。”從而實(shí)現(xiàn)高吞吐和低成本。

3

技術(shù)平權(quán)時(shí)代

算力投資轉(zhuǎn)向硬件深水區(qū)

此次技術(shù)公開正在重構(gòu)全球AI產(chǎn)業(yè)的投資邏輯。據(jù)第三方機(jī)構(gòu)測算,2025年中國AI算力市場因多機(jī)推理技術(shù)帶動(dòng)的擴(kuò)容規(guī)模將超1200億元,服務(wù)器集群、光通信、分布式存儲(chǔ)等領(lǐng)域迎來爆發(fā)式增長。

“企業(yè)開始重新評估AI預(yù)算分配?!蹦吃品?wù)商CTO透露,“過去購買軟件許可的成本正加速向定制化硬件基礎(chǔ)設(shè)施遷移,分布式架構(gòu)的邊際成本優(yōu)勢在百億級(jí)Token場景下尤其顯著。”

中國方案定義新規(guī)則

DeepSeek的突破性進(jìn)展是這場變革的核心引擎。這家中國AI企業(yè)通過“大規(guī)??绻?jié)點(diǎn)專家并行(EP)”技術(shù),將6710億參數(shù)模型的專家激活率從傳統(tǒng)模型的10%提升至80%,同時(shí)結(jié)合計(jì)算通信重疊優(yōu)化與錯(cuò)峰定價(jià)策略,實(shí)現(xiàn)單日成本利潤率高達(dá)545%。其實(shí)際定價(jià)僅為理論利潤率的1/5,并通過夜間折扣等分級(jí)計(jì)價(jià)模式,將API調(diào)用成本壓縮至OpenAI同類產(chǎn)品的1/7至1/2。

這種“高利潤空間支撐低定價(jià)”的策略,正在倒逼行業(yè)重建技術(shù)-成本-定價(jià)的三維競爭體系。行業(yè)觀察人士指出,當(dāng)技術(shù)代差被分布式架構(gòu)抹平,OpenAI的定價(jià)霸權(quán)將難以為繼。這場由跨節(jié)點(diǎn)并行技術(shù)引發(fā)的革命,或?qū)⒔K結(jié)大模型時(shí)代的“暴力堆算力”競爭,開啟以系統(tǒng)級(jí)創(chuàng)新為主導(dǎo)的新周期。

寫在最后

此次DeepSeek-V3/R1技術(shù)路線的全公開不僅驗(yàn)證了多機(jī)推理模式的正確性,更以545%的驚人成本利潤率,向全球展示了分布式推理技術(shù)的商業(yè)可行性。隨著企業(yè)將AI預(yù)算從軟件許可轉(zhuǎn)向硬件投資,2025年中國AI算力市場因多機(jī)推理技術(shù)擴(kuò)容的規(guī)模預(yù)計(jì)將突破1200億元,這一數(shù)據(jù)與《中國人工智能計(jì)算力發(fā)展評估報(bào)告》中智能算力規(guī)模兩年翻番的預(yù)測形成共振。行業(yè)專家指出,跨節(jié)點(diǎn)專家并行(EP)技術(shù)通過分散計(jì)算壓力突破單機(jī)性能瓶頸,其引發(fā)的算力需求分層與智算中心轉(zhuǎn)型,正推動(dòng)國產(chǎn)算力芯片、數(shù)據(jù)中心等基礎(chǔ)設(shè)施加速升級(jí)。在政策與市場雙重驅(qū)動(dòng)下,AI產(chǎn)業(yè)正迎來硬件投資與算法創(chuàng)新協(xié)同發(fā)展的新周期。

分享到

lixiangjing

算力豹主編

相關(guān)推薦