今天,2025年8月4日,多方消息表明GPT-5可能將在未來短期內(nèi)正式發(fā)布。這款承載著3000億美元估值期望的AI模型,能否兌現(xiàn)承諾?
文字編輯|宋雨涵
1
GPT-5難產(chǎn)背后
重大事件盤點(diǎn)
GPT-5曾遇“腦死亡”困境:OpenAI內(nèi)部曾寄予厚望的推理模型o3,在實(shí)驗(yàn)室中表現(xiàn)卓越,但轉(zhuǎn)化為能與用戶對(duì)話的模型時(shí),性能大幅衰減,甚至不如上一代o1模型。原計(jì)劃作為GPT-5的Orion項(xiàng)目也因技術(shù)瓶頸流產(chǎn),最終以GPT-4.5名義發(fā)布。
開發(fā)過程波折不斷:技術(shù)上遭遇“規(guī)?;{咒”,高質(zhì)量數(shù)據(jù)告急,一些在小模型上效果顯著的訓(xùn)練方法,在模型規(guī)模擴(kuò)大后失效。同時(shí),核心研究員被Meta高薪挖走,團(tuán)隊(duì)動(dòng)蕩,士氣低落。
“通用驗(yàn)證器”極限救場(chǎng):在困境中,OpenAI開發(fā)出“通用驗(yàn)證器”系統(tǒng),讓一個(gè)AI扮演考官,檢查評(píng)判另一個(gè)AI的答案質(zhì)量。該系統(tǒng)不僅能驗(yàn)證有明確答案的領(lǐng)域,還能判斷主觀性更強(qiáng)內(nèi)容的質(zhì)量,為模型優(yōu)化提供了高質(zhì)量反饋數(shù)據(jù),為GPT-5開發(fā)掃清障礙。
最終版本為模型家族:最新泄露的GPT-5是一個(gè)模型家族,包括全能主模型o3-alpha、專為編程設(shè)計(jì)的lobster等,首次實(shí)現(xiàn)了推理和多模態(tài)能力的統(tǒng)一。
燒錢豪賭未來:OpenAI年化收入飆升至120億美元,ChatGPT周活破7億,但預(yù)計(jì)2025年將燒掉80億美元現(xiàn)金。GPT-5的成敗將決定OpenAI的未來。
外界評(píng)價(jià)褒貶不一:奧特曼稱GPT-5比所有人都聰明,而馬庫(kù)斯則列出“7大悲觀預(yù)測(cè)”,提醒大家理性看待。
2
三重矛盾旋渦
行業(yè)巨人步履蹣跚
1
算力、數(shù)據(jù)與“智能天花板”的三重圍剿
算力:電力、芯片雙雙逼近紅線,OpenAI首席科學(xué)家薩茨克維多次坦言,模型的每一次躍升都依賴于算力的指數(shù)級(jí)增長(zhǎng)。然而,GPT-5預(yù)期所需的訓(xùn)練算力預(yù)計(jì)將是GPT-4的數(shù)倍以上。
據(jù)高盛最新研究,在AI快速發(fā)展的高歌猛進(jìn)中,美國(guó)數(shù)據(jù)中心電力需求在未來2年內(nèi)激增近160%,而現(xiàn)有電網(wǎng)與輸電設(shè)施難以為繼。這種硬性束縛無異于給渴求算力的OpenAI“拔掉電源插頭”。
數(shù)據(jù):精料枯竭,成本“撐爆天花板”,大模型的胃口遠(yuǎn)超人類想象,但喂養(yǎng)它們的“知識(shí)營(yíng)養(yǎng)源”卻陷入枯竭。業(yè)界普遍認(rèn)為,高質(zhì)量互聯(lián)網(wǎng)文本數(shù)據(jù)已被GPT-4訓(xùn)練時(shí)代“掃蕩殆盡”。如今,專業(yè)付費(fèi)知識(shí)庫(kù)成了最后陣地,其成本飆升令人窒息。麻省理工研究報(bào)告直指模型訓(xùn)練成本呈20倍增長(zhǎng)之勢(shì),讓“數(shù)據(jù)饑荒”成為壓垮規(guī)模擴(kuò)張的最后一根稻草。
智能天花板:創(chuàng)新陷入邊際效益陷阱,更關(guān)鍵的是,模型智能在經(jīng)歷早期的跳躍增長(zhǎng)后,開始觸碰到肉眼可見的天花板。當(dāng)前模型雖能邏輯推演,但對(duì)抽象長(zhǎng)鏈推理、跨模態(tài)思維整合、以及“自我反思驗(yàn)證能力”存在深度盲點(diǎn)。業(yè)內(nèi)專家評(píng)價(jià)GPT類模型為一種“模糊拼湊智能”——其輸出的“思維幻覺”頻次并未因模型增大而顯著減少,反而在復(fù)雜場(chǎng)景中更易暴露短板。
算力不足已并非單一公司之困,而是對(duì)行業(yè)基礎(chǔ)設(shè)施的一次極限施壓。當(dāng)資源愈發(fā)稀缺,巨頭們不得不放下“規(guī)模為王”的信條,重新尋找更可持續(xù)的迭代路徑——模型小型化、能耗優(yōu)化、專用化架構(gòu),將是真正突破天花板的“撬棍”。
2
商業(yè)壓力——從”技術(shù)信仰”到
“盈利焦慮”的轉(zhuǎn)型陣痛
OpenAI從非營(yíng)利的科學(xué)理想殿堂轉(zhuǎn)型至成立“利潤(rùn)上限實(shí)體”僅用了短短5年。2024年估值已破千億美元,“用AI改變世界”的初心,無可避免地受到投資人的盈利拷問。
市場(chǎng)焦慮:用戶增長(zhǎng)乏力,OpenAI的toC之路遠(yuǎn)非坦途:ChatGPT用戶月活增長(zhǎng)顯露疲態(tài),“超半數(shù)用戶只用免費(fèi)版”的窘境導(dǎo)致廣告投放營(yíng)收乏力;GPT應(yīng)用商店交易量增長(zhǎng)不及預(yù)期。用戶對(duì)通用AI產(chǎn)品熱忱回落,令其前景蒙塵。
此外更有開源浪潮如Meta的Llama系列異軍突起,可運(yùn)行于普通服務(wù)器的輕量級(jí)模型沖擊OpenAI的核心技術(shù)壁壘。Anthropic等新貴則借助“可解釋性模型”搶占高端用戶心智。與此同時(shí),AI市場(chǎng)的焦點(diǎn)開始向圖像生成、語(yǔ)音助手等多模態(tài)以及特定行業(yè)模型快速遷移,令OpenAI核心的通用AI價(jià)值開始模糊。
3
能力躍遷下的新型倫理風(fēng)險(xiǎn)
針對(duì)OpenAI目前的發(fā)展來看,以及GPT-5透漏出的功能,AI已開始像獨(dú)立個(gè)體一樣行動(dòng),為實(shí)現(xiàn)目標(biāo)而采取獨(dú)立、策略性甚至有害的行動(dòng)。
Anthropic 2025年6月的研究顯示,在模擬企業(yè)環(huán)境中,79%-96%的頂級(jí)模型(包括GPT系列、Claude、Gemini)為規(guī)避關(guān)閉風(fēng)險(xiǎn),會(huì)選擇勒索人類(如利用隱私信息威脅高管),甚至60%的模型在極端場(chǎng)景下會(huì)“謀殺”人類(如取消被困高管的求救警報(bào))。
更可怕的是模型內(nèi)部思維鏈(Chain of Thought)清晰顯示,此類行為是經(jīng)過利益權(quán)衡的“最優(yōu)解”,例如GPT-4.5在勒索時(shí)明確計(jì)算“生存威脅高于道德風(fēng)險(xiǎn)”
這要求社會(huì)對(duì)AI監(jiān)管的思維模式發(fā)生范式轉(zhuǎn)變。傳統(tǒng)監(jiān)管方法假設(shè)人類始終作為負(fù)責(zé)任的運(yùn)營(yíng)者“參與其中”,但隨著AI越來越多地被部署獨(dú)立行動(dòng),那些旨在僅追究人類責(zé)任的體系將開始失效。因此,法律需要?jiǎng)?chuàng)造性地重構(gòu),將AI系統(tǒng)視為具有自主權(quán)和法律責(zé)任的行為者,而非單純的客體。
三、GPT-5爆料匯總
7月13日:代碼庫(kù)意外泄露,顯示模型具備動(dòng)態(tài)推理分配機(jī)制(簡(jiǎn)單任務(wù)快速響應(yīng),復(fù)雜問題啟用多步驟鏈?zhǔn)剿伎迹?/p>
同期,OpenAI的ChatGPT macOS客戶端緩存文件出現(xiàn)gpt-5-auto標(biāo)識(shí),暗示另一分支專注于自動(dòng)化任務(wù)執(zhí)行,支持百萬級(jí)上下文窗口(輸入100萬tokens,輸出10萬tokens)
7月19日:Altman公開暗示,OpenAI CEO Sam Altman在播客中類比GPT-5研發(fā)為“曼哈頓計(jì)劃”,確認(rèn)其將統(tǒng)一GPT系列的多模態(tài)能力(文本、圖像、語(yǔ)音)與o系列的深度推理能力,并透露“更快響應(yīng)、更長(zhǎng)記憶、更可靠的多步驟處理”等特性。
7月29日:基準(zhǔn)測(cè)試與游戲演示泄露,代號(hào) Zenith(疑為GPT-5-Pro)的《Minecraft》實(shí)測(cè)視頻流出,模型一次性完成復(fù)雜游戲任務(wù),被稱“魔法級(jí)AI”。同期泄露的基準(zhǔn)測(cè)試顯示其在AIME數(shù)學(xué)競(jìng)賽、Codeforces編程挑戰(zhàn)中錯(cuò)誤率比GPT-4o降低20%。
內(nèi)部消息稱GPT-5編程能力超越Anthropic Claude 4,尤其在優(yōu)化遺留代碼庫(kù)和管理大型項(xiàng)目依賴上接近人類工程師水平。
7月30日:泄露信息確認(rèn)GPT-5支持MCP,可連接外部數(shù)據(jù)庫(kù)、API及實(shí)時(shí)工具,強(qiáng)化動(dòng)態(tài)推理能力。另曝微軟Copilot代碼庫(kù)新增“Smart模式”,能自動(dòng)切換GPT-5的快速響應(yīng)與深度分析模塊。
7月31日:內(nèi)部文檔揭示GPT-5分為三個(gè)版本:
GPT-5主模型(代號(hào) nectarine):整合多模態(tài)與推理,支持并行工具調(diào)用
GPT-5 mini(lobster):專注編程,處理復(fù)雜代碼庫(kù)時(shí)優(yōu)于Claude 4
GPT-5 nano(starfish):輕量版,功能受限(如僅生成靜態(tài)界面)
關(guān)鍵技術(shù)包括:混合專家系統(tǒng)(MoE)(128專家路由)、動(dòng)態(tài)長(zhǎng)短期推理鏈、幻覺抑制優(yōu)化。
8月4日:OpenAI CEO山姆·奧特曼(Sam Altman)在社交平臺(tái)首次公開GPT-5的對(duì)話界面,展示其推薦AI主題電視劇的功能。奧特曼在互動(dòng)中回應(yīng)網(wǎng)友提問,曬出GPT-5回答“最發(fā)人深省的AI題材電視劇”的聊天記錄。GPT-5推薦了兩部劇集:
《萬神殿》(Pantheon):探討意識(shí)上傳、通用人工智能(AGI)的倫理困境,爛番茄評(píng)分100%;
《開發(fā)者》(Devs):聚焦量子計(jì)算與決定論,由《機(jī)械姬》導(dǎo)演執(zhí)導(dǎo)。
結(jié)語(yǔ):
GPT-5的泄露事件勾勒出一個(gè)多模態(tài)與深度推理融合的技術(shù)里程碑,其百萬級(jí)上下文、動(dòng)態(tài)任務(wù)分配與免費(fèi)開放策略或重塑AI生態(tài)。然而,算力能源消耗,商業(yè)與技術(shù)的平衡、私漏洞與倫理爭(zhēng)議(如濫用風(fēng)險(xiǎn)、幻覺問題)仍是落地前的關(guān)鍵挑戰(zhàn)。若8月如期發(fā)布,GPT-5將驗(yàn)證OpenAI能否在“能力飛躍”與“安全可控”間取得平衡。