就在昨日,其首席執(zhí)行官山姆·奧爾特曼(Sam Altman)以一種極具震撼力的方式,揭開(kāi)了一項(xiàng)特別計(jì)劃的神秘面紗:OpenAI將傾情呈現(xiàn)一場(chǎng)為期12天的直播馬拉松,內(nèi)容精彩紛呈,既有新品發(fā)布的激動(dòng)人心,也有功能更新的耳目一新,更有一系列被譽(yù)為“圣誕禮物”的神秘環(huán)節(jié),令人充滿(mǎn)期待。
OpenAI的這一活動(dòng)預(yù)告,猶如一顆石子投入平靜的湖面,瞬間激起了層層漣漪,引發(fā)了全球的轟動(dòng)。
全球的科技媒體為之沸騰,即便時(shí)差成為一道難以逾越的鴻溝,也阻擋不了他們渴望參與這場(chǎng)“科技盛宴”的滿(mǎn)腔熱情。
在北京時(shí)間12月6日凌晨?jī)牲c(diǎn),萬(wàn)眾矚目的“12 Days of OpenAI, Day 1”直播終于拉開(kāi)序幕。
重磅直播內(nèi)容
1.推出o1正式版,這是首次將多模態(tài)能力與新型推理范式相結(jié)合的版本。相比于 o1 preview,它更加智能,響應(yīng)速度顯著提升。目前o1模型已全面上線,API 功能也將在不久后推出。
2.發(fā)布了全新專(zhuān)業(yè)版套餐——ChatGPT Pro,訂閱費(fèi)用為每月200美元,用戶(hù)可無(wú)限訪問(wèn)OpenAI的模型,包括語(yǔ)音功能。此外,Pro套餐還引入了o1 Pro模式,在數(shù)學(xué)、科學(xué)和編碼等挑戰(zhàn)性機(jī)器學(xué)習(xí)基準(zhǔn)測(cè)試中表現(xiàn)更好。
推出o1正式版
讓我們先聚焦于廣大用戶(hù)能夠親身體驗(yàn)的o1大模型。直播活動(dòng)結(jié)束后,ChatGPT Plus的用戶(hù)群體已逐步迎來(lái)了o1模型的完整版本?;厮葜?月,該模型首次以預(yù)覽版的形式與大家見(jiàn)面。o1模型的一大特色在于,它并非簡(jiǎn)單地“脫口而出”答案,而是構(gòu)建了一個(gè)類(lèi)似人類(lèi)思考的內(nèi)部邏輯鏈條,顯著提升了回答專(zhuān)業(yè)問(wèn)題時(shí)的精確度。簡(jiǎn)而言之,新推出的完整版o1模型相較于預(yù)覽版,速度更快、性能更強(qiáng)、準(zhǔn)確度更高,并新增了多模態(tài)輸入功能,即用戶(hù)現(xiàn)在可以上傳圖片進(jìn)行詢(xún)問(wèn)。
OpenAI透露,與預(yù)覽版相比,當(dāng)前的o1模型“思維過(guò)程已變得更加精簡(jiǎn)高效”(提速約50%),并且在應(yīng)對(duì)復(fù)雜現(xiàn)實(shí)問(wèn)題時(shí),發(fā)生重大錯(cuò)誤的概率降低了34%。在一次演示中,當(dāng)被要求“列出2世紀(jì)羅馬皇帝的名字、任期和主要成就”時(shí),o1模型僅“思考”了14秒便給出了答案,而預(yù)覽版則耗時(shí)34秒。值得一提的是,能力稍弱的GPT-4o在回答這個(gè)問(wèn)題時(shí)還會(huì)出現(xiàn)錯(cuò)誤。
o1模型的另一項(xiàng)重大更新是支持圖片輸入功能,這意味著用戶(hù)可以在向模型詢(xún)問(wèn)如“太空數(shù)據(jù)中心散熱問(wèn)題”時(shí),附上一張手繪示意圖以輔助說(shuō)明。OpenAI還表示,他們計(jì)劃在未來(lái)數(shù)月內(nèi)進(jìn)一步增加功能,如網(wǎng)頁(yè)瀏覽和文件上傳等。
此外,OpenAI還展示了o1模型(以中間淺紅色柱子表示)在回答數(shù)學(xué)、編程以及博士級(jí)別科學(xué)問(wèn)題時(shí)的卓越表現(xiàn),其準(zhǔn)確率明顯高于o1預(yù)覽版(左邊橘色柱子)。而右邊的綠色柱子則代表了進(jìn)一步的提升,那是專(zhuān)為ChatGPT Pro用戶(hù)打造的o1 Pro模式。
一個(gè)月200美元的ChatGPT Pro
ChatGPT Pro是OpenAI推出的最新訂閱檔次,比ChatGPT Plus貴上10倍。
花費(fèi)1個(gè)月200美元后,用戶(hù)可以無(wú)限量地使用o1模型(Plus用戶(hù)目前的限制是每周50條信息),以及無(wú)限量使用o1 mini和高級(jí)語(yǔ)音模式,同時(shí)也能用上o1 pro模式。
官方的定義稱(chēng),o1 pro會(huì)使用更多的計(jì)算資源進(jìn)入深入思考,并為“最難的問(wèn)題提供最好的答案”。OpenAI未來(lái)也會(huì)給這個(gè)訂閱檔次,添加更多更強(qiáng)大、計(jì)算密集型的功能。
簡(jiǎn)而言之,如果您是一名科學(xué)研究人員或程序員,且o1模型的推理能力不足以滿(mǎn)足需求,那么可以考慮嘗試一下“氪金”進(jìn)階模式。
在演示中,OpenAI演示了通過(guò)設(shè)定一系列苛刻的條件,讓o1 pro篩選出符合條件的蛋白質(zhì)。
在OpenAI的公告中,也提到向10名醫(yī)學(xué)研究人員贈(zèng)送了免費(fèi)ChatGPT Pro,研究領(lǐng)域涵蓋孤兒病、癌癥、癡呆等。這大概也是使用這個(gè)訂閱服務(wù)的人群畫(huà)像。
ChatGPT Pro的特色之一是引入了o1 pro模式,增加了計(jì)算資源投入,讓模型在解答困難問(wèn)題時(shí)進(jìn)行更深入的思考和分析。這項(xiàng)服務(wù)主要面向需要進(jìn)行高級(jí)數(shù)據(jù)分析和處理的科研人員、工程師以及其他專(zhuān)業(yè)人士,幫助他們提高工作效率并保持在人工智能技術(shù)最前沿。
根據(jù)外部專(zhuān)家的評(píng)測(cè),o1 pro模式在處理復(fù)雜的數(shù)據(jù)科學(xué)、編程和案例分析問(wèn)題時(shí),能夠提供比以往模型更為精確和全面的響應(yīng)。在進(jìn)行數(shù)學(xué)、科學(xué)和編程等領(lǐng)域的機(jī)器學(xué)習(xí)基準(zhǔn)測(cè)試時(shí),o1 pro模式的表現(xiàn)優(yōu)于o1和o1-preview模型。
為了突出o1 pro模式的主要優(yōu)勢(shì)(提高可靠性),OpenAI使用更嚴(yán)格的評(píng)估設(shè)置:只有當(dāng)模型在四次嘗試中有四次能夠正確回答問(wèn)題(“4/4 可靠性”),才被認(rèn)為解決了問(wèn)題。
思維鏈CoT的推理方法
不論是預(yù)覽版,還是完整版o1,都是通過(guò)大規(guī)模強(qiáng)化學(xué)習(xí)進(jìn)行了訓(xùn)練,掌握了一種前沿的思維鏈CoT的推理方法。這種方法,不僅僅是簡(jiǎn)單地給出答案,而是像人類(lèi)思考一樣,逐步分析和推理。而且,o1系列模型的一個(gè)重大突破在于——安全性推理能力。
當(dāng)面對(duì)潛在的不安全提示詞時(shí),它能精準(zhǔn)理解上下文,根據(jù)預(yù)設(shè)安全策略進(jìn)行深度推理。
這使得o1在多個(gè)安全基準(zhǔn)測(cè)試中,展現(xiàn)出卓越的性能,比如有效地址非法建議的生成、拒絕刻板印象的響應(yīng)、低于已知的模型越獄攻擊。結(jié)合CoT的智能增強(qiáng)的同時(shí),也帶了潛在的風(fēng)險(xiǎn)。
為了確保模型安全,OpenAI研發(fā)團(tuán)隊(duì)采取了多層次的風(fēng)險(xiǎn)管理策略。比如,他們建立了穩(wěn)健的對(duì)齊方法,進(jìn)行了廣泛的壓力測(cè)試,并維護(hù)細(xì)致的風(fēng)險(xiǎn)管理協(xié)議。
數(shù)據(jù)和訓(xùn)練
在此之前,先來(lái)了解下o1的數(shù)據(jù)和訓(xùn)練過(guò)程。完整版o1是該系列旗艦?zāi)P?,o1-mini是專(zhuān)注編碼的輕量級(jí)版本。通過(guò)強(qiáng)化學(xué)習(xí)RL進(jìn)行訓(xùn)練的目的,就是讓o1系列能夠進(jìn)行復(fù)雜的推理。o1在回答之前進(jìn)行思考——它可以在響應(yīng)用戶(hù)之前產(chǎn)生長(zhǎng)的思維鏈條。
通過(guò)訓(xùn)練,模型學(xué)會(huì)了優(yōu)化思維過(guò)程,去嘗試不同的策略,并自主識(shí)別錯(cuò)誤。推理使o1模型能夠遵循OpenAI設(shè)定的特定指南和模型政策,幫助其符合安全期望。不僅如此,o1模型的訓(xùn)練數(shù)據(jù)源豐富多樣,包括公開(kāi)可用數(shù)據(jù)、通過(guò)合作伙伴關(guān)系訪問(wèn)的專(zhuān)有數(shù)據(jù),以及內(nèi)部開(kāi)發(fā)的自定義數(shù)據(jù)集。
– 公共數(shù)據(jù):
兩個(gè)模型都在各種公開(kāi)可用的數(shù)據(jù)集上進(jìn)行了訓(xùn)練,包括網(wǎng)絡(luò)數(shù)據(jù)和開(kāi)源數(shù)據(jù)集。
關(guān)鍵組成部分包括推理數(shù)據(jù)和科學(xué)文獻(xiàn)。這確保了模型在一般知識(shí)和技術(shù)主題上都很精通,增強(qiáng)了它們執(zhí)行復(fù)雜推理任務(wù)的能力。
– 來(lái)自數(shù)據(jù)合作伙伴的專(zhuān)有數(shù)據(jù):
為了進(jìn)一步增強(qiáng)o1和o1-mini的能力,OpenAI通過(guò)戰(zhàn)略合作,獲取高價(jià)值的非公開(kāi)數(shù)據(jù)集。
這些專(zhuān)有數(shù)據(jù)源包括收費(fèi)內(nèi)容、專(zhuān)業(yè)檔案和其他特定領(lǐng)域的數(shù)據(jù)集,提供了對(duì)行業(yè)特定知識(shí)和用例的更深入見(jiàn)解。
– 數(shù)據(jù)過(guò)濾和優(yōu)化:
OpenAI數(shù)據(jù)處理管道包括嚴(yán)格的過(guò)濾,以保持?jǐn)?shù)據(jù)質(zhì)量和減輕潛在風(fēng)險(xiǎn)。研究團(tuán)隊(duì)使用先進(jìn)的數(shù)據(jù)過(guò)濾流程來(lái)減少訓(xùn)練數(shù)據(jù)中的個(gè)人信息。他們還結(jié)合使用自家的審核API和安全分類(lèi)器,防止使用有害或敏感內(nèi)容,包括諸如CSAM等材料。
結(jié)語(yǔ)
OpenAI的這一系列動(dòng)作,無(wú)疑將推動(dòng)AI技術(shù)的進(jìn)一步發(fā)展和應(yīng)用。隨著滿(mǎn)血版o1模型和ChatGPT Pro的推出,AI技術(shù)在各個(gè)領(lǐng)域的應(yīng)用將更加廣泛和深入。同時(shí),這也為相關(guān)企業(yè)和個(gè)人提供了新的商業(yè)機(jī)會(huì)和發(fā)展空間。
此外,據(jù)外媒報(bào)道,OpenAI還將在之后的直播中發(fā)布文生視頻工具Sora等新產(chǎn)品。這些新產(chǎn)品的推出,將進(jìn)一步豐富OpenAI的產(chǎn)品線,為用戶(hù)提供更加多樣化和個(gè)性化的服務(wù)。
綜上所述,OpenAI的為期12天的直播活動(dòng)已經(jīng)拉開(kāi)了帷幕,滿(mǎn)血版o1模型和ChatGPT Pro的推出引發(fā)了廣泛關(guān)注和期待。未來(lái),隨著AI技術(shù)的不斷發(fā)展和應(yīng)用,我們有理由相信OpenAI將為用戶(hù)帶來(lái)更多驚喜和突破。(文/宋雨涵)