2024年9月13日凌晨前后,OpenAI正式發(fā)布了全新的AI模型系列——OpenAI o1,該系列專為解決復(fù)雜問題而設(shè)計,具備更強的推理能力,尤其在科學(xué)、編程和數(shù)學(xué)領(lǐng)域表現(xiàn)出色。

此次發(fā)布的首個版本已經(jīng)通過ChatGPT和API開放預(yù)覽,未來還會定期更新和優(yōu)化。此外,OpenAI還發(fā)布了該系列的輕量版本“o1-mini”,為開發(fā)者提供更高效、更具性價比的解決方案。

模型主要特點

OpenAI o1系列模型的獨特之處在于,它們會在回答問題之前花費更多時間進行推理和思考,類似于人類的解決問題方式。通過訓(xùn)練,這些模型能夠優(yōu)化自己的思考過程,嘗試不同的解決策略,并識別和糾正錯誤。

在多項測試中,o1系列的下一個版本在物理、化學(xué)和生物學(xué)等學(xué)科的高難度任務(wù)中表現(xiàn)出接近博士生的水準(zhǔn),特別是在數(shù)學(xué)和編程方面表現(xiàn)突出。

在國際數(shù)學(xué)奧林匹克競賽(IMO)的資格考試中,GPT-4o僅解決了13%的問題,而o1模型的正確率高達83%。在Codeforces編程競賽中,o1的表現(xiàn)達到了89%的優(yōu)秀水平。

此外,OpenAI推出的輕量版本“o1-mini”同樣專注于復(fù)雜代碼的生成和調(diào)試。與o1-preview相比,o1-mini的成本降低了80%,因此對于那些需要推理但不依賴廣泛世界知識的應(yīng)用場景,它是一款高效、經(jīng)濟的解決方案。

使用方式?現(xiàn)在就可以用上了

ChatGPT Plus和Team用戶從今日起可以在ChatGPT中訪問o1系列模型。用戶可以在模型選擇器中手動選擇o1-preview或o1-mini模型。

初期的使用限制為,o1-preview每周30條消息,o1-mini每周50條消息。未來會計劃增加使用限制,并讓ChatGPT能夠自動選擇最適合用戶問題的模型。

從下周開始,ChatGPT Enterprise和Edu用戶也可以使用這兩個模型。同時,開發(fā)者若達到API使用的第5級別門檻,也可從今天起在API中原型設(shè)計并測試這兩個模型,初期的API調(diào)用限制為每分鐘20次請求。

隨著進一步的測試,OpenAI將逐步提高這一限額。目前API尚不支持函數(shù)調(diào)用、流式處理和系統(tǒng)消息等功能,開發(fā)者可以通過API文檔了解更多。

未來,OpenAI還計劃將o1-mini的使用權(quán)向所有ChatGPT免費用戶開放。

安全保障方面

為了確保新模型的安全性,OpenAI引入了一種新的安全訓(xùn)練方法。

在測試中,o1-preview在應(yīng)對“越獄”時表現(xiàn)優(yōu)異,得分為84分(滿分100分),遠(yuǎn)高于GPT-4o的22分。

未來計劃

此次發(fā)布的o1系列仍處于預(yù)覽階段,未來OpenAI計劃為這些推理模型添加更多功能,如瀏覽網(wǎng)頁、上傳文件和圖片等,以提高其通用性。

通過此次推出的o1和o1-mini模型,OpenAI為科學(xué)、編程和數(shù)學(xué)等復(fù)雜領(lǐng)域的專業(yè)人士提供了更強大的工具,推動了AI在解決復(fù)雜問題方面的進步。

分享到

zhupb

相關(guān)推薦