推理 AI 模型 Grok3 mini 也不容小覷。它和 Grok 3 在多方面性能上都超過(guò)或媲美 Gemini、DeepSeek 和 ChatGPT 等對(duì)手,在 MMLU 這一用于評(píng)估語(yǔ)言模型語(yǔ)言理解能力的基準(zhǔn)測(cè)試中,展現(xiàn)出了強(qiáng)大的實(shí)力。

而名為 Deepsearch 的 Grok 3 智能搜索引擎模型更是一大亮點(diǎn)。Deepsearch 被 xAI 工程師定義為 “第一代廣泛代理工具”,它不僅能幫助工程師、科研人員編寫(xiě)代碼,還能為普通用戶(hù)解答日常問(wèn)題。

Grok 3 的訓(xùn)練硬件

據(jù)悉,Grok 3 在訓(xùn)練過(guò)程中調(diào)用了 10 萬(wàn)個(gè) Nvidia H100 芯片。如此大規(guī)模的 GPU 集群為 Grok 3 提供了強(qiáng)大的計(jì)算能力,使其能夠處理極其復(fù)雜的任務(wù),相比前一代 Grok 2 使用的 15,000 個(gè) GPU 實(shí)現(xiàn)了數(shù)倍的提升。

Grok 3 與 DeepSeek 的對(duì)比

性能測(cè)試:在 AIME’24 數(shù)學(xué)能力測(cè)試中,Grok-3 取得了 52 分,明顯高于 DeepSeek-V3 的 39 分。在 GPQA 科學(xué)知識(shí)評(píng)估中,Grok-3 以 75 分領(lǐng)先 DeepSeek-V3 的 65 分。此外,在 LCB Oct – Feb 編程能力測(cè)試中,Grok-3 也以 57 分的成績(jī)超越了 DeepSeek-V3 的 36 分。

成本與應(yīng)用場(chǎng)景:Grok-3 屬于重資產(chǎn)投入模式,而 DeepSeek R1 開(kāi)源版本僅用了行業(yè) 1/50 的訓(xùn)練成本就實(shí)現(xiàn)了頂級(jí)性能,API 調(diào)用價(jià)格更是低至 0.001 元 / 千 Tokens。DeepSeek 在中文語(yǔ)義理解的準(zhǔn)確性上有優(yōu)勢(shì),并且在深圳福田區(qū)政務(wù)系統(tǒng)應(yīng)用中,將辦事流程壓縮 60%,其在 “本土化場(chǎng)景” 方面具有強(qiáng)大的護(hù)城河。

功能特性:Grok 3 更像是一個(gè)全能選手,在對(duì)話(huà)和推理方面表現(xiàn)出色,能作為日常的對(duì)話(huà)伙伴,以幽默、輕松的方式與人類(lèi)交流。而 DeepSeek 更像是專(zhuān)攻某一領(lǐng)域的高手,在處理復(fù)雜的分析任務(wù)或特定行業(yè)問(wèn)題上特別厲害。

Grok 3 與 OpenAI 的對(duì)比

性能表現(xiàn):據(jù) xAI 稱(chēng),Grok 3 在復(fù)雜推理任務(wù)中的表現(xiàn)優(yōu)于 OpenAI 的 GPT-4o 等模型,但有 xAI 員工稱(chēng) Grok 3 的編程能力優(yōu)于 DeepSeek R1,但不及 OpenAI。

響應(yīng)速度:Grok 3 在響應(yīng)速度上表現(xiàn)出色,能夠在微秒級(jí)別內(nèi)給出回答,在處理復(fù)雜查詢(xún)時(shí)幾乎無(wú)延遲,與 OpenAI 的 GPT-4 相比,Grok 3 在速度上具有明顯優(yōu)勢(shì)。

多語(yǔ)言能力:Grok 3 在處理多種語(yǔ)言方面表現(xiàn)出色,尤其是對(duì)亞洲語(yǔ)言的支持,能夠理解地方俚語(yǔ),并通過(guò)智能數(shù)據(jù)訓(xùn)練方法支持罕見(jiàn)語(yǔ)言。相比之下,OpenAI 的模型在多語(yǔ)言支持上仍有提升空間。

開(kāi)源策略:與 OpenAI 的閉源模型不同,xAI 的 Grok 3 預(yù)計(jì)將繼續(xù)沿用開(kāi)源策略,這將使全球開(kāi)發(fā)者能夠自由訪(fǎng)問(wèn)和使用該模型,促進(jìn)技術(shù)的快速傳播和創(chuàng)新。

總之,Grok 3 的發(fā)布為 AI 領(lǐng)域帶來(lái)了新的活力和競(jìng)爭(zhēng),與 DeepSeek、OpenAI 的產(chǎn)品各有千秋,未來(lái) AI 領(lǐng)域的競(jìng)爭(zhēng)和發(fā)展態(tài)勢(shì)值得持續(xù)關(guān)注。

分享到

nina

相關(guān)推薦