據(jù)來(lái)自早期測(cè)試者的反饋,Gemini 3.0在多項(xiàng)關(guān)鍵測(cè)試中表現(xiàn)出了近乎顛覆性的能力突破——從生成符合物理定律的動(dòng)畫代碼,到創(chuàng)作原創(chuàng)鋼琴曲,再到在超高難度ARC-AGI-2測(cè)試中取得接近35%的準(zhǔn)確率。

最為震撼的是只靠幾行提示詞,谷歌的AI就在瀏覽器里復(fù)刻出了蘋果引以為傲的UI。

蘋果式動(dòng)畫、窗口最小化、工具欄、瀏覽器……一應(yīng)俱全,并且所有功能都能正常運(yùn)行。

文字編輯|宋雨涵

1

核心亮點(diǎn):

能力全面突破劃

卓越的編程與前端開發(fā)能力:

從流出的測(cè)試案例看,Gemini 3.0展現(xiàn)出強(qiáng)大的代碼生成能力。它不僅能一鍵生成完整的網(wǎng)頁(yè),還能處理復(fù)雜的物理模擬,例如讓小球在六邊形中的運(yùn)動(dòng)精準(zhǔn)符合物理定律。有參與內(nèi)測(cè)的開發(fā)者稱贊其為“有史以來(lái)最強(qiáng)的前端和網(wǎng)頁(yè)開發(fā)模型”。

強(qiáng)大的多模態(tài)生成:

新模型在圖像,尤其是SVG矢量圖生成上進(jìn)步明顯。在著名的“鵜鶘騎自行車”測(cè)試中,其輸出結(jié)果細(xì)節(jié)豐富,令網(wǎng)友驚嘆。此外,它還能生成可直接在瀏覽器中運(yùn)行的黑洞可視化效果,甚至有人演示了其生成原創(chuàng)鋼琴曲的能力。

精準(zhǔn)的物理與常識(shí)推理:

除了編程,Gemini 3.0在推理方面也表現(xiàn)不俗。在超高難度的通用智力測(cè)試ARC-AGI-2中,據(jù)稱其準(zhǔn)確率接近35%,遠(yuǎn)超其他模型。在測(cè)試中,它還能正確回答出圖像中有“6根手指”,繞過(guò)了常見的“數(shù)手指”陷阱。

2

架構(gòu)革命:

混合專家模型與算力效率的博弈

混合專家模型的精妙之處在于,它雖然擁有萬(wàn)億級(jí)的龐大參數(shù)總量,但每次推理只激活其中的一小部分——據(jù)稱僅150-200億參數(shù)。

這種設(shè)計(jì)哲學(xué)帶來(lái)了根本性的效率提升。在算力成本日益成為AI普及瓶頸的今天,MoE架構(gòu)猶如一場(chǎng)及時(shí)雨。

從技術(shù)細(xì)節(jié)看,Gemini 3.0的上下文窗口從100萬(wàn)token躍升至數(shù)百萬(wàn),這一擴(kuò)展的意義怎么強(qiáng)調(diào)都不為過(guò)。這意味著模型能夠處理整本書籍或大型代碼庫(kù),實(shí)現(xiàn)了從“片段理解”到“全局把握”的跨越。

谷歌預(yù)計(jì)推出的兩個(gè)版本——Pro和Flash,體現(xiàn)了對(duì)市場(chǎng)需求的精準(zhǔn)把握。Pro版本作為全能旗艦,瞄準(zhǔn)的是對(duì)性能有極致要求的專業(yè)場(chǎng)景;Flash版本則針對(duì)速度和成本優(yōu)化,服務(wù)于需要快速響應(yīng)的應(yīng)用環(huán)境。

這種產(chǎn)品分層策略反映了AI產(chǎn)業(yè)正在從技術(shù)探索走向商業(yè)化成熟。

3

單次生成網(wǎng)頁(yè)版操作系統(tǒng)

Win、Mac、Linux一網(wǎng)打盡

沒(méi)有復(fù)雜的代碼堆砌,只靠一段幾行的提示詞,這款A(yù)I直接在瀏覽器里復(fù)刻出了蘋果引以為傲的UI細(xì)節(jié)。那段Prompt寫得直白又霸道:“設(shè)計(jì)并創(chuàng)建一個(gè)類似macOS的網(wǎng)頁(yè)版操作系統(tǒng),要包含文本編輯器、文件管理器、繪圖工具、視頻編輯器等所有macOS預(yù)裝核心軟件;可用任意庫(kù),但必須能把所有代碼整合到單個(gè)HTML文件里,粘貼后在Chrome中直接打開;要足夠有趣、細(xì)節(jié)拉滿,做出沒(méi)人能想到的驚喜,把創(chuàng)意和美感全塞進(jìn)一個(gè)代碼塊里?!?/p>

蘋果標(biāo)志性的動(dòng)態(tài)過(guò)渡動(dòng)畫、窗口最小化的絲滑效果、頂部工具欄的交互邏輯、自帶的瀏覽器……從視覺(jué)到功能,全齊了,還都能正常用。更絕的是藏在細(xì)節(jié)里的彩蛋:在終端里敲入 “matrix”,《黑客帝國(guó)》里那種數(shù)據(jù)流瀑布的炫酷特效瞬間鋪滿屏幕,連像素級(jí)的質(zhì)感都沒(méi)落下。

最恐怖的不是 “能做到”,而是成功率。要知道,前端開發(fā)里A/B測(cè)試的變量多到離譜,UI還原度更是差之毫厘謬以千里,但Gemini 3.0 Pro交出的成果,是完完全全一次生成的成品—— 沒(méi)有反復(fù)調(diào)試,沒(méi)有修改補(bǔ)漏,連源代碼都已經(jīng)同步到CodePen上公開,任何人都能下載驗(yàn)證。

網(wǎng)友看完直接炸了:“這要是正式版能穩(wěn)住這水準(zhǔn),Gemini妥妥的史上最強(qiáng)編程模型!”

寫在最后:

如果網(wǎng)絡(luò)傳聞屬實(shí),Gemini 3.0的發(fā)布無(wú)疑是AI領(lǐng)域的一次重大進(jìn)展。它在代碼生成、多模態(tài)理解和復(fù)雜推理上的能力,不僅會(huì)加劇與OpenAI、Anthropic等公司的競(jìng)爭(zhēng),更可能為前端開發(fā)、UI設(shè)計(jì)乃至整個(gè)創(chuàng)意產(chǎn)業(yè)帶來(lái)新的變革工具和工作流程。

你對(duì)Gemini 3.0的哪方面能力最感興趣?如果它正式發(fā)布,你希望將它應(yīng)用在什么領(lǐng)域呢?

分享到

lixiangjing

算力豹主編

相關(guān)推薦