與此同時,海外巨頭Midjourney推出首代視頻模型V1,憑借美學(xué)基因與親民定價開辟差異化賽道。兩大玩家同日”亮劍”,標(biāo)志著中美企業(yè)在AI視頻賽道的競爭進入白熱化階段。

文字編輯|宋雨涵

1

MiniMax Hailuo 02

以技術(shù)硬實力定義行業(yè)新標(biāo)準(zhǔn)

MiniMax于”MiniMaxWeek”技術(shù)發(fā)布會上推出的Hailuo 02模型,首次實現(xiàn)10秒級長視頻生成能力,支持原生1080P分辨率輸出,相較此前行業(yè)主流的720P實現(xiàn)了質(zhì)的跨越。據(jù)官方實測數(shù)據(jù)顯示,該模型在復(fù)雜動態(tài)場景建模上表現(xiàn)驚艷:獅子躍火圈、小丑拋接球等高難度鏡頭均能保持動作連貫性與物理真實性,網(wǎng)友直呼”墻體碎裂細(xì)節(jié)堪比電影級特效”。

Hailuo?02?核心亮點:

2

Midjourney V1

美學(xué)驅(qū)動的普惠型視頻工具

與MiniMax的技術(shù)攻堅不同,Midjourney選擇以美學(xué)基因切入市場。其視頻模型V1延續(xù)了品牌標(biāo)志性的藝術(shù)風(fēng)格,支持用戶通過”圖像轉(zhuǎn)視頻”功能將靜態(tài)圖片轉(zhuǎn)化為5秒短視頻,并提供自動/手動雙模式運動控制。值得注意的是,該模型創(chuàng)新性地引入”擴展生成”機制,單次任務(wù)可產(chǎn)出最長20秒素材,單位成本僅相當(dāng)于傳統(tǒng)圖像生成的1/8。

同時,提供兩種運動幅度設(shè)置:

低運動(Low motion):適用于相機基本不動、主體緩慢運動的場景(如氛圍圖),但有時可能出現(xiàn)完全不動的情況。

高運動(High motion):適用于相機和主體都大幅度運動的場景,效果更具動態(tài)感,不過出錯概率相對較高。

關(guān)于視頻擴展,生成的視頻可進行“擴展”操作,每次延長約4秒,最多可延長四次。目前,視頻分辨率為480p。

Midjourney祭出殺手锏定價策略——基礎(chǔ)版月費僅需10美元,宣稱比同類產(chǎn)品便宜25倍以上。這一策略與其在圖像生成領(lǐng)域的成功路徑高度一致,旨在通過降低創(chuàng)作門檻快速占領(lǐng)C端市場。目前雖僅開放網(wǎng)頁端,但其”松弛模式”無限生成等權(quán)益已引發(fā)創(chuàng)作者群體高度期待。

全球競速:

中國軍團主導(dǎo)創(chuàng)新話語權(quán)

從OpenAI Sora到Google Veo,從字節(jié)即夢到快手可靈,視頻生成模型已成為全球AI巨頭必爭之地。而最新行業(yè)格局顯示,中國企業(yè)正在改寫游戲規(guī)則——AAVA榜單Top10中本土企業(yè)獨占七席,前五名包攬四席,這種壓倒性優(yōu)勢在科技史上絕無僅有。

技術(shù)指標(biāo)與商業(yè)模式的協(xié)同創(chuàng)新成為破局關(guān)鍵。MiniMax通過底層模型優(yōu)化實現(xiàn)性能躍升,Midjourney則以生態(tài)整合構(gòu)建護城河,二者分別代表了”技術(shù)優(yōu)先”與”體驗為王”的兩條發(fā)展路徑。隨著Meta、Adobe等巨頭加速入場,這場關(guān)乎下一代內(nèi)容生產(chǎn)范式的爭奪戰(zhàn)必將更加精彩紛呈。

“視頻生成的下一個戰(zhàn)場將是實時交互與物理仿真。”無論是MiniMax的物理引擎突破還是Midjourney的世界模型構(gòu)想,都指向同一個終極目標(biāo)——打造可交互的虛擬現(xiàn)實世界。在這場技術(shù)革命中,中國創(chuàng)新力量已然站在了舞臺中央。

結(jié)語:

“當(dāng)MiniMax用10秒1080P的動態(tài)特效,刷新了我們對‘清晰’與‘真實’的理解;當(dāng)Midjourney以10美元/月的親民價格,讓視頻創(chuàng)作不再是少數(shù)人的專利——全球視頻生成模型的競爭,早已不再是單純的技術(shù)較量,而是關(guān)于‘未來內(nèi)容如何被創(chuàng)造’的深刻變革。

看看AAVA榜單前十名中七個中國名字,再看看技術(shù)指標(biāo)和商業(yè)模式的雙重突破:中國力量正以扎實的技術(shù)實力和對用戶需求的精準(zhǔn)把握,重新制定全球AI視頻的規(guī)則。無論是MiniMax用代碼造出以假亂真的物理特效,還是Midjourney用獨到美學(xué)降低創(chuàng)作門檻,它們都在追問同一個核心:下一代的視頻,如何更逼真、更隨心所欲、更能打動人?

這場競爭的終點,或許藏在更遠(yuǎn)的未來圖景里:當(dāng)實時生成互動視頻成為日常,當(dāng)虛擬與現(xiàn)實的界限因物理仿真而模糊,我們終將抵達(dá)一個‘想到即看到,看到即觸到’的世界。在那里,中國創(chuàng)新早已不是追趕者,而是規(guī)則的塑造者和嶄新世界的開拓者?!?/p>

分享到

lixiangjing

算力豹主編

相關(guān)推薦