快手副總裁、可靈AI負(fù)責(zé)人張迪

值得一提的是,可靈2.0大師版全面升級視頻及圖像創(chuàng)作可控生成與編輯能力,上線全新的多模態(tài)視頻編輯功能,能靈活理解用戶意圖。支持在一段視頻的基礎(chǔ)之上,通過輸入圖片或文字,對生成的視頻內(nèi)容實(shí)現(xiàn)元素的增加、刪減、替換,幫助創(chuàng)作者們實(shí)現(xiàn)更加靈活的二次編輯和處理。

可靈2.0大師版操作界面

可圖2.0:

圖像生成與編輯的「六邊形戰(zhàn)士」

快手負(fù)責(zé)人張迪披露,當(dāng)前,圖生視頻約占到可靈AI視頻創(chuàng)作量的85%,圖片質(zhì)量也對視頻的生成效果產(chǎn)生重要作用。

在圖像生成大模型領(lǐng)域,快手的可圖2.0處于行業(yè)領(lǐng)先水平,擁有多項(xiàng)核心優(yōu)勢,諸如強(qiáng)大的復(fù)雜語義理解能力、電影級的畫面質(zhì)感、多條件的可控風(fēng)格化生成等。在團(tuán)隊(duì)內(nèi)部的多項(xiàng)勝負(fù)率評測中,相較于Midjourney V7、FLUX1.1 [pro]以及Reve等行業(yè)領(lǐng)先的圖像模型,均保持明顯優(yōu)勢。

張迪介紹,可圖2.0文生圖能力迎來全面升級。包括大幅提升指令遵循能力、顯著增強(qiáng)電影美學(xué)表現(xiàn)力以及更多元的藝術(shù)風(fēng)格。在風(fēng)格化響應(yīng)上,可圖2.0可支持60多種風(fēng)格化的效果轉(zhuǎn)繪,模型出圖創(chuàng)意和想象力實(shí)現(xiàn)大幅躍升。

同時,可圖2.0也上線了實(shí)用的圖像可控編輯功能——局部重繪和擴(kuò)圖,支持圖片的增加、修改和修復(fù)。在圖像的多模態(tài)可控生成中,可圖2.0還上線了全新的風(fēng)格轉(zhuǎn)繪功能,只需要上傳一張圖片加上風(fēng)格描述,就能一鍵切換圖片的藝術(shù)風(fēng)格,同時精準(zhǔn)保留原圖的語義內(nèi)容。

3

AI生成進(jìn)入“可信時代”

AIGC技術(shù)又一里程碑突破

可靈2.0的發(fā)布,標(biāo)志著AIGC技術(shù)從“實(shí)驗(yàn)室突破”邁向“產(chǎn)業(yè)可信化”:

技術(shù)普惠:通過MVL降低多模態(tài)創(chuàng)作門檻,非專業(yè)用戶可生成接近專業(yè)團(tuán)隊(duì)的作品;

生態(tài)重構(gòu):與快手短視頻、直播業(yè)務(wù)深度耦合,推動“AI原生內(nèi)容”成為平臺核心競爭力;

標(biāo)準(zhǔn)建立:提出“動態(tài)質(zhì)量評估體系”,要求生成內(nèi)容在物理規(guī)律、情感表達(dá)等維度達(dá)到影視級標(biāo)準(zhǔn)。

不過,行業(yè)專家指出,可靈AI仍需解決兩大矛盾:生成質(zhì)量與成本的平衡(如高精度視頻的定價策略),以及創(chuàng)意同質(zhì)化風(fēng)險(用戶過度依賴模板生成內(nèi)容)。

結(jié)語

一場“可靈速度”的長跑

從2024年6月首次發(fā)布到2025年4月迭代至2.0版本,快手僅用10個月便完成20余次技術(shù)升級,用戶規(guī)模增長25倍。這種“快迭代、強(qiáng)落地”的策略,既源于快手對短視頻內(nèi)容痛點(diǎn)的深刻理解,也凸顯其在AI競賽中的緊迫感。

快手高級副總裁蓋坤表示:“可靈AI將持續(xù)大力推動技術(shù)創(chuàng)新,用人與AI交互的全新語言,幫助用戶實(shí)現(xiàn)復(fù)雜創(chuàng)意的精確表達(dá),“我們的初心,是讓每個人都能用AI講出好的故事,我們也真切地希望這一天更快到來”。這場由快手發(fā)起的“智能創(chuàng)作革命”,或許正拉開AI時代內(nèi)容生態(tài)重構(gòu)的序幕。

分享到

lixiangjing

算力豹主編

相關(guān)推薦