數(shù)智人主播當家,從形似到神似
據(jù)了解,第一財經頻道此次采用的數(shù)智人主播,根據(jù)欄目場景需求做到了更加精細化的定制,華院計算基于自研的大規(guī)模多模態(tài)預訓練技術及少樣本可控生成技術,僅需采集主持人數(shù)分鐘自由講話視頻,便創(chuàng)建出了生動的數(shù)智人形象,擁有如同真人主播的情感表情、形象氣質、語音語調、口唇表情、肢體動作。
利用這一少樣本可控生成技術,節(jié)目組在后續(xù)使用中無需真人出鏡,解決拍攝、視頻制作周期漫長等一系列問題,可以實現(xiàn)在短時間內即生成一期節(jié)目。在這個過程中,用戶僅需輸入文本,即可實現(xiàn)同音色語音合成、口型同步生成、軀體動作自適應匹配等多位一體的形象生成,輸出信息包括聲音、姿態(tài)、表情、動作等,與輸入文本自然匹配。
華院計算為頻道提供了端云協(xié)同2D真人數(shù)智人驅動技術,其中云端算法主要負責聲音合成、姿態(tài)和表情等內容生成相關任務,而端側負責將這些內容數(shù)智人視頻,并保證音頻與視頻的同步。從而通過超寫實數(shù)智人進行播報,并結合視頻內容理解分析技術實現(xiàn)媒體資源管理,利用多維度標簽文本-視覺的語義對齊,以1:1時間實現(xiàn)一鍵視頻生成。
在第一財經新近發(fā)布的《秒懂金融》欄目中,除了豐富的股市點評和分析內容外,節(jié)目的一大亮點就是除了連線嘉賓為真人外,節(jié)目畫面中的演播室場景、主持人李婷、現(xiàn)場嘉賓應有為均通過華院計算數(shù)智人技術合成,通過文字和語音驅動形成兩個數(shù)智人對話的神奇畫面。
攤薄成本、技術成熟,商業(yè)模式大變革
華院計算作為行業(yè)內最早布局AI數(shù)智人的企業(yè)之一,已為政府機構、品牌商家、意見領袖等提供一系列AI數(shù)智人產品和解決方案,通過標準化的價格、產品和服務逐步擴大當前市場份額。
華院計算專注人工智能算法研究,目前在數(shù)智人領域已與包括金融保險行業(yè)的中國人壽、消費行業(yè)的聯(lián)合利華以及傳媒領域的第一財經等在內的許多頭部企業(yè)開啟深度合作。
此次與第一財經節(jié)目組達成內容生成方面的合作,給AI+傳媒這一全新行業(yè)帶來了新的呈現(xiàn)可能,實現(xiàn)①響應號召,探索文化和科技融合的有效機制,加快發(fā)展新型文化業(yè)態(tài),形成更多新的文化產業(yè)增長點;②幫助用戶快速創(chuàng)作和生成視頻內容。用戶可以輸入關鍵詞或簡要描述,華院計算數(shù)智人視頻生成平臺將根據(jù)這些信息生成相關視頻,為用戶提供快速高效的視頻制作方案;③讓優(yōu)質內容獲得乘法效應,加強對內容運營的重視、或進一步擴大視頻傳播范圍都是不可或缺的提效工具。
華院計算數(shù)智人視頻生成平臺界面截圖
以往,復雜的訓練樣本數(shù)據(jù)采集,導致數(shù)智人定制過程長、成本高。如今,隨著生成式人工智能(AIGC)技術的不斷進步,為數(shù)智人提供了強大的技術支撐,更高效、更逼真、更智能的“數(shù)智人”應用正在廣泛落地、適應不同的場景和需求,展現(xiàn)出無限的可能性。越發(fā)擬真的外觀,自然生動的表情,再加上大語言模型技術加持下具備“最強大腦”,推出更高智慧和個性化定制的的數(shù)智人,并可通過技術手段進行批量生產,同時在橫向和縱向具強擴展性,為企業(yè)在內容運營和傳播方面的降本增效帶來顯著提升。
華院計算數(shù)智人開發(fā)平臺體驗入口:https://aigc.unidt.com/dolly/base/next/#/login