湯興  

新浪科技訊 北京時間3月22日下午消息,“新智能時代論壇”今日下午在北京機械工業(yè)出版社舉行。愛奇藝公司CTO湯興作為演講嘉賓,為“新智能時代論壇”做了主題為《視頻進化》的演講。

以下為湯興演講全文:

剛才聽了各位來賓的演講感覺壓力很大的,感覺我講的太接地氣了,各位講得高大上,做個調(diào)查,在座的各位看網(wǎng)絡(luò)視頻的請舉手,會看愛奇藝的舉手?;旧喜畈欢?0%。

我今天會給大家回到現(xiàn)實的生活中,講了那么多的人工智能,那么多智能化的時代,今天的現(xiàn)實生活中,視頻領(lǐng)域發(fā)生著怎樣的變化,或者我們怎么樣利用智能改變我們的生活。我會先回顧一下視頻整個的發(fā)展史,很短,不到200年,愛奇藝只有5年,愛奇藝的發(fā)展史濃縮了視頻的發(fā)展階段,可以看一下基本是六大階段。

從18世紀,視覺才有理論發(fā)現(xiàn)之后,電影誕生,從無聲的電影,黑白的電影,到后面高清的,3D的,4D,5D的影院,開始黑白的電影電視是不清楚的,我們希望清楚,后來發(fā)現(xiàn)光有圖象沒有聲音,和日常的溝通相背的,又加了聲音。后來聲音感覺不夠動聽,開始出現(xiàn)了立體聲,杜比公司作出了巨大的貢獻,開始有混繞立體聲,家庭影院。傳說的改變,從你只能到電影院里看電影,變成了可以用無線電波看電視,后來可以看到高清電影,物聯(lián)網(wǎng)的出現(xiàn),把電影和電視搬到了互聯(lián)網(wǎng)上,才有了在線視頻。大家在看在線視頻和TV的主要區(qū)別,是可以互動,TV上只能選臺,互聯(lián)網(wǎng)上可以快進,評論,點贊。愛奇藝是最近一二年開始做云計算,2013年啟動愛奇藝的自動化的項目,發(fā)展了兩年的時間,今年最火的方向是虛實結(jié)合,這是一個大概的整個在線視頻的發(fā)展的簡史。

看一下現(xiàn)在我們做了什么。這是視和聽的演進,在線視頻出現(xiàn)的時候都是SD的,320*240的,當(dāng)時愛奇藝上線的時候,第一次搬到了網(wǎng)上,回來推1080P,去年1月份全往推出4K,去年春節(jié)之后,在業(yè)界有一個很小的轟動,因為當(dāng)時在愛奇藝網(wǎng)頁上出了小的視頻,只有3分鐘《葉落知秋》是第一次一個影片從拍攝到后期、上傳、在線的編寫碼、播放,完全的4K,如果有4K顯示器可以看一下,品質(zhì)感非常強,以后4K電影流行之后,明星會非常的難辦,因為所有的化妝,毛孔會看得一清二楚。原來只是在網(wǎng)上看立體聲、雙通道,去年和杜比合作推出環(huán)繞立體聲,我們把電影的發(fā)展階段,快速的推向中國的互聯(lián)網(wǎng),今天在互聯(lián)網(wǎng)上,幾乎可以享受到所有的畫紙和音效的結(jié)果。最早在電影院看電影,后來又了無線電,在家里看電視,小時候誰家有18寸的彩色電視機,大家都會去他家看電視,現(xiàn)在各家有線電視都快被拆掉了,好處是可以隨時隨地的看,可以挑選不同的清晰度,可以互動,我們看一下未來,互動是在視頻上了互聯(lián)網(wǎng)之后才有的,最早人們可以在視頻上發(fā)現(xiàn)拖拽行為,可以點贊,進行評論,最早是人和視頻之間簡單的互動。后來是人和人之間的慢慢的開始有了互動,因為大家都在評論同一個視頻,一個人可以恢復(fù)另外一個人的點贊和評論,現(xiàn)在的趨勢是說人在和服務(wù)通過互聯(lián)網(wǎng)做進一步的連接,我們也看到了在互聯(lián)網(wǎng)整個的平臺上會發(fā)現(xiàn)在看電影的時候,或者看視頻的時候會賣電影票,推薦不同的游戲,推薦不同的商品。從互動的角度在把現(xiàn)實生活中的商業(yè)搬到線上,推動服務(wù)進行連接。

回到今天講的話題,智能化,我認為這是水到渠成的事情,不是點狀的東西,前面嘉賓也講到這是逐步發(fā)展的過程,所謂的智能存在是因為云計算和大數(shù)據(jù)的發(fā)展,沒有數(shù)據(jù),沒有計算能力的時候,智能化是無法發(fā)展的,記得我還上大學(xué)的時候,我的師兄研究神經(jīng)網(wǎng)絡(luò),八幾年,九幾年的時候,有一個思潮大家認為神經(jīng)網(wǎng)絡(luò)是徹底的忽悠,是偽科學(xué),是不可實現(xiàn)的。十幾年之后他卷土重來,因為我們大量的數(shù)據(jù),有海量的計算能力,沒有這亮點是無從道起的,最早的智能化是可以看到的?;ヂ?lián)網(wǎng)的視頻是看不完的,一個人每天看2小時的視頻,看一輩子,看60年,最后可以看到3%的視頻,其他97%的視頻連看的時間都沒有,這樣怎么找到喜歡的,靠自己是很難的,通常是靠機器的計算,學(xué)習(xí)你的興趣,這是個性化推薦做的事情。

很多人有手機,調(diào)查的結(jié)果,80%的人會把手機里面應(yīng)用程序的推送關(guān)掉,認為那個通知很干擾他們的日常生活,不知道在座的各位多少人會關(guān)掉,很多時候希望得到你感興趣的東西的通知,你喜歡體育節(jié)目的時候,希望知道體育比賽的結(jié)果,希望知道體育直播的開始時間,個性化推送,個性化通知在利用智能化提供個性化的服務(wù),個性化的廣告和大家的關(guān)系可能沒有前面兩個感覺更深,總體來說消費者總是討厭廣告的,廣告主總是希望到達消費者,而視頻平臺總是兩邊都要討好的。中間討好的解決方式就是個性化推送,讓人覺得感興趣,又不會覺得厭煩,比如說2月14日,以前我們投過一個廣告,比如投玫瑰花。廣告主、廣告平臺和整個的用戶會得到一個大家三方面的滿足?;剡^來,我知道大家會追劇,不知道有沒有注意到,整個互聯(lián)網(wǎng)平臺愛奇藝追劇是最快的,任何一個電視臺播放完了2分鐘之內(nèi)愛奇藝會上線,任何一個直播結(jié)束之后愛奇藝會上線,任何一家網(wǎng)站做不到這個速度,通常最后的是30分鐘,而我們可以做到一兩分鐘,為什么可以做到,是靠智能化的視頻內(nèi)容和分析。我們知道傳統(tǒng)的互聯(lián)網(wǎng)是圖文時代,慢慢的快速進入了視頻時代,我們對視頻的了解還是基于只是文本描述信息,我們是并不了視頻里面的內(nèi)容,為什么那么慢,因為流程需要在電視臺錄制信號,編輯要進行處理,去掉不要的廣告和臺標(biāo),加上自己的描述,重新轉(zhuǎn)馬上線,我們現(xiàn)在把整個的流程全部自動化。也就是說一個視頻在從電視臺錄制信號進來之后,我們自動跟進常年的分割,片斷的分割,以及廣告自動的識別,會自動的進行卡段,會自動的進入后臺。原來需要編輯輸入標(biāo)題和介紹,現(xiàn)在百分之八九十以上工作自動化完成的,很多的字幕是自動識別的,語音是自動識別的,語音的截圖,每個視頻的截圖不一樣,對點擊率的影響是非常大的,尤其是用戶上傳的視頻,用戶不知道哪一節(jié)的哪一張圖影響會大,我們會挑吸引用戶的進行推薦。大量的視頻有盜版和黃色,大量的用戶喜歡上傳這種視頻,以前非常的痛苦,編輯在幾千上萬的視頻里面找到并且刪掉,這是非常痛苦的視頻,很多時候就加一段,比如加了科比的名字,就會被說這里加了盜版視頻,靠人力是解決不了,后來智能化的做,準確率超過了99.9%,遠超過人的操作。視頻的生產(chǎn),上線,審核流程完全的智能化。

這是很多互聯(lián)網(wǎng)公司在做的事情,谷歌做過,視頻行業(yè)是特別燒錢的事情,早上醒來,拿打火機燒100塊錢,沒有我們燒錢的速度快,今天是加一個鼓風(fēng)機都沒有我們燒的速度快,對我們來說最大的成本是版權(quán),買一部劇,一部電影的時候,根本不知道有多大的票房,收視率,播放量,也無法知道RY是什么,我們以前花了4000萬買了一部電影,放下來收益只有800萬。很多時候拿到劇本就要決定買還是不買,這個行業(yè)的競爭是非常殘酷的。我們做了一件什么事情,在這個行業(yè)為了節(jié)省我們的資金,為了給廣大的用戶更多的內(nèi)容來看,我們要猜測到哪些是我們網(wǎng)絡(luò)視頻用戶感興趣的東西,我們做了這個模型。左上角是《來自星星的你》,這部劇掀起了韓劇瘋漲的熱潮,那之前韓劇大概一部劇集最多1萬美金,之后漲到20多萬美金,原因是這部劇非?;穑ツ瓿跫t遍大江南北,習(xí)總書記都提到《來自星星的你》。左下角是《戰(zhàn)神》提前半年預(yù)測的,準確率達到95%,右下角是愛奇藝的電影指數(shù),電影是更南預(yù)測的東西,會受到各方面的影響,電影靠廣告是不可能收回成本的,更多的要靠收費,決定了到底有多少用戶會對他感興趣,我們做了電影指數(shù),紅色是預(yù)估的結(jié)果,最近在做一個有意思的事情,《極地雄師》,正在放映的電影,我們的內(nèi)容部門在打賭,說不可能票房過7億,計算機算是7.5到8億之間,我現(xiàn)在問了一下現(xiàn)在票房是7.4億,這個角度來說利用智能,讓電腦不只是搜集信息,分析信息,而是一定要幫助我們預(yù)測未來,這種與是靠人腦做不到的。

下一步我們做什么,視頻的發(fā)展史到了后來會發(fā)現(xiàn),光了解是表相已經(jīng)不夠了,光了解信息不夠了,我們開始改變現(xiàn)有的視頻,要讓視頻里面和真實的已經(jīng)不夠了,要從制作到上線都要提供,我們在海量的視頻里面加入虛擬的物體,從二維到三維,左邊加了圖,右邊是加了可樂罐,看起來是一個技術(shù),以后看到的視頻是沒有廣告的,但廣告已經(jīng)投入到整個場景里面,所有的這些制作是后期的,而且可以實時的在線做。

虛實結(jié)合的產(chǎn)品,Video out,看到一個明星的衣服不知道是什么牌子,要到百度進行搜索,我們自動識別場景知道用了什么包,戴的項鏈,我們和電商結(jié)合,以后可以一邊看,一邊買東西?,F(xiàn)在識別的精確度到了85%以上,對TOP5的商品類別,經(jīng)過深度的識別,進行精準的標(biāo)簽匹配。

結(jié)論,經(jīng)過前面的從音質(zhì),畫質(zhì)傳出,到互動的發(fā)展,視頻行業(yè),娛樂行業(yè)進入了智能化和虛實結(jié)合的時代,愛奇藝從2013年開始投入,我們相信這種變化,智能時代會在視頻行業(yè)會更早地感覺到。謝謝大家。

以下為觀眾提問:

提問:講得非常有意思,轉(zhuǎn)變了我對愛奇藝的看法,感覺在線視頻對未來的展望,提到了虛實融合,看起來是往影片里面植入真實的物體,看起來會對未來的廣告產(chǎn)生新的空間,這個本身不會對原來的節(jié)目本身的完整形態(tài)產(chǎn)生破壞,這個度擺在哪里?

湯興:電腦會自動的對場景進行識別,之后會找出來對用戶來說干擾最小的場景,后面會有人工的復(fù)合的流程,結(jié)果是希望在相對靜止的場景,相對空曠的區(qū)域,對用戶沒有太大干擾,這并不只是對廣告,對視頻制作,春晚已經(jīng)開始用虛實現(xiàn)實,全息做制作,我們的節(jié)目也在進行改變,以前做一個綜藝節(jié)目,后面都是綠幕,再替換其他的場景,未來都是動態(tài)的,主持人可以隨時的身處不同的場景里。

分享到

多易

相關(guān)推薦