用文字畫畫

今年,F(xiàn)acebook的AI研究團(tuán)隊(duì)(FAIR)在GPU技術(shù)大會(huì)公布了他們的神經(jīng)網(wǎng)絡(luò)。在活動(dòng)中,他們展示了其基于文字描述生成虛擬圖像的技術(shù)實(shí)力。

演示過程中,團(tuán)隊(duì)展示了通過鍵入單詞“beach”而形成的神經(jīng)網(wǎng)絡(luò),AI由此生成一幅“天空下的沙灘”畫面。研究團(tuán)隊(duì)輸入“beach – clouds”,隨即生成了一個(gè)類似的圖像(只是這次沒有云)。在此次演示的最后階段,他們輸入單詞“sunset beach – clouds”,同時(shí)AI生成一幅落日、海灘與晴朗的天空交相輝映的唯美畫面。

Facebook的AI研究團(tuán)隊(duì)已經(jīng)能夠訓(xùn)練神經(jīng)網(wǎng)絡(luò)特定用詞與它們對(duì)應(yīng)的圖像聯(lián)系起來。通過使用一臺(tái)超級(jí)計(jì)算機(jī)來展示由神經(jīng)網(wǎng)絡(luò)生成的千上萬個(gè)不同的圖像。

Facebook的神經(jīng)網(wǎng)絡(luò)之所以如此特別,在于它將單詞進(jìn)行組合,并將這些組合與其適當(dāng)?shù)南鄳?yīng)圖像相關(guān)聯(lián)的能力。人工智能是可以同時(shí)添加描述并除去某些方面的圖像,以履行文本描述為最終目的。這就是所謂的自然語言界面。

虛擬世界

這種方式在2D圖像效果上表現(xiàn)出色,但Facebook有更大的野心,包括由相同自然語言界面生成的3D圖像。

從2D上升為3D并非易事,盡管它涉及到使神經(jīng)網(wǎng)絡(luò)識(shí)別三維空間,并訓(xùn)練它鑒定大量的3D資源,這一點(diǎn)確實(shí)不如2D圖像那樣豐富。幸運(yùn)的是,隨著最近VR和AR敞開大門,對(duì)外部資源的不斷擴(kuò)散,打賭在不久的將來,你就可以按照我們所說的這樣方便快捷地創(chuàng)建一個(gè)完整的虛擬世界了。

【更多行業(yè)資訊,請(qǐng)關(guān)注DOIT官方微信(微信號(hào):doitmedia),關(guān)注科技與數(shù)據(jù)經(jīng)濟(jì),洞察IT走向DT。】

分享到

zhangnn

相關(guān)推薦