為了理解實現(xiàn)讓機器人做夢的重要性,先要理解做夢對哺乳動物(例如我們自己的)大腦是幫助的??茖W家試著從神經(jīng)科學的角度理解做夢的作用時,發(fā)現(xiàn)做夢的大部分內容都是消極或有威脅感的,可以嘗試做一個月的做夢日記,你會發(fā)現(xiàn)這是真的。

事實證明,當人類夢到尷尬的事情或有威脅出現(xiàn)時,AI夢到的卻還是重新排列游戲的各個章節(jié),過程往復,但引導機器人做夢實質是讓AI像人類那樣可以通過實驗不斷學習。利用AI技術引導機器人做實驗并分析不同的行為過程,以及對結果產(chǎn)生的影響。

robodreams
通過AI“做夢”的方法快照(圖片由Deepmind提供)

那么機器人可能面臨的挑戰(zhàn)是什么?目前,世界上最先進的AI也只停留在主攻復雜的視頻游戲,如星際爭霸II和迷宮。通過“做夢”,AI能突出游戲某些特別有挑戰(zhàn)性的部分,循環(huán)往復直到獲得專業(yè)知識,而不是毫無意義地排練游戲的整個過程卻對玩家的分數(shù)沒有絲毫影響。使用這種技術,DeepMind研究人員能夠實現(xiàn)以10倍的速度加快的學習效率。隨著AI技術的提升,這個速度可能會更快。

你可能還會問,為什么AI“做夢”很有必要。因為機器人已經(jīng)在大多數(shù)游戲中(如國際象棋和圍棋游戲)掌控人類行為。要掌握這一點,有必要區(qū)分使用監(jiān)督學習(通過AI分析數(shù)據(jù)并尋找相應模式)與無監(jiān)督學習的方法。迄今為止,通過AI實現(xiàn)且令人印象深刻的技術,大部分是使用監(jiān)督學習法來實現(xiàn)的,由程序員提供“訓練數(shù)據(jù)”,AI學習檢測數(shù)據(jù)模式。這是一個相當簡單的訓練機器人的方法,但決不是人類學習的方法。而是使用一種更類似于程序員所說的無監(jiān)督學習法,這種類型的學習比監(jiān)督學習要花費更多的時間,因為它涉及實驗等一系列變量的存在。

分享到

zhangnn

相關推薦