百度首席科學家吳恩達

百度和其他公司之所以能夠在ImageNet測試中取得佳績,依靠的是一種名為“深度學習”的算法。這種算法近期才從學術(shù)界引入到硅谷,但已開始對人們?nèi)粘I町a(chǎn)生影響。兩年前,谷歌使用深度學習算法來大幅提升Android語音識別系統(tǒng)的準確率。

報道稱,百度正使用一種更大型超級計算機對1.4萬個小時的語音數(shù)據(jù)進行分析,旨在提升百度在中文和英文語音識別上的準確率。

“對于整個行業(yè)在計算機視覺領(lǐng)域取得的所有進步,我感到十分激動,”百度首席科學家吳恩達表示,“計算機能夠顯著提升圖像理解的準確率,做這么多它們在一年前還無法做的事情。”

百度計劃在未來18個月開發(fā)一款更大型計算機,每秒可執(zhí)行1千萬億次(quadrillion)運算,這一運算能力足以讓該計算機排進全球超級計算機性能榜的前十,盡管其計算復雜度不及世界頂尖超級計算機。

吳恩達稱:“有趣的是,排在ImageNet圖像識別測試前三的計算機都來自擁有重大計算資源的大型科技公司。”他表示,百度利用從中國及其硅谷實驗室獲取的超級計算專業(yè)知識來開發(fā)Minwa。

Facebook人工智能項目負責人、著名人工智能研究員Yann LeCun也已表示,F(xiàn)acebook正在部署一流計算資源,但他不愿透露Facebook計算機系統(tǒng)的規(guī)模。

微軟首次超越人類識別能力

一直以來,計算科學家一直在為建立世界上最精確的計算機視覺系統(tǒng)孜孜不倦地努力著,但取得進展的過程卻一直如馬拉松競賽般漫長而艱辛。

早些時候,微軟亞洲研究院視覺計算組基于深度卷積神經(jīng)網(wǎng)絡(CNN)的計算機視覺系統(tǒng),在ImageNet 1000挑戰(zhàn)中首次超越了人類進行對象識別分類的能力,將錯誤率降低至4.94%。此前同樣的實驗中,人眼辨識的錯誤率大概為5.1%。這個數(shù)據(jù)集包含約120萬張訓練圖像、5萬張驗證圖像和10萬張測試圖像,分為1000個不同的類別。

該研究團隊由微軟亞洲研究院研究員孫劍、何愷明以及來自西安交通大學和中國科學技術(shù)大學的實習生張祥雨和任少卿組成。孫劍已在微軟亞洲研究院工作了十二年,現(xiàn)任視覺計算組首席研究員。

孫劍將團隊取得的最新成果歸功于以下兩項關(guān)鍵突破:一是開發(fā)了適應性更強的非線性神經(jīng)元,二是改進訓練算法,使得神經(jīng)網(wǎng)絡更為強大。微軟研究員在論文中指出,修正神經(jīng)元 (rectifier neuron)是近期將深度神經(jīng)網(wǎng)絡應用于計算機視覺挑戰(zhàn)時取得成功的關(guān)鍵要素之一。

研究團隊成員也強調(diào),計算機視覺目前從根本上仍無法與人類視覺相比。計算機系統(tǒng)在識別物體、理解圖像上下文及場景高級信息等領(lǐng)域仍面臨諸多挑戰(zhàn)。

“人類可以毫不費力地區(qū)分出一只羊和一頭牛。但計算機在執(zhí)行這些簡單任務時卻不盡完美,”孫劍解釋道。“但是,當涉及到不同品種的羊的區(qū)分時,計算機可超越人類。通過訓練,計算機可觀察圖像的細節(jié)、紋理、形狀及環(huán)境,并發(fā)現(xiàn)人類無法察覺出的區(qū)別。”

“我們的目標是在眾多應用上開發(fā)出能與人類視覺媲美,甚至比人類更準確的計算機視覺系統(tǒng),”孫劍說道。“如要實現(xiàn)這一目標,我們需要更多的訓練數(shù)據(jù)和更加真實的測試場景。我們在必應、OneDrive和其他服務平臺上的工作將幫助我們進一步改善算法的魯棒性。”

微軟研究團隊的工作并不僅僅局限于基礎研究,其多項成果已被應用到微軟的產(chǎn)品和服務中,包括必應圖片搜索及微軟云存儲解決方案OneDrive。在OneDrive近期一篇的一片官方博文中,微軟OneDrive項目經(jīng)理Douglas Pearce介紹了 OneDrive自動識別照片內(nèi)容的功能。

“OneDrive會自動為用戶上傳的照片創(chuàng)建標簽,比如人、狗、沙灘、落日等等,使用戶借助標簽能夠更輕松地尋找到自己的圖片。有了這項功能,我們向演示項目中添加照片、與家人重溫特殊回憶,或與Facebook好友分享重要時刻就變得輕而易舉。”Pearce如是說。

2010年,來自斯坦福大學、普林斯頓大學及哥倫比亞大學的科學家們啟動大規(guī)模視覺識別挑戰(zhàn)賽(Large Scale Visual Recognition Challenge),推動了計算機視覺識別挑戰(zhàn)的持續(xù)發(fā)展??萍夹袠I(yè)知名記者John Markoff于2014年8月在《紐約時報》上刊登文章指出,到2014年計算機識別挑戰(zhàn)的目標識別準確率幾乎提升了一倍,圖像分類錯誤率也減少了一半。

 

分享到

liwz

need 500 dollars today

相關(guān)推薦