百度副總裁、百度AI技術(shù)與平臺(tái)體系(AIG)總負(fù)責(zé)人王海峰在開場致辭中表示,百度在人工智能領(lǐng)域深耕多年,從十七年前百度誕生之日起就開始積累,幾乎所有主要人工智能技術(shù)都已在百度搜索引擎中得到應(yīng)用,來自搜索引擎及百度各產(chǎn)品的用戶需求、數(shù)據(jù)和平臺(tái),支撐了百度AI技術(shù)的快速發(fā)展,現(xiàn)在百度人工智能在算法、數(shù)據(jù)、技術(shù)等方面具有領(lǐng)先優(yōu)勢(shì)。
“在每天數(shù)十億次用戶請(qǐng)求的千錘百煉下,百度的人工智能技術(shù),是真正實(shí)用的人工智能技術(shù),”王海峰認(rèn)為,只有將技術(shù)與實(shí)際應(yīng)用相結(jié)合,根據(jù)用戶需求和反饋反復(fù)迭代優(yōu)化,才能打造強(qiáng)大、更具活力的AI技術(shù)。
百度誕生于PC互聯(lián)網(wǎng)時(shí)代,那是一個(gè)開放互聯(lián)網(wǎng)生態(tài)的時(shí)代。在互聯(lián)網(wǎng)的助力下得到迅速發(fā)展的AI技術(shù),也應(yīng)該秉承開放精神。更重要的是,AI的影響將不限于互聯(lián)網(wǎng),AI將影響各行各業(yè)和人們生活的方方面面。百度通過與開發(fā)者和社會(huì)共享AI技術(shù)成果,帶動(dòng)生態(tài)繁榮,推動(dòng)社會(huì)進(jìn)步。
此次,百度多年打造的完整AI技術(shù)平臺(tái)將全面開放。百度的AI能力分為4層。在基礎(chǔ)層,是AI算法、大數(shù)據(jù)、大計(jì)算能力。感知層,包括語音、圖像、視頻、AR/VR等技術(shù)。認(rèn)知層,有自然語言處理、知識(shí)圖譜及用戶畫像等。在平臺(tái)層,基礎(chǔ)層、感知層、認(rèn)知層的技術(shù)會(huì)平臺(tái)化,通過百度AI開放平臺(tái)ai.baidu.com開放,與開發(fā)者共享。開放的技術(shù)能力總共有60個(gè),是最全面的AI技術(shù)開放平臺(tái)。
60項(xiàng)開放技術(shù)打造能力完整、組合豐富的開放平臺(tái)
百度AI開放平臺(tái)在完整性、開放性、前瞻性和發(fā)展性方面均領(lǐng)跑業(yè)界。此次宣布開放的語音、自然語言處理、視頻、增強(qiáng)現(xiàn)實(shí)、機(jī)器人視覺等技術(shù),與已經(jīng)開放的AI技術(shù)一起,構(gòu)成具有60項(xiàng)開放技術(shù)的完整的、綜合的AI開放平臺(tái),為開發(fā)者提供形式多樣、可定制、可組合的AI技術(shù),滿足開發(fā)者從API、源碼、數(shù)據(jù)到計(jì)算能力的多層次需求。
百度在AI技術(shù)上具有先發(fā)優(yōu)勢(shì),完整布局和深厚技術(shù)積累。百度的AI技術(shù)始終隨著百度的發(fā)展而不斷進(jìn)化,規(guī)模大、能力強(qiáng)的百度AI開放平臺(tái)備受開發(fā)者青睞,這是對(duì)百度AI技術(shù)的認(rèn)可。數(shù)據(jù)顯示,百度AI開放平臺(tái)多項(xiàng)技術(shù)的使用量過去半年都有2倍以上的快速增長。
喚醒萬物:語音技術(shù)+自然語言處理讓機(jī)器更懂需求
語音交互成為人機(jī)交互的下一代入口,語音技術(shù)需求日益增加。百度語音技術(shù)部總監(jiān)高亮在分論壇現(xiàn)場介紹了本次新開放的遠(yuǎn)場識(shí)別及語音喚醒、定制化語音合成、語音合成音色、情感語音交互(Emotional CUI)等技術(shù),開發(fā)者可以實(shí)現(xiàn)不同場景的智能應(yīng)用,滿足用戶需求。
百度在開放語音技術(shù),讓機(jī)器聽清用戶的同時(shí),更重要的是開放能讓機(jī)器懂得用戶需求的自然語言處理技術(shù)。此次分論壇由百度自然語言處理部總監(jiān)趙世奇詳細(xì)介紹了能力強(qiáng)大的語言理解與交互技術(shù)平臺(tái)——UNIT。該平臺(tái)將開放語言理解技術(shù)、交互技術(shù),從百度大數(shù)據(jù)中自動(dòng)汲取最有價(jià)值的數(shù)據(jù)提供給開發(fā)者使用,為開發(fā)者提供多種定制化方案,還首創(chuàng)『訓(xùn)練師』模式,助力開發(fā)者訓(xùn)練對(duì)話機(jī)器人,賦予機(jī)器“理解”自然語言,聽懂用戶需求,以及與用戶進(jìn)行多輪次對(duì)話的能力。今年”百度之星”開發(fā)者大賽的命題就是基于UNIT平臺(tái)提供的語言理解與交互技術(shù),“設(shè)計(jì)和開發(fā)一個(gè)以對(duì)話式人機(jī)交互為核心的智能產(chǎn)品”。
看懂世界:視頻分析、人臉識(shí)別和增強(qiáng)現(xiàn)實(shí)技術(shù)
此次分論壇上,百度研究院院長林元慶介紹了視頻分析與理解、機(jī)器人視覺和人臉識(shí)別等技術(shù)。本次開發(fā)者大會(huì)發(fā)布了全面的視頻語義理解技術(shù),包括視頻封面選摘、視頻分類、視頻比對(duì)、細(xì)粒度識(shí)別、視頻審核、視頻公眾人物識(shí)別、視頻結(jié)構(gòu)化分析等。此外,林元慶還介紹了世界第一個(gè)室外語義分割RGBD視頻數(shù)據(jù)集,以及完整的機(jī)器人視覺解決方案。
增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)作為全新的視覺交互形式,越來越受到營銷、娛樂、游戲等行業(yè)關(guān)注。百度增強(qiáng)現(xiàn)實(shí)實(shí)驗(yàn)室主任吳中勤現(xiàn)場發(fā)布全新DuMix AR開放平臺(tái),為開發(fā)者提供AR SDK、內(nèi)容制作工具、云端內(nèi)容平臺(tái)和內(nèi)容分發(fā)服務(wù)。吳中勤表示,未來百度將提供更多場景的AR行業(yè)解決方案,賦能各行各業(yè),共同探索AR價(jià)值。
在AI技術(shù)與開放平臺(tái)分論壇上,除了發(fā)布新開放的核心技術(shù)能力,百度杰出科學(xué)家徐偉披露了PaddlePaddle的發(fā)展路徑,宣布百度會(huì)開源代碼、開放大規(guī)模數(shù)據(jù)集、開放計(jì)算能力、開放應(yīng)用模型庫。作為國內(nèi)首個(gè)深度學(xué)習(xí)開放平臺(tái),PaddlePaddle將與開發(fā)者一起繁榮AI生態(tài),引領(lǐng)行業(yè)發(fā)展。
本次大會(huì)主論壇上,百度集團(tuán)總裁兼首席運(yùn)營官陸奇強(qiáng)調(diào),“Apollo強(qiáng)大的生態(tài)和DuerOS喚醒萬物的能力,是百度大腦日益強(qiáng)大的知識(shí)和技術(shù)賦予的,同時(shí)也是建立在百度智能云的基礎(chǔ)上的?!?/p>
此次備受矚目的AI技術(shù)與開放平臺(tái)分論壇,是AIG成立后的首次正式集體亮相,也是百度全面開放AI能力的實(shí)際體現(xiàn)??梢韵胂?,未來隨著百度AI基礎(chǔ)能力的進(jìn)一步開放,開發(fā)者、創(chuàng)業(yè)者、行業(yè)伙伴將如虎添翼,讓人工智能技術(shù)賦能更多場景,創(chuàng)造更多價(jià)值;而另一方面,百度人工智能也會(huì)與開發(fā)者和行業(yè)伙伴一起,在實(shí)踐中推動(dòng)技術(shù)創(chuàng)新與進(jìn)化,共襄AI未來,造福社會(huì)。