借著訊飛輸入法上線10周年的契機,似乎有必要盤點下輸入法在上一個10年的歷程:站在人工智能時代的起點上,曾經(jīng)革新了移動互聯(lián)網(wǎng)交互方式的輸入法,還將對世界產(chǎn)生什么樣的影響?
隨著智能手機的出現(xiàn),改變了原有的產(chǎn)品形態(tài),傳統(tǒng)的物理鍵盤徹底消失,虛擬輸入法逐漸成為一種剛需,如何提升用戶的輸入效率,成了多方力量角逐的賽點。在PC時代殺出一條血路的搜狗輸入法,隨即開始向手機市場傾斜,原本適用于PC的產(chǎn)品邏輯被復(fù)制到手機上;汲取了PC市場經(jīng)驗的手機廠商也開始行動,谷歌將自家的輸入法作為系統(tǒng)的默認選項,主張封閉生態(tài)的蘋果牢牢掌控著輸入法的控制權(quán),直到2014年才開放了第三方輸入法的 API。
同樣是2010年,科大訊飛的一群工程師們也加入了手機輸入法的角逐賽,不過他們并沒有沿襲功能機時代的輸入理念,而是主打語音技術(shù),在既有輸入鍵盤上增加一個麥克風(fēng)圖標(biāo),用戶點擊后就能語音輸入。時間同樣驗證了訊飛輸入法的前瞻性,到了2012年的時候,搜狗輸入法和百度輸入法先后推出了語音輸入,2013年訊飛輸入法的激活用戶量正式破億……語音輸入逐漸衍生成為新的流派。
智能手機時代的降臨,催生的不只有造機潮,還有工具產(chǎn)品的爆發(fā):早期的原生操作系統(tǒng)體驗并不完善,桌面類、美顏類等工具類產(chǎn)品悄然崛起,第三方輸入法或多或少享受了特殊的紅利周期。作為工具屬性的產(chǎn)品,是不是都只是用過就“丟”一邊的產(chǎn)品呢?隨著技術(shù)革新,讓工具類產(chǎn)品有了新答案。老羅在2016年錘子手機M1的發(fā)布會上用很快的語速說了相當(dāng)長的一段話,訊飛輸入法無時差同步輸出了文字版本,結(jié)果幾乎沒有任何偏差,發(fā)布會現(xiàn)場隨即一片歡呼。發(fā)布會結(jié)束的第二天,訊飛輸入法霸占了多家應(yīng)用商店的下載榜單。
訊飛輸入法的高光時刻至今仍時常被提及,外界忽略的是背后的技術(shù)深耕。訊飛輸入法剛剛上線的2010年,行業(yè)內(nèi)還沒有中文語音識別的概念。訊飛輸入法團隊首創(chuàng)了語音輸入的功能,一開始的識別準(zhǔn)確率還只有70%作用,團隊使用大數(shù)據(jù)訓(xùn)練和深度學(xué)習(xí)技術(shù)后,語音識別的準(zhǔn)確率在2013年達到了92%,然后在2014年快速跨越到業(yè)內(nèi)領(lǐng)先的95%,在一定程度上超出了人耳。
其實當(dāng)訊飛輸入法的語音識別準(zhǔn)確率達到97%后,用戶規(guī)模已經(jīng)在不到兩年時間內(nèi)已經(jīng)翻了一番,羅永浩的示范不過是點燃引線的小火星。相比于那些與用戶需求和行業(yè)生態(tài)脫節(jié)的工具類產(chǎn)品,訊飛輸入法為工具類產(chǎn)品正名的策略并不復(fù)雜,即通過技術(shù)的持續(xù)創(chuàng)新將工具類產(chǎn)品服務(wù)化,向用戶提供的不是工具,而是一種服務(wù)。工具的弱點是用戶粘性低、可替代性強,但訊飛輸入法用技術(shù)創(chuàng)新和產(chǎn)品服務(wù)巧妙地讓短板變成了長板。
“直面用戶需求就能得到用戶的歡心?!庇嶏w輸入法選擇需求排名最高的粵語、四川話和河南話入手,2012年的一次版本更新后上線了粵語語音輸入,成為首款支持粵語語音輸入的輸入法,緊接著上線了四川話和河南話的語音輸入。截止到目前,訊飛輸入法的粵語語音識別準(zhǔn)確率已經(jīng)超過95%,陸續(xù)上線了23種方言的語音識別。
因?qū)τ脩糨斎肓?xí)慣的洞察,訊飛輸入法在2013年上線了英文語音輸入;2015年訊飛輸入法在語音輸入的基礎(chǔ)上首創(chuàng)了語音翻譯功能 “隨聲譯”,目前已經(jīng)支持英日韓俄等多種外語的面對面翻譯,輸入法開始進化成為一種人際溝通工具。
除了語音識別技術(shù)上的縱向深挖,訊飛輸入法還積極在輸入場景上進行橫向延伸,比如在傳統(tǒng)的手寫、鍵盤輸入外,加入了OCR掃描、智能預(yù)測等功能。
“輸入法的產(chǎn)品生命周期,其實才剛剛開始?!庇嶏w輸入法上線的2010年,深度學(xué)習(xí)技術(shù)還方興未艾,人工智能還處于第二次浪潮后的靜默期。然而過了十個年頭后,等待語音技術(shù)的卻是全新的局面:阿爾法狗燃起了人工智能的第三波浪潮,深度學(xué)習(xí)等前沿技術(shù)加速了落地應(yīng)用的進程,語音也從小眾一躍成為主流的人機交互方式之一。
至少透過訊飛輸入法等行業(yè)領(lǐng)跑者的動作,外界看到的并非是時間賦予的老邁,而是一無既往的探索和創(chuàng)新精神。
就在訊飛輸入法10周年發(fā)布會上,知名相聲演員方清平上演了一場極限語速挑戰(zhàn)賽,用遠超羅永浩當(dāng)年的語速讀了一段《木蘭辭》,以測試訊飛輸入法在極限快語速下的識別效果。結(jié)果讓人驚喜,方清平的語速快過了吉尼斯世界紀(jì)錄,訊飛輸入法照舊給出了100%的識別準(zhǔn)確率。
與四年前的有所不同的是,同樣是技術(shù)上的秀肌肉,對于“快”的詮釋有了新的注解。如果說訊飛輸入法當(dāng)年的一夜爆紅,某種程度上與大眾對語音輸入帶來的新鮮感有關(guān),這一次除了速度,還有溫度。
比如訊飛輸入法新近推出的10.0版本,通過唇形輔助輸入,進一步優(yōu)化輸入效率,在近距離多人說話的復(fù)雜場景中,其他人的聲音不會干擾語音識別結(jié)果;再比如針對盲人群體輸入不便的情況,不斷無障礙模式,實現(xiàn)了輸入面板、菜單面板以及表情面板的屏幕隨選朗讀,用戶在視力不便的情況下也能無障礙輸入文字和表情。
這些年人工智能(A.I.)技術(shù)發(fā)展非???,將人們對于智能生活的想象呈現(xiàn)在眼前。我們常用的訊飛輸入法,通過A.I.賦能將語音輸入效率一次又一次提升,甚至突破想象。