伴隨A.I.技術的成熟,我們所使用的第三方輸入法智能化程度不斷加深。訊飛輸入法發(fā)布的“智能拍照輸入”融合了行業(yè)領先的文字識別、手寫識別、公式識別、圖像理解、機器翻譯、知識圖譜等A.I.技術,擁有多場景、更智能、更準確的特點。現在打開訊飛輸入法新版,開啟“智能拍照輸入”,不用鍵盤打字,就能支持中、英、日、韓、德5國印刷文字和手寫體識別,英語和日語拍照翻譯,數理公式一鍵上屏等功能,此外還支持數學作業(yè)智能批改以及一鍵生成office電子檔,極大拓展了輸入法的應用邊界。

云圖片

    那么“智能拍照輸入”是如何實現的呢?這背后離不開科大訊飛的核心技術。據悉,采用基于語義分割的文字檢測技術與超大底層感受野網絡以及適用于自然場景的數據增強技術的混合,大幅提升文字識別能力,無懼圖片模糊、超遠距離、角度扭曲等問題。 

云圖片

    面向數學公式識別難題,提出了基于樹形結構信息建模全新的端到端識別算法,實現特殊符號“所拍即所得”。截至目前,科大訊飛在圖文識別領域已經歷四代識別框架,代表業(yè)界算法演進的趨勢。

云圖片

    值得一提的是,其第四代框架結合圖卷積神經網絡(GCN)等結構化分析技術和基于生成對抗網絡(GAN)的圖文數據生成技術,有效解決了通用問題。

云圖片

    得益于A.I.視覺技術的精進,科大訊飛屢次在行業(yè)大賽中摘得驕人成績,譬如在ICDAR ReCTS評測任務中刷新全部四項識別榜單的世界紀錄;在ICFHR2020 OffRaSHME數學公式識別挑戰(zhàn)賽中獲得冠軍;在計算機視覺頂級會議CVPR2019和文檔分析與識別頂級會議ICDAR2019上的多項評測任務中獲得冠軍;在ICPR2018 MTWI圖文識別挑戰(zhàn)賽中包攬全部三項任務的冠軍。通過A.I.技術與互聯網服務深度結合,使輸入法變得大有可為。

    如今,全民數字化生活進程在加速,智能升級、數字轉型、創(chuàng)新融合與消費者的關系愈加密切。從無人駕駛技術到智能機器人,從智能家居到日常用品,不可否認A.I.已不僅是實驗室名詞,而是深入到我們生活的方方面面。

云圖片

    易觀分析師認為,輸入法作為集合強A.I.能力的交互入口,其多元應用場景也被進一步打開。移動輸入的智能化程度、個性化程度受到供需兩端的極大重視。

云圖片

    從艾媒咨詢《2020年秋季中國第三方手機輸入法市場監(jiān)測報告》得知,在線辦公和在線教育場景中,紙質辦公文件和教材內容多,輸入所需時間長,文字識別可以實現圖片轉文字,有效提升輸入效率,成為受訪用戶最感興趣的功能,占比分別為38.2%、34.8%。

    接入A.I.視覺等技術解決方案后,訊飛輸入法為互聯網打工人的手機賦能,帶來信息處理效率的大幅提升。從用戶體驗看,智能拍照輸入“拍一下”,使原本數小時的信息處理工作幾分鐘就搞定。由此可見,A.I.賦能的輸入法將帶動整個在線辦公領域的蓬勃發(fā)展。

    作為“中國人工智能國家隊”一員,科大訊飛始終堅持源頭核心技術創(chuàng)新,持續(xù)拓展行業(yè)賽道,面向消費者推出多款智能產品及服務,訊飛輸入法便是其一?,F階段,隨著A.I.技術和智能硬件的發(fā)展,訊飛輸入法的發(fā)展重點不斷將新技術融入到使用場景中,探索全新的輸入方式,進而提高溝通效率、豐富表達內容、增強輸入體驗,真正為人們帶來極大地便利,讓每個人都能好好感受用A.I.建筑的美好世界。

分享到

zhangnn

相關推薦