(VALSE2019騰訊優(yōu)圖展位)
VALSE大會發(fā)起于2011年,致力于為計算機視覺、圖像處理、模式識別與機器學習研究領域的華人青年學者提供一個自由、平等的深層次學術交流舞臺,促進相關領域取得突破性學術成就和成果轉化,提升中國青年學者在國際學術舞臺上的影響力。騰訊優(yōu)圖算法研究員劉皓作為演講嘉賓出席,對外分享了騰訊優(yōu)圖在OCR技術領域的學術研究成果與產(chǎn)品解決方案應用實踐。
(騰訊優(yōu)圖算法研究員劉皓在VALSE2019)
騰訊優(yōu)圖OCR技術四大優(yōu)勢:適配強、計算快、識別準、應用廣
騰訊優(yōu)圖實驗室成立于 2012 年,是騰訊旗下頂級的 AI 實驗室之一,專注人臉人體、圖像處理、模式識別、機器學習等領域的技術研究和業(yè)務落地。目前,優(yōu)圖的AI 技術已廣泛應用在零售、安防、金融、物流等諸多領域,提供超過12個行業(yè)解決方案,接入70多條騰訊明星產(chǎn)品業(yè)務,擁有超過700項全球專利。在學術成就方面,優(yōu)圖實驗室累計申請了327篇國內AI專利和169篇國際AI專利,2019年 3月,優(yōu)圖實驗室25篇論文入選全球頂級計算機視覺會議CVPR2019的成績,備受業(yè)界矚目。
經(jīng)過長期深耕發(fā)展,優(yōu)圖在發(fā)展得最早也最為成熟的OCR應用方面,已擁有領先行業(yè)的四大競爭優(yōu)勢。首先,業(yè)務適配強,通用性好。騰訊優(yōu)圖擁有千萬級的數(shù)據(jù)支撐,支持英、日、韓、西、法等19種語言及數(shù)字符號,超過20000個漢字識別,具備廣泛的適配能力。其次,計算速度快、效率更高。優(yōu)圖OCR技術文字識別速度GPU平均2ms/字符,CPU平均6ms/字符,模型優(yōu)化迭代快,服務更為穩(wěn)定。
第三,識別準,在手寫體識別領域顯著領先。騰訊優(yōu)圖OCR技術手寫體識別能力達到國內首家企業(yè)級應用標準,手寫中文識別準確率達90%以上,手寫英文單詞級識別準確率更是高達95%以上。最后,應用場景廣泛,經(jīng)過海量服務檢驗。目前優(yōu)圖已經(jīng)在騰訊企業(yè)內外上百個不同業(yè)務中落地應用,日調用量超千萬,尤其在物流、銀行、保險、政務、手機、教育、互聯(lián)網(wǎng)等重點行業(yè)的幾十家大型企業(yè)上線應用后,備受用戶好評。
促進技術與產(chǎn)業(yè)場景融合? 助力各行各業(yè)實現(xiàn)智慧升級
騰訊優(yōu)圖始終積極推動研究成果在業(yè)務領域的落地。在OCR領域,騰訊優(yōu)圖基于多角度文本檢測、語義增強的文字識別、公式識別、NLP后處理等基礎技術,輸出了財務報銷憑證識別、證照識別、通用文字識別、單據(jù)識別、汽車信息識別、教育試題識別等多個產(chǎn)品解決方案, 并在微信、QQ、順豐、滴滴出行等一批頭部應用中落地。
借助騰訊優(yōu)圖OCR技術,通過對業(yè)務場景進行智能改造,能夠極大地減少人力成本、提高生產(chǎn)效率。例如優(yōu)圖與順豐合作,針對運單的收寄件人電話號碼和收件人省市區(qū)地址信息做了深入的研究,取得高精度的識別成果??爝f公司基于這些OCR自動識別信息,再結合自有運單數(shù)據(jù)庫,可以自動匹配到更完整更充分的運單各字段信息,大幅提升了運單信息錄入效率和物流資源的調度匹配能力。
在技術攻堅方面,針對行業(yè)普遍困擾的英文識別難點,包括印刷體、手寫體差異大,手寫體書寫潦草、涂抹痕跡多等問題,騰訊優(yōu)圖OCR技術創(chuàng)造性地采用多種數(shù)據(jù)增強辦法,并融入NPL模型和優(yōu)化數(shù)據(jù)篩選等機制,提升了解決方案的魯棒性,令識別結果更精確,被廣泛應用在銀行支票、英文菜單、個人名片等諸多領域,極大地提升了用戶體驗。
秉承“研究成果落地才能產(chǎn)生價值”的原則,騰訊優(yōu)圖始終緊跟時代和技術前沿,在技術研究和業(yè)務落地等方面持續(xù)發(fā)力,輸出前沿的視覺技術解決方案,促進技術成果在產(chǎn)業(yè)中的落地轉化,助力各行各業(yè)實現(xiàn)數(shù)字化、智慧化轉型,加速智慧產(chǎn)業(yè)時代的到來。