(VALSE2019騰訊優(yōu)圖展位)
VALSE大會發(fā)起于2011年,致力于為計(jì)算機(jī)視覺、圖像處理、模式識別與機(jī)器學(xué)習(xí)研究領(lǐng)域的華人青年學(xué)者提供一個自由、平等的深層次學(xué)術(shù)交流舞臺,促進(jìn)相關(guān)領(lǐng)域取得突破性學(xué)術(shù)成就和成果轉(zhuǎn)化,提升中國青年學(xué)者在國際學(xué)術(shù)舞臺上的影響力。騰訊優(yōu)圖算法研究員劉皓作為演講嘉賓出席,對外分享了騰訊優(yōu)圖在OCR技術(shù)領(lǐng)域的學(xué)術(shù)研究成果與產(chǎn)品解決方案應(yīng)用實(shí)踐。
(騰訊優(yōu)圖算法研究員劉皓在VALSE2019)
騰訊優(yōu)圖OCR技術(shù)四大優(yōu)勢:適配強(qiáng)、計(jì)算快、識別準(zhǔn)、應(yīng)用廣
騰訊優(yōu)圖實(shí)驗(yàn)室成立于 2012 年,是騰訊旗下頂級的 AI 實(shí)驗(yàn)室之一,專注人臉人體、圖像處理、模式識別、機(jī)器學(xué)習(xí)等領(lǐng)域的技術(shù)研究和業(yè)務(wù)落地。目前,優(yōu)圖的AI 技術(shù)已廣泛應(yīng)用在零售、安防、金融、物流等諸多領(lǐng)域,提供超過12個行業(yè)解決方案,接入70多條騰訊明星產(chǎn)品業(yè)務(wù),擁有超過700項(xiàng)全球?qū)@?。在學(xué)術(shù)成就方面,優(yōu)圖實(shí)驗(yàn)室累計(jì)申請了327篇國內(nèi)AI專利和169篇國際AI專利,2019年 3月,優(yōu)圖實(shí)驗(yàn)室25篇論文入選全球頂級計(jì)算機(jī)視覺會議CVPR2019的成績,備受業(yè)界矚目。
經(jīng)過長期深耕發(fā)展,優(yōu)圖在發(fā)展得最早也最為成熟的OCR應(yīng)用方面,已擁有領(lǐng)先行業(yè)的四大競爭優(yōu)勢。首先,業(yè)務(wù)適配強(qiáng),通用性好。騰訊優(yōu)圖擁有千萬級的數(shù)據(jù)支撐,支持英、日、韓、西、法等19種語言及數(shù)字符號,超過20000個漢字識別,具備廣泛的適配能力。其次,計(jì)算速度快、效率更高。優(yōu)圖OCR技術(shù)文字識別速度GPU平均2ms/字符,CPU平均6ms/字符,模型優(yōu)化迭代快,服務(wù)更為穩(wěn)定。
第三,識別準(zhǔn),在手寫體識別領(lǐng)域顯著領(lǐng)先。騰訊優(yōu)圖OCR技術(shù)手寫體識別能力達(dá)到國內(nèi)首家企業(yè)級應(yīng)用標(biāo)準(zhǔn),手寫中文識別準(zhǔn)確率達(dá)90%以上,手寫英文單詞級識別準(zhǔn)確率更是高達(dá)95%以上。最后,應(yīng)用場景廣泛,經(jīng)過海量服務(wù)檢驗(yàn)。目前優(yōu)圖已經(jīng)在騰訊企業(yè)內(nèi)外上百個不同業(yè)務(wù)中落地應(yīng)用,日調(diào)用量超千萬,尤其在物流、銀行、保險(xiǎn)、政務(wù)、手機(jī)、教育、互聯(lián)網(wǎng)等重點(diǎn)行業(yè)的幾十家大型企業(yè)上線應(yīng)用后,備受用戶好評。
促進(jìn)技術(shù)與產(chǎn)業(yè)場景融合? 助力各行各業(yè)實(shí)現(xiàn)智慧升級
騰訊優(yōu)圖始終積極推動研究成果在業(yè)務(wù)領(lǐng)域的落地。在OCR領(lǐng)域,騰訊優(yōu)圖基于多角度文本檢測、語義增強(qiáng)的文字識別、公式識別、NLP后處理等基礎(chǔ)技術(shù),輸出了財(cái)務(wù)報(bào)銷憑證識別、證照識別、通用文字識別、單據(jù)識別、汽車信息識別、教育試題識別等多個產(chǎn)品解決方案, 并在微信、QQ、順豐、滴滴出行等一批頭部應(yīng)用中落地。
借助騰訊優(yōu)圖OCR技術(shù),通過對業(yè)務(wù)場景進(jìn)行智能改造,能夠極大地減少人力成本、提高生產(chǎn)效率。例如優(yōu)圖與順豐合作,針對運(yùn)單的收寄件人電話號碼和收件人省市區(qū)地址信息做了深入的研究,取得高精度的識別成果。快遞公司基于這些OCR自動識別信息,再結(jié)合自有運(yùn)單數(shù)據(jù)庫,可以自動匹配到更完整更充分的運(yùn)單各字段信息,大幅提升了運(yùn)單信息錄入效率和物流資源的調(diào)度匹配能力。
在技術(shù)攻堅(jiān)方面,針對行業(yè)普遍困擾的英文識別難點(diǎn),包括印刷體、手寫體差異大,手寫體書寫潦草、涂抹痕跡多等問題,騰訊優(yōu)圖OCR技術(shù)創(chuàng)造性地采用多種數(shù)據(jù)增強(qiáng)辦法,并融入NPL模型和優(yōu)化數(shù)據(jù)篩選等機(jī)制,提升了解決方案的魯棒性,令識別結(jié)果更精確,被廣泛應(yīng)用在銀行支票、英文菜單、個人名片等諸多領(lǐng)域,極大地提升了用戶體驗(yàn)。
秉承“研究成果落地才能產(chǎn)生價(jià)值”的原則,騰訊優(yōu)圖始終緊跟時(shí)代和技術(shù)前沿,在技術(shù)研究和業(yè)務(wù)落地等方面持續(xù)發(fā)力,輸出前沿的視覺技術(shù)解決方案,促進(jìn)技術(shù)成果在產(chǎn)業(yè)中的落地轉(zhuǎn)化,助力各行各業(yè)實(shí)現(xiàn)數(shù)字化、智慧化轉(zhuǎn)型,加速智慧產(chǎn)業(yè)時(shí)代的到來。