(VALSE2019騰訊優(yōu)圖展位)
VALSE大會(huì)發(fā)起于2011年,致力于為計(jì)算機(jī)視覺、圖像處理、模式識(shí)別與機(jī)器學(xué)習(xí)研究領(lǐng)域的華人青年學(xué)者提供一個(gè)自由、平等的深層次學(xué)術(shù)交流舞臺(tái),促進(jìn)相關(guān)領(lǐng)域取得突破性學(xué)術(shù)成就和成果轉(zhuǎn)化,提升中國(guó)青年學(xué)者在國(guó)際學(xué)術(shù)舞臺(tái)上的影響力。騰訊優(yōu)圖算法研究員劉皓作為演講嘉賓出席,對(duì)外分享了騰訊優(yōu)圖在OCR技術(shù)領(lǐng)域的學(xué)術(shù)研究成果與產(chǎn)品解決方案應(yīng)用實(shí)踐。
(騰訊優(yōu)圖算法研究員劉皓在VALSE2019)
騰訊優(yōu)圖OCR技術(shù)四大優(yōu)勢(shì):適配強(qiáng)、計(jì)算快、識(shí)別準(zhǔn)、應(yīng)用廣
騰訊優(yōu)圖實(shí)驗(yàn)室成立于 2012 年,是騰訊旗下頂級(jí)的 AI 實(shí)驗(yàn)室之一,專注人臉人體、圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等領(lǐng)域的技術(shù)研究和業(yè)務(wù)落地。目前,優(yōu)圖的AI 技術(shù)已廣泛應(yīng)用在零售、安防、金融、物流等諸多領(lǐng)域,提供超過(guò)12個(gè)行業(yè)解決方案,接入70多條騰訊明星產(chǎn)品業(yè)務(wù),擁有超過(guò)700項(xiàng)全球?qū)@?。在學(xué)術(shù)成就方面,優(yōu)圖實(shí)驗(yàn)室累計(jì)申請(qǐng)了327篇國(guó)內(nèi)AI專利和169篇國(guó)際AI專利,2019年 3月,優(yōu)圖實(shí)驗(yàn)室25篇論文入選全球頂級(jí)計(jì)算機(jī)視覺會(huì)議CVPR2019的成績(jī),備受業(yè)界矚目。
經(jīng)過(guò)長(zhǎng)期深耕發(fā)展,優(yōu)圖在發(fā)展得最早也最為成熟的OCR應(yīng)用方面,已擁有領(lǐng)先行業(yè)的四大競(jìng)爭(zhēng)優(yōu)勢(shì)。首先,業(yè)務(wù)適配強(qiáng),通用性好。騰訊優(yōu)圖擁有千萬(wàn)級(jí)的數(shù)據(jù)支撐,支持英、日、韓、西、法等19種語(yǔ)言及數(shù)字符號(hào),超過(guò)20000個(gè)漢字識(shí)別,具備廣泛的適配能力。其次,計(jì)算速度快、效率更高。優(yōu)圖OCR技術(shù)文字識(shí)別速度GPU平均2ms/字符,CPU平均6ms/字符,模型優(yōu)化迭代快,服務(wù)更為穩(wěn)定。
第三,識(shí)別準(zhǔn),在手寫體識(shí)別領(lǐng)域顯著領(lǐng)先。騰訊優(yōu)圖OCR技術(shù)手寫體識(shí)別能力達(dá)到國(guó)內(nèi)首家企業(yè)級(jí)應(yīng)用標(biāo)準(zhǔn),手寫中文識(shí)別準(zhǔn)確率達(dá)90%以上,手寫英文單詞級(jí)識(shí)別準(zhǔn)確率更是高達(dá)95%以上。最后,應(yīng)用場(chǎng)景廣泛,經(jīng)過(guò)海量服務(wù)檢驗(yàn)。目前優(yōu)圖已經(jīng)在騰訊企業(yè)內(nèi)外上百個(gè)不同業(yè)務(wù)中落地應(yīng)用,日調(diào)用量超千萬(wàn),尤其在物流、銀行、保險(xiǎn)、政務(wù)、手機(jī)、教育、互聯(lián)網(wǎng)等重點(diǎn)行業(yè)的幾十家大型企業(yè)上線應(yīng)用后,備受用戶好評(píng)。
促進(jìn)技術(shù)與產(chǎn)業(yè)場(chǎng)景融合? 助力各行各業(yè)實(shí)現(xiàn)智慧升級(jí)
騰訊優(yōu)圖始終積極推動(dòng)研究成果在業(yè)務(wù)領(lǐng)域的落地。在OCR領(lǐng)域,騰訊優(yōu)圖基于多角度文本檢測(cè)、語(yǔ)義增強(qiáng)的文字識(shí)別、公式識(shí)別、NLP后處理等基礎(chǔ)技術(shù),輸出了財(cái)務(wù)報(bào)銷憑證識(shí)別、證照識(shí)別、通用文字識(shí)別、單據(jù)識(shí)別、汽車信息識(shí)別、教育試題識(shí)別等多個(gè)產(chǎn)品解決方案, 并在微信、QQ、順豐、滴滴出行等一批頭部應(yīng)用中落地。
借助騰訊優(yōu)圖OCR技術(shù),通過(guò)對(duì)業(yè)務(wù)場(chǎng)景進(jìn)行智能改造,能夠極大地減少人力成本、提高生產(chǎn)效率。例如優(yōu)圖與順豐合作,針對(duì)運(yùn)單的收寄件人電話號(hào)碼和收件人省市區(qū)地址信息做了深入的研究,取得高精度的識(shí)別成果??爝f公司基于這些OCR自動(dòng)識(shí)別信息,再結(jié)合自有運(yùn)單數(shù)據(jù)庫(kù),可以自動(dòng)匹配到更完整更充分的運(yùn)單各字段信息,大幅提升了運(yùn)單信息錄入效率和物流資源的調(diào)度匹配能力。
在技術(shù)攻堅(jiān)方面,針對(duì)行業(yè)普遍困擾的英文識(shí)別難點(diǎn),包括印刷體、手寫體差異大,手寫體書寫潦草、涂抹痕跡多等問(wèn)題,騰訊優(yōu)圖OCR技術(shù)創(chuàng)造性地采用多種數(shù)據(jù)增強(qiáng)辦法,并融入NPL模型和優(yōu)化數(shù)據(jù)篩選等機(jī)制,提升了解決方案的魯棒性,令識(shí)別結(jié)果更精確,被廣泛應(yīng)用在銀行支票、英文菜單、個(gè)人名片等諸多領(lǐng)域,極大地提升了用戶體驗(yàn)。
秉承“研究成果落地才能產(chǎn)生價(jià)值”的原則,騰訊優(yōu)圖始終緊跟時(shí)代和技術(shù)前沿,在技術(shù)研究和業(yè)務(wù)落地等方面持續(xù)發(fā)力,輸出前沿的視覺技術(shù)解決方案,促進(jìn)技術(shù)成果在產(chǎn)業(yè)中的落地轉(zhuǎn)化,助力各行各業(yè)實(shí)現(xiàn)數(shù)字化、智慧化轉(zhuǎn)型,加速智慧產(chǎn)業(yè)時(shí)代的到來(lái)。