(ICDAR2017獲獎(jiǎng)證書)
OCR技術(shù)落地,給予全新解決方案
國(guó)際文檔分析與識(shí)別大會(huì)(ICDAR)專注于文本領(lǐng)域的識(shí)別與應(yīng)用,自2003年大會(huì)設(shè)立“Robust Reading Competitions”以來(lái),該競(jìng)賽就成了評(píng)測(cè)和檢驗(yàn)自然場(chǎng)景/網(wǎng)絡(luò)圖片/復(fù)雜視頻文本自動(dòng)提取與智能識(shí)別最新技術(shù)研究進(jìn)展的最為重要的國(guó)際賽事及標(biāo)準(zhǔn),競(jìng)賽中的諸多方法對(duì)OCR技術(shù)的發(fā)展具有強(qiáng)大推動(dòng)力。高技術(shù)難度、強(qiáng)大實(shí)際應(yīng)用性,也使該盛會(huì)受到科研院校、科技公司等的關(guān)注,至今已有89個(gè)國(guó)家的3500多支隊(duì)伍參與。
(參賽隊(duì)伍數(shù)量統(tǒng)計(jì))
據(jù)了解,首次參與競(jìng)逐的騰訊數(shù)平精準(zhǔn)推薦團(tuán)隊(duì)在文本識(shí)別領(lǐng)域上已深耕多年,自研的基于深度學(xué)習(xí)方法的文本檢測(cè)與識(shí)別技術(shù)在往屆ICDAR競(jìng)賽數(shù)據(jù)集上也曾多次刷新世界紀(jì)錄。相關(guān)技術(shù)在騰訊內(nèi)部多款產(chǎn)品成功應(yīng)用,特別在廣告推薦的場(chǎng)景中,通過(guò)OCR 技術(shù)深度識(shí)別和理解廣告素材創(chuàng)意,大幅提升了用戶點(diǎn)擊率預(yù)估的效果。
騰訊優(yōu)圖OCR技術(shù)也早在ICDAR 2015大賽的場(chǎng)景文字識(shí)別和自然場(chǎng)景文本檢測(cè)兩項(xiàng)目中取得第一,并且,基于騰訊優(yōu)圖實(shí)驗(yàn)室的業(yè)界領(lǐng)先的核心能力,騰訊云將OCR文本識(shí)別和檢測(cè)技術(shù)真正落地,深度介入印刷體和手寫體存在的各種場(chǎng)景,給予行業(yè)流程繁瑣、效率低下以及成本居高不下的全新解決方案。
智能解放生產(chǎn)力,助力行業(yè)標(biāo)桿
OCR是人工智能里面非常重要的基礎(chǔ)能力之一,對(duì)于傳統(tǒng)行業(yè),在優(yōu)化業(yè)務(wù)流程、解放生產(chǎn)力和降低企業(yè)成本方面,實(shí)效凸顯。而受眾群體極廣、業(yè)務(wù)量相對(duì)較大、頻次較高的物流場(chǎng)景對(duì)這一技術(shù)的追求,顯得迫切,紛紛通過(guò)騰訊云依托優(yōu)圖實(shí)驗(yàn)室的OCR技術(shù)給予的全新解決方案成就行業(yè)標(biāo)桿。
物流行業(yè)勞動(dòng)密集型的屬性,在順豐身上比較明顯。據(jù)悉,目前順豐擁有將近20萬(wàn)地面小哥,平均每天傳遞將近900萬(wàn)個(gè)包裹和商務(wù)信件,這在以前需要順豐雇傭大量輸單員手動(dòng)輸入運(yùn)單信息。和騰訊云戰(zhàn)略合作之后,憑借其OCR技術(shù)全新解決方案,實(shí)現(xiàn)快速識(shí)別手寫體和打印體的快遞單,準(zhǔn)確率高達(dá)91%。以往因容易認(rèn)錯(cuò)而加大物流中的人力、物力和時(shí)間成本的潦草的手寫寄件收件信息,也能夠識(shí)別,正確率接近人工識(shí)別水平。最終,加上本身OCR技術(shù)的“7X24”服務(wù)能力,給予順豐3小時(shí)內(nèi)識(shí)別2000萬(wàn)張訂單信息的業(yè)務(wù)效率,一定程度上也極大的提高了整體物流效率,而且不經(jīng)人工,也一定程度上降低了用戶隱私泄露的風(fēng)險(xiǎn)。
騰訊云與中國(guó)外運(yùn)合作,依托優(yōu)圖實(shí)驗(yàn)室識(shí)別技術(shù)幫助解決企業(yè)效率問(wèn)題,也是一個(gè)典型的智能實(shí)踐案例。中外運(yùn)是國(guó)際整合物流服務(wù)商,海外網(wǎng)絡(luò)覆蓋全球五大洲,其每年業(yè)務(wù)系統(tǒng)訂單超過(guò)300萬(wàn),而在傳統(tǒng)作業(yè)方式下,人工識(shí)別、錄入一筆單據(jù)需要3分鐘。而通過(guò)應(yīng)用OCR技術(shù)解決方案,識(shí)別單據(jù)僅需4秒,而且實(shí)現(xiàn)識(shí)別即入系統(tǒng),效率提升45倍。據(jù)了解,除了單據(jù)錄入,中外運(yùn)在訂艙委托、訂艙確認(rèn)件、提單樣本、發(fā)票等環(huán)節(jié)都應(yīng)用了這一技術(shù),傳統(tǒng)人力操作業(yè)務(wù)流程徹底變成自動(dòng)化智能化,降低企業(yè)負(fù)擔(dān)。
強(qiáng)大技術(shù)能力,支撐多場(chǎng)景應(yīng)用環(huán)境
除了物流行業(yè)場(chǎng)景的天然需求,騰訊云依托優(yōu)圖實(shí)驗(yàn)室OCR技術(shù)給予的解決方案,還被廣泛應(yīng)用在金融、保險(xiǎn)以及政府部門等行業(yè)組織場(chǎng)景中的證件識(shí)別,如身份證、駕駛證、行駛證、營(yíng)業(yè)執(zhí)照、車牌、名片等。據(jù)了解,該解決方案已支持英文數(shù)字識(shí)別,和超過(guò)9000個(gè)常用漢字的簡(jiǎn)繁體識(shí)別。針對(duì)身份證識(shí)別,其已支持身份證的正、反面識(shí)別,一次掃描即可識(shí)別所有字段,對(duì)于像傾斜、暗光、曝光、陰影等異常場(chǎng)景環(huán)境的識(shí)別,也能保障準(zhǔn)確率。該解決方案還能通過(guò)自適應(yīng)判別糾正技術(shù),將身份證上的數(shù)字識(shí)別準(zhǔn)確率提高到99.9%以上,而對(duì)印刷體名片,其能自動(dòng)識(shí)別和定位姓名、手機(jī)號(hào)、QQ等字段,并實(shí)現(xiàn)30度以內(nèi)的角度偏轉(zhuǎn),姓名字段與手機(jī)號(hào)碼字段的自動(dòng)識(shí)別準(zhǔn)確率超過(guò)90%,領(lǐng)跑業(yè)界。
值得一提的是,傳統(tǒng)的營(yíng)業(yè)執(zhí)照信息錄入,要依賴人工對(duì)信息進(jìn)行錄入、處理和核對(duì),存在信息錄入錯(cuò)誤、效率低等問(wèn)題。上傳營(yíng)業(yè)執(zhí)照便能自動(dòng)識(shí)別名稱、執(zhí)照號(hào)等,支持核實(shí)與糾正識(shí)別的信息。避免繁瑣的人工輸入,同時(shí)又能提高注冊(cè)和客服審核的效率與準(zhǔn)確度。對(duì)營(yíng)業(yè)執(zhí)照存在的不同版本的字段分布差異以及執(zhí)照?qǐng)D片質(zhì)量差等問(wèn)題,其定制研發(fā)的OCR檢測(cè)識(shí)別引擎,識(shí)別準(zhǔn)確率達(dá)到95%以上。
騰訊云打造的多場(chǎng)景智能識(shí)別解決方案,其本身不斷優(yōu)化升級(jí)的同時(shí),還攜手更多行業(yè)合作伙伴,通過(guò)技術(shù)賦能實(shí)現(xiàn)行業(yè)改革,提升整體行業(yè)效率,最終也將受惠于每一個(gè)人。