摘要:精準(zhǔn)穩(wěn)定易用的文字識(shí)別大家好,今天給大家介紹精準(zhǔn)穩(wěn)定易用的文字識(shí)別應(yīng)用服務(wù)。是英文光學(xué)字符識(shí)別的縮寫,通常叫法為文字識(shí)別。
OCR:精準(zhǔn)、穩(wěn)定、易用的文字識(shí)別
大家好,今天給大家介紹精準(zhǔn)、穩(wěn)定、易用的文字識(shí)別應(yīng)用服務(wù)OCR。
OCR是英文光學(xué)字符識(shí)別的縮寫,通常叫法為文字識(shí)別。它的工作原理是通過掃描儀或數(shù)碼相機(jī)等光學(xué)輸入設(shè)備來獲取紙張上的文字圖片信息,利用各種模式識(shí)別算法,分析文字形態(tài)特征,判斷出合適的標(biāo)準(zhǔn)編碼,然后按照通用的格式,存儲(chǔ)在文本文件中。由此可見OCR實(shí)際上是讓計(jì)算機(jī)認(rèn)字,實(shí)現(xiàn)文字的自動(dòng)輸入,它是一種快捷、省力、高效的文本輸入方法。
文字識(shí)別的基本三要素就是O、C、R。O代表光學(xué),即識(shí)別的是光線給出的文字,而不是聲音,或者人體的觸感等等。那為什么會(huì)有光呢?主要是因?yàn)楣獾姆瓷浜臀锢頃?huì)吸收光線。其次還要求字的顏色和背景是不一樣的。那同樣它對(duì)于輸入的圖片的話,盡可能的要保證圖片的清晰度。第二個(gè)要素就是C,也就是字符的意思。大家需要注意的是,字符是信息的一種編碼,不是字體。字符主要是實(shí)現(xiàn)信息的編碼,比如說大家看到一張?zhí)O果的圖片,那我們第一反應(yīng)它可以代表中文的蘋果這兩個(gè)字符,或者對(duì)應(yīng)到英文的apple這個(gè)字符。所謂的文字其實(shí)就是一種字符,比如說大家常用的漢字,那就是中國人的字符。計(jì)算機(jī)顯然也是需要對(duì)應(yīng)到一個(gè)編碼字符。比如說我們常用的GBK、Unicode、UTF-8等等,那這時(shí)候就會(huì)產(chǎn)生一個(gè)問題,如果有的字的圖像在計(jì)算機(jī)編碼里面沒有對(duì)應(yīng)的信息,那是不是說這個(gè)文字就沒辦法被識(shí)別呢?答案是,的確如此。所以說我們所使用的文字編碼級(jí),一定要盡可能的覆蓋我們所要識(shí)別的字符。文字識(shí)別第三個(gè)要素就是R,它代表了識(shí)別的意思。剛剛我們了解到了,O和C它分別代表了光學(xué)的圖片和對(duì)應(yīng)的字符。那如何將光學(xué)的圖片映射到計(jì)算機(jī)編碼呢?目前關(guān)于如何將圖片字符轉(zhuǎn)換到光學(xué)字符,有兩種方法,一種是傳統(tǒng)方法,還有一種是基于深度學(xué)習(xí)的方法。在我們?nèi)A為云學(xué)院的課程中會(huì)給大家做一個(gè)詳細(xì)的介紹。需要注意的是OCR是指文字識(shí)別,但是OCR所采用的技術(shù)不僅僅是適用于文字識(shí)別。
那么對(duì)于企業(yè)來說,為什么要使用OCR技術(shù)呢?舉個(gè)例子,大家出差之后需要進(jìn)行報(bào)銷,報(bào)銷的時(shí)候需要填寫很多的信息,同樣公司的財(cái)務(wù)人員需要花費(fèi)一個(gè)較長的時(shí)間來進(jìn)行INVOICE的一次次審核,有可能一個(gè)報(bào)銷單需要經(jīng)過三個(gè)或者說更多的財(cái)務(wù)人員進(jìn)行一次次的審核校對(duì)。那即便如此,在我們?nèi)粘?bào)銷中,也多多少少會(huì)出現(xiàn)一些人為的錯(cuò)誤。那么OCR技術(shù)可不可以幫助我們實(shí)現(xiàn)INVOICE的快速準(zhǔn)確的讀取呢?答案是肯定的。由此可見,OCR技術(shù)可以對(duì)于企業(yè)來說,它可以減少相關(guān)人員審核所產(chǎn)生的成本,以及減少審核所需要的流程。總結(jié)一下企業(yè)為什么需要使用OCR技術(shù),第一,是為了降低重復(fù)性的勞動(dòng)成本。第二,它可以提高業(yè)務(wù)效率,第三,它能夠提高文本識(shí)別的精確度。
OCR在企業(yè)中主要運(yùn)用于哪些場景呢?這里做了一個(gè)總結(jié)。第一文檔場景,它主要用于印刷文檔的識(shí)別,翻譯文字的識(shí)別,搜索識(shí)別,涂抹識(shí)別。第二,電商場景,主要用于電商用戶身份的綁定,實(shí)名認(rèn)證,商家身份認(rèn)證。第三,圖片反作弊場景,它主要識(shí)別圖像和視頻中的一些違規(guī)文字,進(jìn)行一些違規(guī)的處理和風(fēng)險(xiǎn)管控。第四,辦公場景,主要會(huì)用于企業(yè)證件、年報(bào)、財(cái)報(bào)、piao據(jù)識(shí)別。然后接著是金融場景,它主要會(huì)用于客戶的身份識(shí)別,身份綁定,個(gè)人信息核實(shí)。最后一個(gè)就是視頻場景,主要是會(huì)用于視頻字幕的識(shí)別,視頻標(biāo)題的識(shí)別,視頻反作弊,圖像反作弊,評(píng)論反作弊等。
文字識(shí)別的技術(shù)難點(diǎn)主要存在以下幾個(gè)方面,第一就是圖像質(zhì)量差,很多場景待識(shí)別的文本圖片的質(zhì)量往往都很差,它存在嚴(yán)重的一些干擾曲線,傾斜、暗光或者曝光扭曲。比如說我們常用的一些海關(guān)的報(bào)關(guān)的掃描單據(jù)。第二它對(duì)精確度要求特別高,在某些場景,用戶對(duì)于數(shù)值的精確度要求特別高。比如說文本中的一些稅率、金額、幣種等文字的精確度要求高達(dá)百分之百。第三就是識(shí)別內(nèi)容較為復(fù)雜,文本內(nèi)容的復(fù)雜多樣性,例如說一個(gè)文本中有可能存在不同的字體和顏色,小數(shù)點(diǎn)近似的英文數(shù)字,特殊的字符,特殊的符號(hào)連接詞以及數(shù)字的內(nèi)容,它的識(shí)別難度會(huì)很大,很容易被漏識(shí),或者誤識(shí)。第四就是語言的種類的繁多,隨著全球化現(xiàn)在越來越擴(kuò)大,每家公司多多少少都會(huì)涉及到多個(gè)國家,這時(shí)候就要求OCR技術(shù)能夠支持多語言多字符。
以上對(duì)文字識(shí)別進(jìn)行了簡要的介紹,訪問華為云學(xué)院(https://edu.huaweicloud.com/) ,報(bào)名學(xué)習(xí)《文字識(shí)別服務(wù)》課程,了解更多文字識(shí)別關(guān)鍵技術(shù)及應(yīng)用實(shí)踐。華為云學(xué)院現(xiàn)已發(fā)布推出《智能表單和證件文字識(shí)別》微認(rèn)證,微認(rèn)證結(jié)合OCR服務(wù),讓您體驗(yàn)智能識(shí)別帶來的效率提升!
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/19928.html
摘要:數(shù)字中國創(chuàng)新大賽決賽名單出爐,與華為云一起挑戰(zhàn)書法識(shí)別日前,以軟件賦能數(shù)字經(jīng)濟(jì)創(chuàng)新驅(qū)動(dòng)數(shù)字中國為主題的數(shù)字中國創(chuàng)新大賽分區(qū)北京決賽成功舉辦。 數(shù)字中國創(chuàng)新大賽決賽名單出爐,與華為云 EI 一起挑戰(zhàn)書法識(shí)別日前,以軟件賦能數(shù)字經(jīng)濟(jì) 創(chuàng)新驅(qū)動(dòng)數(shù)字中國為主題的 2019數(shù)字中國創(chuàng)新大賽分區(qū)(北京)決賽成功舉辦。福州市人民政府副市長李春,中國電子信息產(chǎn)業(yè)發(fā)展研究院黨委書記宋顯珠,中國互聯(lián)網(wǎng)投資...
閱讀 3493·2023-04-25 22:44
閱讀 1040·2021-11-15 11:37
閱讀 1701·2019-08-30 15:55
閱讀 2704·2019-08-30 15:54
閱讀 1154·2019-08-30 13:45
閱讀 1486·2019-08-29 17:14
閱讀 1935·2019-08-29 13:50
閱讀 3498·2019-08-26 11:39