包裝機械

 

 

 

 

 

OCR 技術與圖片驗證碼


應用前提

圖像識彆軟件或視覺傳感器,識彆文字使用的主要原理是 OCR 技術。

若將文字改成圖片,采用OCR技術的所有圖像識彆軟件就可能失效。但使用這種技術,圖片驗證碼圖像一定不能使用重復有規律圖片,不然,一樣可輕鬆識彆破解。

OCR是英文 Optical Character Recognition 的簡寫,中文譯為“光學字符識彆”。OCR 是指電子設備(譬如:掃描儀)或傳感器 (譬如:視覺傳感器) 先通過檢測印刷字符明、暗確定字符形狀,然後再用字符識彆方法將字符形狀翻譯成計算機文字的過程。即:針對印刷字符,采用光學方式將紙質文檔文字轉換成黑白點陣圖像文件,再通過自動識彆軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯、處理的技術。


基本要求

OCR 識彆文本時,圖片質量一般建議 150dpi 以上。OCR 對彩色圖片識彆較差,黑白圖片識彆較好;因此,建議采用黑白圖片。OCR 技術對印刷字體識彆較好,手寫識彆較差。

OCR 技術從影像到結果輸齣,工作須經過:

影像輸入、影像預處理、文字特徵抽取、比對識彆、最後經人工校正將認錯的文字更正、輸齣結果。



從原理上來說,采用類似 OCR 的這種技術識彆圖像也是可行的;實際上,卻為什麼又不行呢?有以下多種原因:

01、原理雷同,但計算量太大。

每個文字占用電腦內存空間都很小,且可單獨計算;而圖片是一個整體,要一次計算一張圖片,圖片多大,就要占用多少電腦內存空間。

02、文字是幾韆年來人類文化的結晶,經過漫長曆史檢驗,規律性很強;而圖片沒規律,且還可以是任意的。

就算你有雲服務器,不怕圖片計算量,若想搞定這種技術,除非你有類似人腦的人工智能;目前已知有信息可查的人工智能技術,並未達到這種成熟程度。

譬如:百度、Google、微軟開發的識圖軟件。

再進一步假定,就算人工智能技術成熟,但這種大計算量的服務器費用會很高,也不是一般人用得起的。

03、不管是那種世界文字,用計算機技術處理成黑白或灰度圖片再進行識彆會很容易。

而圖片的沒規律性及自然界光綫的多變性,同一規則物體在相同視角、不同時間,拍攝成多張圖片後也會有些許不同;用計算機技術處理成黑白或灰度圖片再進行識彆,難度會增加不少。

更彆說,同一規則物體在不同視角、不同時間,拍攝成圖片後差彆一般會非常大。某些情況,從某一視角觀察,根據基本投影規律,不同物體還可能得到相同影像。

04、除非齣現新技術或新科技或新突破,至少目前的 OCR 技術是解決不瞭這個問題的。

要真正做到所有圖片,計算機都能自動分辨、識彆,最好采用類似人類大腦或比人類大腦更聰明的人工智能技術。

目前人工智能技術還處於初級階段,從2015年的工業4.0智能製造與機械人熱,可見一斑。

真正的全球人工智能技術纔剛剛步入日常應用,人工智能技術要再往前大跨一步或若乾步之後,自動分辨、識彆所有圖片纔有可能實現。