OCR Technology & Image Verification Code

应用前提

图像识别软件或视觉传感器，识别文字使用的主要原理是 OCR 技术。

若将文字改成图片，采用OCR技术的所有图像识别软件就可能失效。但使用这种技术，图片验证码图像一定不能使用重复有规律图片，不然，一样可轻松识别破解。

OCR是英文 Optical Character Recognition 的简写，中文译为“光学字符识别”。OCR 是指电子设备（譬如：扫描仪）或传感器 (譬如：视觉传感器) 先通过检测印刷字符明、暗确定字符形状，然后再用字符识别方法将字符形状翻译成计算机文字的过程。即：针对印刷字符，采用光学方式将纸质文档文字转换成黑白点阵图像文件，再通过自动识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑、处理的技术。

基本要求

OCR 识别文本时，图片质量一般建议 150dpi 以上。OCR 对彩色图片识别较差，黑白图片识别较好；因此，建议采用黑白图片。OCR 技术对印刷字体识别较好，手写识别较差。

OCR 技术从影像到结果输出，工作须经过：

影像输入、影像预处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正、输出结果。

从原理上来说，采用类似 OCR 的这种技术识别图像也是可行的；实际上，却为什么又不行呢？有以下多种原因：

01、原理雷同，但计算量太大。

每个文字占用电脑内存空间都很小，且可单独计算；而图片是一个整体，要一次计算一张图片，图片多大，就要占用多少电脑内存空间。

02、文字是几千年来人类文化的结晶，经过漫长历史检验，规律性很强；而图片没规律，且还可以是任意的。

就算你有云服务器，不怕图片计算量，若想搞定这种技术，除非你有类似人脑的人工智能；目前已知有信息可查的人工智能技术，并未达到这种成熟程度。

譬如：百度、Google、微软开发的识图软件。

再进一步假定，就算人工智能技术成熟，但这种大计算量的服务器费用会很高，也不是一般人用得起的。

03、不管是那种世界文字，用计算机技术处理成黑白或灰度图片再进行识别会很容易。

而图片的没规律性及自然界光线的多变性，同一规则物体在相同视角、不同时间，拍摄成多张图片后也会有些许不同；用计算机技术处理成黑白或灰度图片再进行识别，难度会增加不少。

更别说，同一规则物体在不同视角、不同时间，拍摄成图片后差别一般会非常大。某些情况，从某一视角观察，根据基本投影规律，不同物体还可能得到相同影像。

04、除非出现新技术或新科技或新突破，至少目前的 OCR 技术是解决不了这个问题的。

要真正做到所有图片，计算机都能自动分辨、识别，最好采用类似人类大脑或比人类大脑更聪明的人工智能技术。

目前人工智能技术还处于初级阶段，从2015年的工业4.0智能制造与机械人热，可见一斑。

真正的全球人工智能技术才刚刚步入日常应用，人工智能技术要再往前大跨一步或若干步之后，自动分辨、识别所有图片才有可能实现。

Packing Machinery

Special Printing

Offset Printing Machine

Non-Standard Equipment

Vision Sensor

OCR Technology & Image Verification Code