图像输入:采集所要识别的图像,可以是名片、身份证、护照、行驶证、驾驶证、公文、文档等等都可以,然后将图像输入到识别核心。 图像预处理:此过程包含二值化(将图像上的像素点灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果)、去噪、倾斜度矫正等。呈现出明显的只有黑和白的视觉效果)、去噪、倾斜度矫正等。 版面分析:将所要识别的文档分段、分行处理 字符切割:此时需要字符定位和字符切割,定位出字符串的边界,然后分别对字符串进行单个切割,单个分割出来的字符再做识别。 字符特征提取:提取字符特征,为后面的识别提供依据。 字符识别:将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符。分类器用来进行识别文字。 后处理校正: 根据特定的语言上下文的关系,对识别结果进行较正的算法。