应用OpenCV进行OCR字符识别 (转载)-因爱智能

opencv自带一个字符识别的例子，它的重点不是OCR字符识别，而主要是演示机器学习的应用。它应用的是UCI提供的字符数据（特征数据）。

DAMILES在网上发布了一个应用OpenCV进行OCR的例子， https://blog.damiles.com/2008/11/basic-ocr-in-opencv/。

这些例子都只能用于学习OpenCV或熟悉OCR的简单流程，因为它们与当前比较专业的OCR引擎的识别率相去甚远。

这里写下OpenCV下OCR的流程：

1. 特征提取

2. 训练

3. 识别

特征提取

1. 在图像预处理后，提取出字符相关的ROI图像，并且大小归一化，整个图像的像素值序列可以直接作为特征。damiles是直接将整个字符图像转换化为vector向量特征作为特征输入的。

2. 但直接将整个图像作为特征数据维度太高，计算量太大，所以也可以进行一些降维处理，减少输入的数据量。拿到字符的ROI图像，二值化。将图像分块，然后统计每个小块中非0像素的个数，这样就形成了一个较小的矩阵，这矩阵就是新的特征了。

OpenCV中letter_recog例子就是使用的其特征数据。

训练与识别

训练与识别一般都采用同一种机器学习方法：

DAMILES应用了KNearest方法，对输入数据进行训练和识别。

1. 数据输入：

getData（）函数中：

为trainData和trainClasses设置数据。

2. 初始化机器学习算法，及其训练

knn=new CvKNearest( trainData, trainClasses, 0, false, K );

trainData, trainClasses数据已得到。

而K是分类的数目。

训练在CvKNearest算法初始化中已经完成

3. 识别

获取识别测试的数据，testData

result=knn->find_nearest(testData,K,0,0,nearest,0);

result为识别的结果。

而OpenCV自带例子中，提供了boost，mlp，knearest，nbayes，svm，rtrees这些机器学习方法，进行训练和识别。

处理的步骤和方式都类似。

这些例子的识别率不是很高，OCR识别率在90%以上才有较好的使用意义，所以，OCR还需要更多特征和分析方法，来提高识别率，tesseract是一个不错的开源OCR引擎。

-------------------

在tesseract最初的字体库里，一种字体的字符样本库包括：94个字符，8种大小，4种字体（正常，粗体，斜体，斜粗体），每种20个样本，共60160个样本。

与UIC提供的字体库不同的是，tesseract提供的是标准印刷体字体库的识别，而UIC提供是手写体handwriting的特征数据。

数据之美提到，G公司（应该就是google了）的研究结果表明，在自然语言与机器翻译领域，简单模型加上大量有效样本数据，比复杂模型加上小样本数据，有效的多。这个结论应该适用机器学习的很多领域。运算足够快，样本足够大，即使简单的模型，效果可能会出人意料。

由此可见，收集有效的、大量的样本库是多么的重要。

● opencv ● ocr

热度(1)

因爱智能