扫描仪的产生加速了纸质文档信息化现代化处理的脚步,便携式手持取像设备推动了视觉图像的研究。而与此同时由于不可避免的产生失真和扭曲,如取像位置的不确定导致的失真,焦距失真、光线明暗不均导致的模糊,角度变化产生的线性扭曲以及比较难去除的非线性扭曲等,这都影响到了图像以后的识别度,在图像的处理和辨识上提了更多的要求。其中比较难的是图像分割:由于非线性扭曲的几何畸变,分割图像会因为字符本身的倾斜和文档发生的弯曲而困难重重,即使成功分割后也仍会因为与数据库中样本差异大而导致识别率下降产生错别字等。为了取得高辨识度图像文档,我们要给几何畸变的图像校正。81376
图像校正主要有由扫描仪产生的传统扫描图像文档校正和手持设备产生的视觉图像文档校正两类。图像文档的处理方法有:(1)基于3D模型技术的图像处理。这种图像处理方法对硬件的要求极高,所以虽然能较好的校正扭曲图像,应用并不广泛。文献[1]就是重建3D模型恢复图像,数学计算要求较高论文网。(2)基于Hough变换的图像处理。如文献[2]是根据透视变换的原理,在霍夫变换和透视变换的基础上进行了改进,完成透视图像的校正,这种方法涉及了摄像机的成像机理。(3)基于连通域的图像处理。如文献[3]基于连通域的方法,改进后交叉提取文字聚集成行,再完善文本行内连通域的信息,逐行校正,最后完成对扭曲图像的校正。(4)基于文本行重构的图像处理。(5)根据文档内容分割的校正方法等。如文献[4]是基于文档内容进行分割多个连通域,找到边界盒子从而检测文本行,最后对着基准线校正。而且实际应用时,我们完全可以结合上述不同方法,比如文献[5]结合文本行重建的方法和投影轮廓的方法,先投影轮廓检测出文本行走向,再用文本行重建计算倾斜角,最终校正。这样就解决了重建文本行必须要提前知道文本行方向的问题,也达到减小投影轮廓法计算量的效果,提高了效率。类似的,比如文献[6]也可以把基于Hough变换的方法和基于文本行重建的方法结合,先提取连通域中位点,再根据这些点拟合的直线进行Hough变换检查,根据这些直线进行倾斜角度校正。充分结合这些方法可以扬长避短,各取所需,充分发挥各自优点。
扭曲文档图像的校正技术国内外研究现状:http://www.youerw.com/yanjiu/lunwen_95080.html