Download

Diplomarbeit

Output of Simulator showing low and high quality text

Output of Simulator showing low and high quality text

近年来,数码相机变得越来越普及。这也带动了人们对图像中文字识别的需求。然而,一般数码相机拍出来的照片分辨率并不高,传统的OCR软件并不能很好的对其中的文字加以识别。另外,这些图片很可能本身就不平整,例如被旋转过,在成像过程中产生了失真,甚至是这些文字本身就处于一个弯曲的表面。
      目前的解决方案主要有两种。一是使用大分辨率的照片(这会带来成本的增加,并且在很多场合实现起来并不现实)。另外一种解决方案是一种叫Mosaicing的技术(图片镶嵌技术)。先拍很多低分辨率(对于图像文件而言),但是大放大倍率(对于图像中的文字而言)的照片,然后将这些照片拼接起来再进行统一OCR处理。这种技术还衍生出了一种新的方案,即对于每个照片分别进行OCR识别,最后再将识别的结果拼接成整段的文字。
      本文提到的方法是:按“行”检测文字并拍摄成低分辨率的图片。这些文字图片可以是被旋转过的,因为成像而失真的,或者文字本身只位于一个轻微弯曲的表面。

Downloads