3.二值化:相机拍摄的大多数照片都是彩色图像,其中包含大量信息。图片的内容可以简单地分为前景和背景,以使计算机更快更好。为了识别文本,我们需要首先处理彩色图像,以便该图像仅具有前景信息和背景信息。您可以简单地将前景信息定义为黑色,将背景信息定义为白色。这是一个二进制图像。
4.噪声消除:对于不同的文档,噪声的定义可以不同,根据噪声的特征去除噪声称为噪声消除。
5.倾斜校正:由于普通用户在拍摄文档照片时比较随意,所拍摄的照片不可避免地会倾斜,这需要文本识别软件来校正。
1.修复已知bug
2.优化操作体验