●识别字符
简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
纯英文字符集。
简繁字集:除了简体汉字外,还可以混识繁体字5400多个以及香港繁体字和GBK汉字。
●识别字体种类
能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
●识别字号
初号 小六号字体。
●表格识别
可以自动判断、拆分、识别和还原各种通用型印刷体表格。
汉王OCR文字识别软件具有识别正确率高,识别速度快的特点。
支持批量处理功能,避免了单页处理的麻烦。
支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG、PDF多种格式的图像文件;
可识别简体、繁体和英文三种语言;
具有简单易用的表格识别功能;
具有TXT、RTF、HTM和XLS多种输出格式,并有所见即所得的版面还原功能。
1、双击从本站下载的安装包,打开安装向导,单击【下一步】。
2、同意许可证协议,单击【是】。
3、单击【浏览】选择软件安装位置,单击【下一步】。
4、耐心等待一下软件安装。
5、安装完成,单击【完成】就可以使用软件了。
1、在主界面任务栏左上角【文件】选项中选择打开图像,快捷键Ctrl+O。
2、查找您需要转换的pdf文件,注意:不需要点打开,你只需要选中就行,然后点击【pdf转换为TXT文件】。
3、选择你需要转换的页面,也就是你pdf文件里边的内容你需要转换的部分,默认是全部转换。然后选择转换后txt文版的保存地址,点击【浏览】选择文件夹。
4、转换完成,时间根据内容的多少来确定。
OCR文字识别技术是什么?
光学字符识别(英语:Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。国内最早的OCR商业应用是由中国科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。