OCR识别到底哪家强?


OCR识别是光学字符识别技术,比如你上课时用手机拍了投影上的一段文字,下课后想把其中的内容提取出来(打字太麻烦了),那就可以使用 OCR工具进行识别并输出为你想要的格式(如*.txt, *.doc,*.pdf等等)。

目前的 OCR工具很多,但实际的效果并不是很好,我以前用过汉王,泰比这两款广告做得比较多的 OCR工具 ,它们甚至能把中文识别为英文,效果简直是差得不行。有时我们还得相信大公司的实力,微软的 OneNote提供了OCR识别的功能,实际的测试效果非常好,使用方法也很简单:在OneNote中插入需要识别的图片→选中→右击选择复制图片中的文字。同时,微软还提供了免费的手机端App,叫做 Office Lens,输出支持的格式非常多,但速度稍微慢了一些(可能是服务器需要时间处理),用户体验总体不错。

作为谷歌忠实粉丝的我,当然不会忘了Tesseract OCR这款开源工具啦,有兴趣的同学可以去 Github上下载(下载地址:https://github.com/tesseract-ocr/tesseract)。

如果你不想安装识别软件的话,也可以去www.onlineocr.netwww.free-ocr.com这些网站在线识别,进过我的测试,效果不比专业软件差!

发表评论

电子邮件地址不会被公开。 必填项已用*标注