OCR识别是光学字符识别技术,比如你上课时用手机拍了投影上的一段文字,下课后想把其中的内容提取出来(打字太麻烦了),那就可以使用 OCR工具进行识别并输出为你想要的格式(如*.txt, *.doc,*.pdf等等)。
目前的 OCR工具很多,但实际的效果并不是很好,我以前用过汉王,泰比这两款广告做得比较多的 OCR工具 ,它们甚至能把中文识别为英文,效果简直是差得不行。有时我们还得相信大公司的实力,微软的 OneNote提供了OCR识别的功能,实际的测试效果非常好,使用方法也很简单:在OneNote中插入需要识别的图片→选中→右击选择复制图片中的文字。同时,微软还提供了免费的手机端App,叫做 Office Lens,输出支持的格式非常多,但速度稍微慢了一些(可能是服务器需要时间处理),用户体验总体不错。
作为谷歌忠实粉丝的我,当然不会忘了Tesseract OCR这款开源工具啦,有兴趣的同学可以去 Github上下载(下载地址:https://github.com/tesseract-ocr/tesseract)。
如果你不想安装识别软件的话,也可以去www.onlineocr.net或www.free-ocr.com这些网站在线识别,进过我的测试,效果不比专业软件差!