
当你上传PDF或图片文件到Google Docs之时,你也许会发现新增了一个OCR识别的选项(如上图),这个功能在去年曾经实验性的发布过,不过当时只能通过API来调用,现在则已经开放给所有用户直接使用了,也就是说Google可能已经解决了识别率过低的问题。
不过亲自尝试之后你也许会对结果感到失望,大概有10%的文字识别都是错误的,而且目前识别出的文档无法保持原始文档的格式。
大家可以试试看Google的在线OCR算法达到了怎样的程度。
Via GOS
本站文章除注明转载外,均为本站原创编译
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:上传到 Google Docs 的 PDF 和图片可直接做 OCR 文字识别
本文地址:http://www.guao.hk/posts/google-adds-ocr-for-pdf-files-and-images.html
本文短网址:http://guao.cc/ufC
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:上传到 Google Docs 的 PDF 和图片可直接做 OCR 文字识别
本文地址:http://www.guao.hk/posts/google-adds-ocr-for-pdf-files-and-images.html
本文短网址:http://guao.cc/ufC






经测试,日文无法识别。
肯定是英文的可以,中文的不行。。。
英文识别率不错,中文识别不了
英文的可以,中文的不行。
这个功能不错,以后可以将图片保存为PDF再来识别,可以减轻文员很多工作,谢谢楼主分享,发给公司的MM们试一下
试验了一下,根本没有成功。给了一串英文提示信息。
不知道博主用的是英文pdf还是中文pdf来测试,个人估计英文识别率会高一些