7

上传到 Google Docs 的 PDF 和图片可直接做 OCR 文字识别

2010年6月22日

当你上传PDF或图片文件到Google Docs之时,你也许会发现新增了一个OCR识别的选项(如上图),这个功能在去年曾经实验性的发布过,不过当时只能通过API来调用,现在则已经开放给所有用户直接使用了,也就是说Google可能已经解决了识别率过低的问题。

不过亲自尝试之后你也许会对结果感到失望,大概有10%的文字识别都是错误的,而且目前识别出的文档无法保持原始文档的格式。

大家可以试试看Google的在线OCR算法达到了怎样的程度。

Via GOS

本站文章除注明转载外,均为本站原创编译
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:上传到 Google Docs 的 PDF 和图片可直接做 OCR 文字识别
本文地址:http://www.guao.hk/posts/google-adds-ocr-for-pdf-files-and-images.html
本文短网址:http://guao.cc/ufC
作者: 分类: 故事/传闻 标签: , ,
  1. tips
    2010年6月24日02:43 | #1

    经测试,日文无法识别。

    Thumb up 0 Thumb down 0

  2. 2010年6月23日22:57 | #2

    肯定是英文的可以,中文的不行。。。

    Thumb up 0 Thumb down 0

  3. madbeef
    2010年6月22日14:18 | #3

    英文识别率不错,中文识别不了

    Thumb up 0 Thumb down 0

  4. madbeef
    2010年6月22日14:06 | #4

    英文的可以,中文的不行。

    Thumb up 0 Thumb down 0

  5. 2010年6月22日10:02 | #5

    这个功能不错,以后可以将图片保存为PDF再来识别,可以减轻文员很多工作,谢谢楼主分享,发给公司的MM们试一下

    Thumb up 0 Thumb down 0

  6. 2010年6月22日08:35 | #6

    试验了一下,根本没有成功。给了一串英文提示信息。

    Thumb up 0 Thumb down 0

  7. 欧阳海卫
    2010年6月22日05:15 | #7

    不知道博主用的是英文pdf还是中文pdf来测试,个人估计英文识别率会高一些

    Thumb up 0 Thumb down 0

  1. 本文目前尚无任何 trackbacks 和 pingbacks.
首次留言需审核,之后不会再审核。由于缓存机制您的留言可能不会立即显示出来,请稍后刷新本页面

您可以直接点击别人评论右侧的回复,这样您的回复评论将同时发到原作者信箱