Google先是宣布了Google Docs的OCR文字识别功能,之后又宣布了搜索结果里用Google Docs的PDF快速查看功能,也许眼尖的读者已经注意到了,PDF快速查看里,也内置了OCR文字识别功能。那些扫描而成的PDF里的文字,都可以导出为HTML,就得到了识别后的文字。
更棒的是,OCR识别支持多种语言,比如上图的希伯来语。但也不是所有人都对此感到高兴,WebmasterWorld里就有站长非常不满,因为Google偷走了他们的流量。
Related posts
- Google 法国官方博客“不慎”提前发布 Google Drive,细节大曝光
- Google Docs 开始启用更简单的文件上传流程,支持拖拽
- Eric Schmidt: “移动最高!”
- Google Docs:把你的老文档放到云上来吧
- 扫描文件并直接上传到 Google Docs
- 上传到 Google Docs 的 PDF 和图片可直接做 OCR 文字识别
- Google Goggles 拍照并实时翻译视频演示
- Google Docs 可直接做 OCR 将图片转换为可编辑文本了
- Google Docs 的 OCR 光学文字识别功能新增29种语言支持
- Chrome 浏览器的 PDF 插件使用了 Foxit PDF SDK
本站文章除注明转载外,均为本站原创编译
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:Google 搜索结果中的 PDF 快速查看链接可直接做 OCR 识别文字
本文地址:http://www.guao.hk/posts/google-serp-pdf-quick-view-can-does-ocr-convertion.html
本文短网址:http://guao.cc/Rcx
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.guao.hk]
本文标题:Google 搜索结果中的 PDF 快速查看链接可直接做 OCR 识别文字
本文地址:http://www.guao.hk/posts/google-serp-pdf-quick-view-can-does-ocr-convertion.html
本文短网址:http://guao.cc/Rcx







不知道中文识别效果如何
嘿嘿~~占个沙发~