存档:

文章标签 ‘OCR’
4

Google Drive 里的图形识别技术

2012年4月26日

Google Drive相对其它网盘服务最大的优势或许就在于他们强大的图片识别和搜索技术上了,它使用了Google Goggles的技术来分析识别图片里的物体、logo、地标、文字等等内容,所以即便有个图片叫做a.jpg这样无厘头的名字,也可以出现在相关的搜索结果里。

比如当你搜索Android的时候,如果一个叫做a.jpg的图片里有绿色机器人出没,那么它就会出现在搜索结果里(如上图)。

Google Drive也内置了图片OCR技术,所以图片里的文字也可以通过关键字搜索出来,比如搜索Google,那么带有Google字样的图片就会出现在搜索结果里:

就是说你完全可以往Google Drive里扔一堆扫描的文件,然后利用关键字即可搜索到想找的扫描文件。这个真心赞了。

Via GOS

7

Google 法国官方博客“不慎”提前发布 Google Drive,细节大曝光

2012年4月25日

很难想象Google的内部管理到底出了什么问题,他们的法国官方博客居然不慎提前发布了Google Drive的信息(当然立刻删除了),不过有心人Gerwin Sturm已经将这些信息保存下来,我们通过Google Translate即可看到英文版本,大概是这么一个情况:

  • 5GB免费存储空间
  • 每个月交4美元的谷歌税,即可获得20GB额外的空间
  • Google Drive将深度整合Google Docs,实际上Google Drive本身就被称为下一代的Google Docs的进化体
  • 网页里的Google Drive直接就可支持打开30种类型的文件,甚至包括Photoshop、Illustrator和高清视频格式
  • PC、Mac和Android应用今天就已经发布,iOS版本在未来几周内发布(看来Google并未为了同时发布而提前提交到App Store,怕Apple提前知道?)
  • Google承诺99.9%的无故障时间
  • 相对其它网盘,Google Drive更专注于搜索,包括对OCR的支持和图片识别技术

博文是由Sundar Pichai撰写的,也就是Google Chrome和Chrome OS的老大,不过传说当初正是他阻止了Google Drive的诞生,不知道现在怎么180度大转弯了?

Update:感谢读者 Pingveno 的爆料,他的Google Docs存储空间已经变为5GB了,显然这就是Google Docs准备进化到Google Drive的先兆了:

Via TC

7

Google Docs 开始启用更简单的文件上传流程,支持拖拽

2011年4月25日

Google宣布将在未来几周里陆续向各位Google Docs用户推送全新的文件上传流程,使用起来更简单,支持直接建立文件夹,文档列表整合和拖拽操作。

首先你会在Upload下拉条里看到Folder这个新的选项(上图,对于Chrome、Firefox和Safari用户来说,不过Firefox和Safari需要安装一个小程序),这样你可以上传整个本地目录,目录里的目录,还有目录里的目录里的目录,以及目录里的目录里的目录的目录结构都会自动保存到Google Docs里,好像硬盘搬家。

其次,当你通过这个下拉条上传文件的时候,会弹出一个窗口告诉你每个文件的上传状态,有点Chrome OS里小窗口的意思:

上传设置被删除了,取而代之的是第一次上传时弹出的对话框,你可以选择是否转换为Google Docs原生格式,或者通过OCR扫描图片里的文字出来:

最后,这个新功能也是针对非IE用户的(Chrome、Firefox和Safari for Mac/PC),那就是拖拽上传,呕液!不过由于浏览器的限制,所以现在还无法拖拽文件夹,上传文件夹里的文件和目录结构:

新的上传程序目前还无法像以前那样让你选择OCR识别的语言和可见程度参数,如果你需要用到这些功能,那么可以找到Upload下拉条里的Basic选项,使用原始的上传程序完成。

这些新功能将陆续在几周内部署给Google帐户和Google Apps帐户的所有用户,静静等待吧。

Via Google Docs Blog

作者: 分类: Google新闻 标签: ,
7

Google Docs 的 OCR 光学文字识别功能新增29种语言支持

2011年3月1日

docs_ocr1

去年6月,Google 开始允许用户在上传 PDF 和 图片时使用 OCR 光学文字识别功能将嵌入的图形文字和格式转换为可直接在 Google Docs 中编辑的文本。而今天 Google 再次对此功能进行强化,一口气加入了包括东欧,俄语,简体中文等在内的29种新语言的支持(进入上传页面并勾选 OCR 功能即可看到语言选择工具)。

当然相比语言的支持,OCR 的准确度更加重要,不知道 Docs OCR 的中文识别率怎么样?感兴趣的读者可以试试看并且给给我们一些反馈。

via Docs Blog

作者: 分类: Google新闻 标签: ,
20

Google Docs:把你的老文档放到云上来吧

2010年8月10日

makeagoogledocscopy

从今天起,用户又多了一个使用 Google Docs 这个云 Office 的理由——保存在 Google Docs 里面的 MS Office 等格式的老文件可以随时方便的转换成 Google Docs 格式的文档,在此前你只有在上传文件时才有一次机会转换。更棒的是,现有的图片和 PDF 文档可以直接通过 Google Docs 的 OCR 功能直接识别为可编辑文档。具体支持的文档格式如下:

  • 电子表格:.xls, .xlsx, .ods, .csv, .tsv, .txt, .tsb
  • 文档: .doc, .docx, .html, plain text (.txt), .rtf
  • 演示文档: .ppt, .pps
  • OCR 光学文字识别: .jpg, .gif, .png, .pdf

具体操作方法非常简单,在文档列表界面右键单击文档,选择 Make a Google Docs copy 即可。

via googledocs

8

扫描文件并直接上传到 Google Docs

2010年7月18日

惠普宣布将为所有全合一系列一体机产品提供直接发送到Google Docs的功能,就算没有电脑也能让你的扫描文档立刻进入Google的云端。这个应用程序将在年底发布。

实际上已经有一个叫做Scan Drop的免费Windows应用可以做到这一点,当然你就必须有一台电脑了,利用Scan Drop来扫描文档,然后就可以登录到Google帐户并将扫描好的文档转换为PDF格式上传到Google Docs,在上传前你可以调整PDF文档的页面顺序、旋转方向。然后你可以利用Google Docs内置的OCR功能再识别出文字保存。

继续观看Scan Drop的官方介绍视频:

阅读全文...

作者: 分类: Google技巧, 故事/传闻 标签: , , , ,
7

上传到 Google Docs 的 PDF 和图片可直接做 OCR 文字识别

2010年6月22日

当你上传PDF或图片文件到Google Docs之时,你也许会发现新增了一个OCR识别的选项(如上图),这个功能在去年曾经实验性的发布过,不过当时只能通过API来调用,现在则已经开放给所有用户直接使用了,也就是说Google可能已经解决了识别率过低的问题。

不过亲自尝试之后你也许会对结果感到失望,大概有10%的文字识别都是错误的,而且目前识别出的文档无法保持原始文档的格式。

大家可以试试看Google的在线OCR算法达到了怎样的程度。

Via GOS

作者: 分类: 故事/传闻 标签: , ,
1

Google 注册新专利可以自动将平面杂志转换成数字版本

2010年2月27日

默多克估计又颤抖了,据Electricpig报道,Google注册了一项叫做Segmenting Printed Media Pages into Articles的专利,可以将印刷的平面媒体自动转换成数字版本,这个专利涵盖了扫描杂志和其它打印出版物的方法,以及将它们的文字和图片完全转换成数字版本的方法。也就是说,报纸和杂志,通过这个方法就可以将所有文字和图片完全提取出来,并做成可搜索的数字版本。

Google现在正面临为Google Books扫描图书的诉讼,现在又开始打杂志和报纸的主意,估计“默多克们”又有的忙了。

Via SlashGear

作者: 分类: 故事/传闻 标签: , ,
3

Eric Schmidt: “移动最高!”

2010年2月18日

Google CEO Eric Schmidt 在 MWC 2010 上提出了“移动最高”的理念。这个理念的目标是让掌上设备能解决几乎所有事情。将来所有的 Google 产品都会围绕这一目标,因为 Google 认为移动领域发展非常迅速。

另外,Google 还宣布德语将成为其语音系统的第四语言,并且希望基于此系统的 OCR 工具能打动用户。

Google 还希望创造一个应用程序,能影响云计算服务商和网络运营商,与其一同努力来消除胡乱占用带宽的程序。

Via thelatestnews

作者: 分类: Google新闻 标签: , , ,
0

Google Goggles 拍照并实时翻译视频演示

2010年2月18日

Google CEO Eric Schmidt昨天在巴塞罗那的MWC 2010大会上展示了一张Nexus One上运行Google Goggles进行OCR文字识别的图片,这个新版Google Goggles不仅可以利用拍照来做OCR识别,还可利用Google Translate将识别出的文字实时翻译成你看得懂的语言。

今天,Google放出了一段详细的介绍视频,演示了拍照、文字识别、翻译的整个过程。目前这个技术还只支持德语到应用的翻译,而且还在实验中,但将来会出现在新版的Google Goggles for Android应用程序新版里,且会支持Google Translate支持的全部52种语言之间的互译。

继续观看演示视频:

阅读全文...