存档:

文章标签 ‘OCR’
7

Google Docs 开始启用更简单的文件上传流程,支持拖拽

2011年4月25日

Google宣布将在未来几周里陆续向各位Google Docs用户推送全新的文件上传流程,使用起来更简单,支持直接建立文件夹,文档列表整合和拖拽操作。

首先你会在Upload下拉条里看到Folder这个新的选项(上图,对于Chrome、Firefox和Safari用户来说,不过Firefox和Safari需要安装一个小程序),这样你可以上传整个本地目录,目录里的目录,还有目录里的目录里的目录,以及目录里的目录里的目录的目录结构都会自动保存到Google Docs里,好像硬盘搬家。

其次,当你通过这个下拉条上传文件的时候,会弹出一个窗口告诉你每个文件的上传状态,有点Chrome OS里小窗口的意思:

上传设置被删除了,取而代之的是第一次上传时弹出的对话框,你可以选择是否转换为Google Docs原生格式,或者通过OCR扫描图片里的文字出来:

最后,这个新功能也是针对非IE用户的(Chrome、Firefox和Safari for Mac/PC),那就是拖拽上传,呕液!不过由于浏览器的限制,所以现在还无法拖拽文件夹,上传文件夹里的文件和目录结构:

新的上传程序目前还无法像以前那样让你选择OCR识别的语言和可见程度参数,如果你需要用到这些功能,那么可以找到Upload下拉条里的Basic选项,使用原始的上传程序完成。

这些新功能将陆续在几周内部署给Google帐户和Google Apps帐户的所有用户,静静等待吧。

Via Google Docs Blog

作者: 分类: Google新闻 标签: ,
7

Google Docs 的 OCR 光学文字识别功能新增29种语言支持

2011年3月1日

docs_ocr1

去年6月,Google 开始允许用户在上传 PDF 和 图片时使用 OCR 光学文字识别功能将嵌入的图形文字和格式转换为可直接在 Google Docs 中编辑的文本。而今天 Google 再次对此功能进行强化,一口气加入了包括东欧,俄语,简体中文等在内的29种新语言的支持(进入上传页面并勾选 OCR 功能即可看到语言选择工具)。

当然相比语言的支持,OCR 的准确度更加重要,不知道 Docs OCR 的中文识别率怎么样?感兴趣的读者可以试试看并且给给我们一些反馈。

via Docs Blog

作者: 分类: Google新闻 标签: ,
20

Google Docs:把你的老文档放到云上来吧

2010年8月10日

makeagoogledocscopy

从今天起,用户又多了一个使用 Google Docs 这个云 Office 的理由——保存在 Google Docs 里面的 MS Office 等格式的老文件可以随时方便的转换成 Google Docs 格式的文档,在此前你只有在上传文件时才有一次机会转换。更棒的是,现有的图片和 PDF 文档可以直接通过 Google Docs 的 OCR 功能直接识别为可编辑文档。具体支持的文档格式如下:

  • 电子表格:.xls, .xlsx, .ods, .csv, .tsv, .txt, .tsb
  • 文档: .doc, .docx, .html, plain text (.txt), .rtf
  • 演示文档: .ppt, .pps
  • OCR 光学文字识别: .jpg, .gif, .png, .pdf

具体操作方法非常简单,在文档列表界面右键单击文档,选择 Make a Google Docs copy 即可。

via googledocs

8

扫描文件并直接上传到 Google Docs

2010年7月18日

惠普宣布将为所有全合一系列一体机产品提供直接发送到Google Docs的功能,就算没有电脑也能让你的扫描文档立刻进入Google的云端。这个应用程序将在年底发布。

实际上已经有一个叫做Scan Drop的免费Windows应用可以做到这一点,当然你就必须有一台电脑了,利用Scan Drop来扫描文档,然后就可以登录到Google帐户并将扫描好的文档转换为PDF格式上传到Google Docs,在上传前你可以调整PDF文档的页面顺序、旋转方向。然后你可以利用Google Docs内置的OCR功能再识别出文字保存。

继续观看Scan Drop的官方介绍视频:

阅读全文...

作者: 分类: Google技巧, 故事/传闻 标签: , , , ,
7

上传到 Google Docs 的 PDF 和图片可直接做 OCR 文字识别

2010年6月22日

当你上传PDF或图片文件到Google Docs之时,你也许会发现新增了一个OCR识别的选项(如上图),这个功能在去年曾经实验性的发布过,不过当时只能通过API来调用,现在则已经开放给所有用户直接使用了,也就是说Google可能已经解决了识别率过低的问题。

不过亲自尝试之后你也许会对结果感到失望,大概有10%的文字识别都是错误的,而且目前识别出的文档无法保持原始文档的格式。

大家可以试试看Google的在线OCR算法达到了怎样的程度。

Via GOS

作者: 分类: 故事/传闻 标签: , ,
1

Google 注册新专利可以自动将平面杂志转换成数字版本

2010年2月27日

默多克估计又颤抖了,据Electricpig报道,Google注册了一项叫做Segmenting Printed Media Pages into Articles的专利,可以将印刷的平面媒体自动转换成数字版本,这个专利涵盖了扫描杂志和其它打印出版物的方法,以及将它们的文字和图片完全转换成数字版本的方法。也就是说,报纸和杂志,通过这个方法就可以将所有文字和图片完全提取出来,并做成可搜索的数字版本。

Google现在正面临为Google Books扫描图书的诉讼,现在又开始打杂志和报纸的主意,估计“默多克们”又有的忙了。

Via SlashGear

作者: 分类: 故事/传闻 标签: , ,
3

Eric Schmidt: “移动最高!”

2010年2月18日

Google CEO Eric Schmidt 在 MWC 2010 上提出了“移动最高”的理念。这个理念的目标是让掌上设备能解决几乎所有事情。将来所有的 Google 产品都会围绕这一目标,因为 Google 认为移动领域发展非常迅速。

另外,Google 还宣布德语将成为其语音系统的第四语言,并且希望基于此系统的 OCR 工具能打动用户。

Google 还希望创造一个应用程序,能影响云计算服务商和网络运营商,与其一同努力来消除胡乱占用带宽的程序。

Via thelatestnews

作者: 分类: Google新闻 标签: , , ,
0

Google Goggles 拍照并实时翻译视频演示

2010年2月18日

Google CEO Eric Schmidt昨天在巴塞罗那的MWC 2010大会上展示了一张Nexus One上运行Google Goggles进行OCR文字识别的图片,这个新版Google Goggles不仅可以利用拍照来做OCR识别,还可利用Google Translate将识别出的文字实时翻译成你看得懂的语言。

今天,Google放出了一段详细的介绍视频,演示了拍照、文字识别、翻译的整个过程。目前这个技术还只支持德语到应用的翻译,而且还在实验中,但将来会出现在新版的Google Goggles for Android应用程序新版里,且会支持Google Translate支持的全部52种语言之间的互译。

继续观看演示视频:

阅读全文...

2

Google 搜索结果中的 PDF 快速查看链接可直接做 OCR 识别文字

2009年10月9日

quick-view-2

Google先是宣布了Google Docs的OCR文字识别功能,之后又宣布了搜索结果里用Google Docs的PDF快速查看功能,也许眼尖的读者已经注意到了,PDF快速查看里,也内置了OCR文字识别功能。那些扫描而成的PDF里的文字,都可以导出为HTML,就得到了识别后的文字。

更棒的是,OCR识别支持多种语言,比如上图的希伯来语。但也不是所有人都对此感到高兴,WebmasterWorld里就有站长非常不满,因为Google偷走了他们的流量。

Via Search Engine Roundtable

作者: 分类: Google新闻 标签: , ,
16

Google Docs 可直接做 OCR 将图片转换为可编辑文本了

2009年9月29日

感谢读者 twitter @kuber 的提醒

google-docs-ocr

Documents List Data API今天增加两个实验性功能:OCR和文档翻译。

OCR可以直接将扫描图片里的文字转换为可编辑的文字,要实现为.png、.jpg或.gif图片做OCR,只需要在上传请求中加入“ocr=true”参数即可:

POST /feeds/default/private/full?ocr=true HTTP/1.1

OCR目前只能识别高分辨率图片,而且还并不完美,不过Google会尽力做的更好。

API里新增的Google Translate翻译功能,可以在你上传的时候就做翻译。只要在上传请求中增加targetLanguage(目标语言)和sourceLanguag(源语言)参数即可:

POST /feeds/default/private/full/?targetLanguage=de&sourceLanguage=en HTTP/1.1

如果你忽略sourceLanguag参数,Google会尝试自动识语言,Google Translate的所有语言都支持。

Via Digital Inspiration and Google Code Data APIs Blog