注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

神瑛侍者的博客

 
 
 

日志

 
 

【引用】Office 2010的图片文字识别功能(OCR)  

2010-12-31 14:57:14|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
和大家分享这篇日志,我的看法是:

 
原文地址:Office 2010的图片文    原文作者:hubo803

        安装了的Office2010之后,不少人发现“Microsoft Office工具”里找不到OCR的工具。是不是出了什么错呢?其实不是的,只是Office2010的OCR工具隐藏在Onenote里面罢了。所以使用OCR功能得先安装OneNote。

        我们来认识一下这个功能:

屏幕文本识别

首先来试验一下对于电脑屏幕抓图中的文本的识别效果,这在需要复制屏幕中不可选的文字时很有用。

我们使用“插入 - 屏幕剪辑”功能来抓图。

 Office 2010的图片文字识别功能(OCR) - hubo803 - hubo803的博客

抓到的截图如下:

 Office 2010的图片文字识别功能(OCR) - hubo803 - hubo803的博客

 

右键点击图片,通过“复制图片中的文本”功能来识别内容:

 Office 2010的图片文字识别功能(OCR) - hubo803 - hubo803的博客

 

然后粘贴到旁边,所得到的内容如下:

Office 2010的图片文字识别功能(OCR) - hubo803 - hubo803的博客

因为此界面中有很多视觉元素干扰,所以识别结果并不好,但是界面上的文字基本上都被正确识别出来了,如果换成纯文本区域的抓图的话,效果将会很好。

 

扫描文本识别

接下来,针对扫描件的文本识别进行测试,此功能可以减轻我们对纸质内容的转换和录入操作。

这里只需要将扫描图插入文档中即可,为了便于展示,此处中仅使用扫描件的一小部分用做测试:

Office 2010的图片文字识别功能(OCR) - 胡乱的点拨 - hubo803的博客
 
使用“插入 - 图片” 功能
Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

 

同上面一样,通过“复制图片中的文本”功能进行识别,识别后的内容和原图对比如下:

Office 2010的图片文字识别功能(OCR) - 胡乱的点拨 - hubo803的博客

 这里的识别效果非常优秀,很令人叹服。

 

pdf格式文件中图片文字的批量识别

Adobe PDF 文件中内容是图片时,若想转化为Word文档,就要用到这个批量转化的功能了。

首先打开Adobe PDF 文件:

Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

 点击左边的“打印”按钮

Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

 出现下面的界面

Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

 点“确定”后,转至OneNote

Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

 选择一个位置后,确定

Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

  

Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

 

同前,右击图片,选择“复制所有打印输出页中的文本(Y)”

Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

 

待处理完后粘贴到Word中即可。整体对比效果如图:

Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

 

没弄清楚点击放大图片的方法,请博友指教。

实际效果对比如下:

Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

 

Office 2010的图片文字识别功能(OCR) - hubo803 - hu的博客

 

搜索图片中的文本

此功能也是很有用处的,比如文档中收录了一些名片的扫描或拍摄件,希望通过搜索迅速找到某人时。

开启这一功能,需要在设置中取消“禁用识别图片中的文本”选项:

Office 2010的图片文字识别功能(OCR) - hubo803 - hubo803的博客

 

然后,可以通过快捷菜单设定图片中的主体语言:

Office 2010的图片文字识别功能(OCR) - hubo803 - hubo803的博客

 

这样图片就可以被搜索了,试一下:

Office 2010的图片文字识别功能(OCR) - hubo803 - hubo803的博客

 

怎样,赶紧试试吧。

 

  评论这张
 
阅读(223)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017