PDF怎样转换成可搜索文件(pdf扫描版转搜索版的方法)
在日常学习和工作中,经常会接触一些扫描版的PDF文件,例如年代较久的图书扫描版PDF、合同扫描件PDF以及其他通过拍照或扫描方式获取的资料存成PDF格式。
对于这样格式的PDF,其内容实质是图片,因此其中的文字通常是无法选取和搜索的。如果要查找检索相关内容,很不方便。
今天小编就给大家介绍一种方法,将扫描版的PDF转换成可搜索的格式。
1,首先,我们找到一个扫描版的会议通知作为示例。我们发现,其中的文字无法用鼠标选中。
2,另一种判断是否图片的方法,就是把文件视图放大无数倍之后,发现文字的笔划边缘呈现明显的锯齿状,那证明这内容确实是位图格式。
3,然后就用到今天的神器 ABBYY FineReader 啦。安装完这款工具之后,会在文件资源管理器的右键菜单增加以下功能。我们在文件资源管理器里面找到要转换的PDF文件,然后通过右键菜单,选择“转换为可搜索的PDF”。
接下来,就会启动软件。先是识别该文档。如果PDF页数较多的话,这个过程会持续几分钟。
识别完之后,在系统的默认PDF查看应用程序中打开文档。本例中,系统的默认PDF查看应用程序是Acrobat。
4,我们在Acrobat中看到转换后的PDF文件。发现可以用鼠标选择文字了。
我们试试搜索功能,尝试输入一些关键词,可以快速定位到相应的位置。
到此,这个转换过程就算成功啦。下次你再遇到扫描版的书籍或资料时,也可以试试这个方法哟。
关注微信公众号“语言服务行业”,了解更多语言服务行业与翻译技术相关的资讯和洞察~
赞 (0)