OCR识别错误怎么办?

  很多网友都喜欢利用一些OCR软件识别软件将纸质材料扫描称电子文档,不过,使用OCR软件识别使用的时候,有时候会出现一些文字识别错误,比如说,把“引”字识别成“弓1”或“弓i”、“弓l”。那么,遇到OCR软件识别软件识别错误的时候,该怎么处理呢?下面,小编就给大家分享一下使用金山wps查找跟替换功能来解决这一问题的方法!



  查找与替换

  哈哈,找到本“砖家”就算找对人了。本“砖家”不客气地告诉他:用查找替换功能来实现,方向是对了,但替换的技巧还没有掌握。

  在小A的方法中,“查找”的对象是“弓*”,会让WPS很为难,因为“*”作为通配符,一般是要放在查找内容的中间,也就是前后都要有内容。否则,因为“*”表示“有任意多个任意字符”,后面又没有特定字符来限制,会导致系统不知你到底要找什么,结果就只查找到了“弓”(任意多也当然包括“0”个呀),当然替换掉的也只是“弓”字,后面紧跟着的“i”、“l”、“1”等字符并不会被一直替换掉。

  那么,应该怎么做呢?除了“*”外,还有一个通配符“?”(半角问号),与“*”不同的是,一个“?”只代表一个字符,如果将查找内容设置为“弓?”,就能查找到“弓1”或“弓i”、“弓l”了。但是,这样还会导致另外一个问题,就是虽然OCR识别错误的“弓1”或“弓i”、“弓l”都被替换成“引”了,但是原本正确的“弓箭”和“惊弓之鸟”中的“弓之”等也被替换成了“引”,这可不行!

  看着小A那惊讶加佩服的眼神,我的虚荣心得到了极大的满足,没什么说的,把我的看家本领拿出一两件来教他吧。

  在“查找内容”中输入“弓[1il]”,在“替换为”中输入“引”,点一下“全部替换”(如图),好了,“弓1”或“弓i”、“弓l”全部替换成“引”了,而“惊弓之鸟”却并没有变成“惊引鸟”!

  在这里,方括号的作用是“只要与其中任意一个字符匹配”,就会被查找到,这样,既找到了所有要找的内容,又有效避免了“错杀一万”的问题。

(0)

相关推荐

  • WPS中活用查找替换修正OCR识别错误

    朋友小A在整理一份材料时,经常会用扫描仪将已有的纸质材料转换成电子文档,但是,用OCR软件识别出来的文字,总把“引”字识别成“弓1”或“弓i”、“弓l”。他使用WPS文字中的替换功能,选使用通配符,用 ...

  • 如何用ABBYY OCR识别技术在电脑上阅读缅甸语

    缅甸联邦共和国,原名缅甸,是东南亚的一个国家,从1962年到2010年,缅甸一直被政变后上台的军政府统治,直至最近5年它才对外界开放,与其他国家建立了贸易与文化联系. 缅甸语由很多方言组成,但所有方言 ...

  • Office自带OCR识别程序转扫描资料为word

    有时候我们手里会有一些通过扫描仪、数码相机或高清摄像头得到的文字资料图片,这时候,我们可以借助Office自带的OCR识别程序将这些图片转成Word文档,这可比单单看图片方便多了。 1.将文档存为TI ...

  • Acrobat2018怎么使用OCR识别扫描版PDF中的文字?

    Acrobat 2017/2018中不像之前的版本在编辑中能找到写有OCR功能的选项,那是因为ocr识别改名为“编辑文本和图像”了,下面我们就来看看详细的教程. 1.打开要识别的PDF,如果该PDF没 ...

  • 有道云笔记app怎么使用OCR识别功能?

    有道云笔记OCR识别功能怎么使用?继语音速记功能上线后,道云笔记又上线了另一实用的功能,文档OCR(即文字识别),OCR功能可以帮助用户轻松识别图片.PDF等扫描文档中的文字,并将其转化成可编辑的文档 ...

  • 如何用OCR识别软件将PDF文档导出为Word

    PDF是现在十分常用的文件类型之一,但是无法直接编辑,接下来小编就给大家介绍一下如何用OCR识别软件将PDF文档导出为Word.具体如下:1. 首先第一步用OCR识别软件打开需要转换格式的PDF文档, ...

  • 手机百度语音搜索识别错误怎么办?

    现在的语音搜索真的解放了大家的双手,是我们的上网搜索更加方便.但是这个语音识别难免会有失手的时候.遇到识别错误的时候怎么办呢?看完下面你就知道了! 操作方法 01 手机上点击手机百度,如下图所示. 0 ...

  • 图片pdf转换成word后无法编辑怎么办—用OCR识别

    很多人都遇到过这种问题:扫描pdf(图片pdf)转换成Word后,还是像图片一样无法编辑.其实用有OCR识别功能的PDF转换器就可以解决这个问题. OCR,即光学字符识别.简单的理解为:图片中的文字已 ...

  • ocr识别表格图片?

    ocr识别表格图片? 操作方法 01 表格图片,通常是office中的Excel档案文件,然后打印出来,被人扫描成电子档的表格,但是扫描后的电子档是无法想Excel一样可以编辑的,图片形式的加密文件, ...