图片文字OCR识别-tesseract-ocr4.00.00安装使用

图片文字的OCR识别有一款开源原件tesseract-ocr,最初是在linux上,当然现在也有windows版本,现在发展到4.0版本。

操作方法

  • 01

    下载tesseract-ocr软件,软件下载网址https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows 选择4.0.0-alpha for Windows下面Windows Installer made with MinGW-w64 from UB Mannheim,点击UB Mannheim进入另一网页。

  • 02

    进入得网址为https://github.com/UB-Mannheim/tesseract/wiki 点击tesseract-ocr-setup-4.0.0-alpha.20170804.exe,下载4.0版本的软件 下载链接为http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.0.0-alpha.20170804.exe 下载链接会根据软件版本更新,下载地址会不断更新。大家可以到网页自行查找下载链接。

  • 03

    下载好的软件安装包如图,双击安装软件。安装过程按照下面的图片指示进行。 注意选择安装语言包,包含英文(默认安装)、中文、数学公式等,可以根据需要自己下载。

  • 04

    安装完后打开软件坐在目录,这里我选择的是默认目录C:\Program Files (x86)\Tesseract-OCR

  • 05

    tesseract-ocr没有窗口界面,只能通过命令调用。调用需要cmd或powershell, cmd打开可以通过,开始->Windows系统->命令提示符或者按快捷键win+r输入cmd后回车调用。

  • 06

    powershell打开可以通过:开始->Windows Powershell下面任选一个或者在目录中点击左上文件->打开windowspowershell->打开windowspoweshell(推荐这样使用,在当前图片所在目录调出powershell)

  • 07

    在软件所在目录,调出的powershell中输入tesseract如图,调出了软件的帮助说明,详细的命令参数说明。现在只能在软件所在的目录中才能够使用该软件,为了能将该软件作为系统的cmd一样,在任意目录中调用,下面将调整系统环境变量。

  • 08

    文件资源管理器中选中此电脑->右键属性打开界面->点击高级系统设置->在打开的系统属性界面点击环境变量->在环境变量界面选择系统变量中选中path,然后点下面的编辑,打开编辑环境变量界面新建一个C:\Program Files (x86)\Tesseract-OCR的值,然后确定

  • 09

    在系统变量下面点击新建,按照如图建一个变量如图 变量名TESSDATA_PREFIX 变量值C:\Program Files (x86)\Tesseract-OCR\tessdata ,然后点击确定,之后界面依次点击确定,完成设置。变量建立完成。

  • 10

    经过上面的调整tesseract命令可以在任意目录调用了,下面是tessract应用实例 识别中文图片 1.在一个盘符的根目录放置了1.jpg图片,然后打开这个目录

  • 11

    2.在图片坐在文件夹打开powersehll, 在里面输入 tesseract 1.jpg 1.txt -l chi_sim+equ+eng 然后回车 1.jpg是当前目录中的1.jpg图片 1.txt是指定结果输出到文本文件 -l是指定使用的包 chi_sim是中文识别包,equ是数学公式包,eng是英文包

  • 12

    回车后,稍等待后结果如图,在图片坐在目录可以看到1.txt文件,打开如图,对于文字中的空格可以用替换工具全部替换,结果如图

  • 13

    tesseract-ocr是一款免费软件,做的已经很棒了,这里只是介绍入门操作,详细请看帮助文件,或 https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc

(0)

相关推荐

  • 微信文字扫描在哪怎么提取图片文字如何识别表格

    如果你想把书上或是图片上的文字提取出来,又不想安装相应的OCR识别软件的话,今天为大家讲解一下微信文字扫描在哪怎么提取图片文字如何识别表格. 操作方法 01 进入微信,在"发现"页 ...

  • 图片转文字OCR识别工具

    必须吹爆这款良心又好用的网页版图片转文字工具,识别准确性极好,各位小伙伴有需要的话可以收藏一下.这款图片识别工具完全免费,而且没有次数限制,不需要登录,0广告,纯洁测试了一下, 真的很爽.pearoc ...

  • 图片文字的识别需借助ocr技术

    衡量一位办公室工作人员办事效率的基准书艘有两条:一是准确.二是迅速."准确"是对其工作质量而言,即要求准确地提供实际数据及大量的有关资料(包括起草的各类文件),"迅速&q ...

  • 如何在线进行图片文字识别

    图片文字识别也就是ocr文字识别,在扫描文档的时候会生成图片文件,在需要使用到图片中的内容时会非常麻烦,如果对照图片重新录入也是需要很多时间的,那么怎样可以快速的图片文字进行识别呢,下面就来教你们怎样 ...

  • ocr识别表格图片?

    ocr识别表格图片? 操作方法 01 表格图片,通常是office中的Excel档案文件,然后打印出来,被人扫描成电子档的表格,但是扫描后的电子档是无法想Excel一样可以编辑的,图片形式的加密文件, ...

  • 互盾ocr文字识别软件将图片文字转换成可编辑word文档

    互盾ocr文字识别软件将图片文字转换成可编辑word文档 一.下载并且安装好互盾ocr文字识别软件,双击打开如图. 二.直接进入到操作界面,点击"读取"按钮,在弹出的对话框中,选择 ...

  • 图片文字识别软件哪个好?六款好用的OCR文字识别软件推荐

    有哪些OCR文字识别软件可以识别图片上的文字?以往如果需要录入一份纸质的信息或图片上的信息,只能对着电脑枯燥的敲键盘,而有了OCR文字识别软件之后,图片上的文字就可以很快识别出来.当然这仅对于字体清晰 ...

  • 如何通过OCR文字识别软件识别图片文字

    OCR文字识别软件提供了多种精准文字识别服务,有些用户想知道如何通过该软件识别图片文字,接下来小编就给大家介绍一下具体的操作步骤.具体操作步骤:1. 首先第一步打开电脑浏览器,根据下图所示,先在搜索框 ...

  • 天若OCR怎么识别图片文字 方法教程

    天若OCR怎么识别图片文字?其实很简单,下面我来带给大家天若OCR怎么识别图片文字的方法教程. 操作方法 01 其实识别文字的方法非常简单,首先我们打开自己想要识别文字的图片,或者我们直接截取相应的图 ...