tesseract-ocr windows正式版(开源图像识别引擎) windows正式版(开源图像识别引擎) 3.0.5
tesseract-ocr windows是一款开源免费的图像识别ocr引擎;软件功能强大可以读取各种格式的图像并将它们转换成超过60种语言的文本;本站提供tesseract ocr下载和安装教程,需要的朋友可以到本站下载。
tesseract ocr简介:
最早由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。我们可以使用它制作拥有验证码识别、身份证识别、图像转文字等功能的软件。
什么是OCR识别?
光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。OCR技术非常专业,一般多是印刷、打印行业的从业人员使用,可以快速的将纸质资料转换为电子资料。目前国内水平较高的中文ocr有清华文通、汉王、尚书等,其产品各有千秋,价格不菲。国外OCR发展较早,像一些大公司,如IBM、微软、HP等,即使没有推出单独的OCR产品,但是他们的研发团队早已掌握核心技术,将OCR功能植入了自身的软件系统。对于一般的程序员来说,一般用不到那么高级的,主要在开发中能够集成基本的OCR功能就可以了。
tesseract-ocr安装与使用教程:
1.打开下载的压缩包,找到“tesseract-ocr-setup-3.02.02.exe”,双击运行,进入下图所示安装界面,点击“next”。
2.勾选“I accept....”,然后点击“next”。
3.选择可以使用该软件的用户,这里我们选择第一个,任何使用该电脑的人都可以使用它,然后点击"next"。
4.选择安装路径,之后点击“next”。
5.选择需要安装的组件,默认是没有勾选语言组件的,我们可以勾选自己想要识别的语言。勾选简体中文的话,那么就可以识别有简体中文的图像了,其他语言同理。
6.正在安装中,请耐心等待。
7.安装完成之后我们打开cmd,输入“tesseract”,出现下图所示表示安装成功。
8.这里小编从网上下了一个验证码的图片作为演示,我们可以看到这张图片内的数字为7364,小编给该图片命名为“test.png”。
9.接下来,进入图片所在路径,输入“tesseract test.png test”,后面的test表示将识别出来的内容放在test文本文件中。不出意外我们的图片所在的文件夹下将会生成一个test.txt文本文件。
10.果然生成了test.txt文本文件,打开可以看到内容为7364,和我们下载图片的内容一致,识别成功!有关各种命令行选项的更多信息,请使用tesseract --help或man tesseract。
本类排行
-
几何画板图形设计最新中文增强版
更新于2016-05-29
点击下载
几何画板英文名字The Geometer's Sketchpad®是一个通用的数学、物理教学环境,提供丰富而方便的创造功能使用户可以随心所欲地编写出自己需要的教学课件。
-
adobe incopy cc 2019中文免费版
更新于2021-05-02
点击下载
incopy cc 2019免费版是adobe公司全新发布的一款功能强大的写作编辑软件,为广大用提供一站式服务;本次提供incopy cc 2019下载全新版本功能和界面有所改进,性能更佳稳定、可以大幅度提升工作效率。
-
google nik collection中文免费版
更新于2021-05-02
点击下载
google nik collection是一套专注于图像后期处理、调色的PS滤镜套装,google nik collection功能强大全面,结构明晰,操作简单而便捷,特点明显。使用起来十分高效,更加人性化,非常实用。
-
pci geomatica 2017免费版
更新于2021-05-02
点击下载
pci geomatica 2017免费版是由PCI公司开发,主要用于地理绘制方面的图像处理;本站提供pci geomatica 2017下载主要功能就是为图像处理工作者提供最好的工具,帮助他们将空间数据转为信息。
-
fme desktop/server 2017免费版
更新于2021-05-02
点击下载
fme desktop server 2017免费版是Safesoftware公司全新推出的版本,全新版本快速添加、转换器参数设置界面的变化等很多新的功能;本站提供fme2017免费版下载一共包含desktop和server两个版本,需要的朋友可以到本站下载。