验证码识别相关命令(from www.sysoft.net.cn)

1.开始-运行-cmd,回车进入dos运行环境。

2.转入合并后的图并所在的路径:如 cd E:\propic

3.输入:tesseract.exe  mainpic.tif (这是处理过的图片的名字) mainpic(这个是结果名,可以随机指定,最好直接指定与图片相同)  bach.nochop makebox  回车,直至图片处理完成。

4.完成后,如果没有报错的情况下,可以看到在相 同的目录下生成有一个mainpic.box文件,此时,再次打开jTessBoxEditor.jar,通过文件打开-选择mainpic时,对会出现对于mainpic.tif的初步识别结果了。此时我们要做的工作,就是仔细地进行纠错的过程,以形成我们需要的样本库。

5.在确保以上样本库已保存的前提下,回到命令行,输入tesseract.exe mainpic.tif mainpic nobach box.train   回车确认。

6.命令行输入命令:unicharset_extractor.exe mainpic.box

7.保证上步命令成基础上,在当前操作目录下,手动新建一个文件,font_properties,注意,文件不能有扩展名。在文件中写入mainpic  1 0 0 1 0

8.命令行输入:cntraining.exe mainpic.tr

9.命令行输入:mftraining.exe  -F font_properties -U unicharset mainpic.tr

10.此时,在当前文件夹中会产生几个文件,把unicharset,inttemp,normproto,pfftable这几个文件名加上前缀mainpic.

11.命令行输入:combine_tessdata mainpic. 其生成的mainpic.traineddata就是用来最终识别的样本库了。

12、引入api类库,进行.net 识别:tesseractdotnet_v301_r590.zip包中tesseract.dll文件解压出来,复制到当前项目中,引用—添加引用—选择该文件。

13、程序代码:

private void btncrckt_Click(object sender, EventArgs e)

{

OpenFileDialog ofd = new OpenFileDialog();//建立文件对话框

if (ofd.ShowDialog() == DialogResult.OK)

{

string file = ofd.FileName;//获取文件名

using (Bitmap bit = (Bitmap)Image.FromFile(file))//通过文件名建立图像文件

{

using (Bitmap newbit = ProcessBitMap(bit))//通过预处理图片方式,得到新图像

{

TesseractProcessor tesprocess = new TesseractProcessor();//建立tesseractprocess对象

tesprocess.SetPageSegMode(ePageSegMode.PSM_SINGLE_LINE);//设置页模式

tesprocess.Init(@"E:\propic\last\", "mainpic", (int)eOcrEngineMode.OEM_DEFAULT);//设置识别库所在位置及训练库名称。

string result = tesprocess.Recognize(newbit);//指定图像文件进行识别

MessageBox.Show(result);

}

}

}

else

{

return;

}

}

时间: 2024-08-29 09:45:38

验证码识别相关命令(from www.sysoft.net.cn)的相关文章

验证码识别相关文章

python验证码识别1:灰度处理.二值化.降噪.tesserocr识别:http://www.hi-roy.com/2017/09/19/Python验证码识别/ python验证码识别2:投影法.连通域法分割图片:http://www.hi-roy.com/2017/09/20/Python验证码识别2/ python验证码识别3:滑动验证码:http://www.hi-roy.com/2017/09/21/Python验证码识别3/ python验证码识别4:滴水算法分割图片:https:

验证码图片识别相关博客收集

JAVA使用Tess4J进行ocr识别 Java识别验证码和图像处理 java验证码识别博客:https://blog.csdn.net/problc/article/details/5800093 github地址:https://github.com/isee15/captcha-ocr 原文地址:https://www.cnblogs.com/liran123/p/10327218.html

验证码识别 Tesseract的简单使用和总结

Tesseract是什么 OCR即光学字符识别,是指通过电子设备扫描纸上的打印的字符,然后翻译成计算机文字的过程.也就是说通过输入图片,经过识别引擎,去识别图片上的文字.Tesseract是一种适用于各种操作系统的光学字符识别引擎,最早是hp公司的软件,2005年开源,2006年后由google一直赞助Tesseract开发和维护.2006年,Tesseract被认为是当时最准确的开源OCR引擎之一 . 验证码识别类型 这里讨论一般的验证码识别,即英文.数字.或者英文和数字的混合的验证码,不包括

MBR与GPT分区的区别及磁盘分区相关命令

一.MBR分区结构 主引导记录(Master Boot Record,缩写:MBR),又叫做主引导扇区,是目前比较流行的一种分区结构.磁盘的0磁道0扇区称为MBR,它的大小是512字节,这个区域被分为三个部分: 第一部分为boot loader(主引导程序),占446字节: 第二部分为Partition table(分区表),即DPT,占64字节,每个分区项占用16个字节,这16个字节中存有活动状态标志.文件系统标识.起止柱面号.磁头号.扇区号.隐含扇区数目(4个字节).分区总扇区数目(4个字节

常见验证码的弱点与验证码识别

http://drops.wooyun.org/tips/141 常见验证码的弱点与验证码识别 insight-labs · 2013/06/08 11:36 0x00 简介 验证码作为一种辅助安全手段在Web安全中有着特殊的地位,验证码安全和web应用中的众多漏洞相比似乎微不足道,但是千里之堤毁于蚁穴,有些时候如果能绕过验证码,则可以把手动变为自动,对于Web安全检测有很大的帮助. 全自动区分计算机和人类的图灵测试(英语:Completely Automated Public Turing t

基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)

基于python语言的tensorflow的‘端到端’的字符型验证码识别 1   Abstract 验证码(CAPTCHA)的诞生本身是为了自动区分 自然人 和 机器人 的一套公开方法, 但是近几年的人工智能技术的发展,传统的字符验证已经形同虚设. 所以,大家一方面研究和学习此代码时,另外一方面也要警惕自己的互联网系统的web安全问题. Keywords: 人工智能,Python,字符验证码,CAPTCHA,识别,tensorflow,CNN,深度学习 2   Introduction 全自动区

验证码识别

  本文所使用的验证码识别的方法非常暴力,高手可忽略.对于在客户端实现的“伪验证码”或使用静态图片的验证码,本文不作讨论.对于验证码的识别,一直以为,只要足够的样本,就可以分析出验证码的特征,从而进行分门别类,再通过和样本做比较,就可以得出正确验证码.这里简单而暴力的验证一下这个一直想验证而没有行动过的想法.做实验的网站是某体检机构,因为它生成的验证码很有规律(不确定是不是静态文件,但就可以当成是算法随机生成的),每个字符的位置相对固定,虽然每个字符的颜色和背景都不一样,但是背景颜色很相近,没有

使用Tesseract-OCR 做验证码识别浅析

使用工具jTessBoxEditor-0.7(这个是在java平台下开发的,所以 它只支持java平台 ,在使用前应该先配置好java环境) tesseract 程序集(因为该程序集是在.net 2.0平台下 开发的,所以 只能支持到2.0 在使用时请注意(也可以自己去网上找别人用更高的版本编译好的)) tesseract-ocr-setup-3.01-1  使用开发语言.net 辅助工具 Visual Studio 至少能支持.net 2.0即可 首先,我们要找到自己需要做验证识别的验证码图片

.NET 开发的-服务于企业,个人用户群的打杂平台-可定制数据采集,刷单抢购,验证码识别各类插件

今天,想给大家介绍下自己做的一个小的插件管理平台,大白鲨智软平台,这不算什么高科技的东西,暂时还是个封闭的插件定制平台 没有提供开发相关的API接口,和开发工具,不过后面会加上去,以我多年的脚本引擎使用和开发经验,撸这个功能上去不会太久^_^ 先上张截图 上班几年专注数据采集平台研发也有日子了,现在成了SOHO,一直想做一个生态圈的数据采集验证码识别的小平台,目前平台看起来是封闭状态的,但是设计上是可以扩展到提供 脚本引擎+API扩展方式来让人轻松愉悦的进行数据采集的小插件开发中,当然,这并不是