PHP之验证码识别

首先推荐几篇有关验证码识别的文章,觉得不错

php实现验证码的识别(初级篇)

关于bp神经网格识别验证码

一、思路

碰见一个验证码,如果我们想要识别它,我们需要的是做什么呢?
我们先观察几个验证码............


我们用人眼去观察,会很显然的认出验证码所包含的字符,那么人眼的“识别机理”是什么呢?

大概是验证码图片字符的背景的颜色区别吧,试想,如果字符和背景没有颜色区别,我们能够判断验证码吗,很显然不能。

所以,我们就可以从人出发。

先从图片的颜色着手,即图片的RGB信息。

RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。

定义函数取得RGB信息

 1 //代码本来是一个类,现在拆开来写的,有可能有不严谨的地方,大家可以看得懂就好了
 2
 3 /*
 4  *取得图片路径和图片尺寸
 5  */
 6 $this->ImagePath = $Image;
 7 $this->ImageSize = getimagesize($Image);
 8
 9 /*
10  *获取图像标识符,保存到ImageInfo,只能处理bmp,png,jpg图片
11  *ImageCreateFromBmp是我自己定义的函数,最后会给出
12  */
13 function getInfo(){
14     $filetype = substr($this->ImagePath,-3);
15     if($filetype == ‘bmp‘){
16         $this->ImageInfo = $this->ImageCreateFromBmp($this->ImagePath);
17     }elseif($filetype == ‘jpg‘){
18         $this->ImageInfo = imagecreatefromjpeg($this->ImagePath);
19     }elseif($filetype == ‘png‘){
20         $this->ImageInfo = imagecreatefrompng($this->ImagePath);
21     }
22 }
23
24 /*获取图片RGB信息*/
25 function getRgb(){
26     $rgbArray = array();
27     $res = $this->ImageInfo;
28     $size = $this->ImageSize;
29     $wid = $size[‘0‘];
30     $hid = $size[‘1‘];
31     for($i=0; $i < $hid; ++$i){
32         for($j=0; $j < $wid; ++$j){
33             $rgb = imagecolorat($res,$j,$i);
34             $rgbArray[$i][$j] = imagecolorsforindex($res, $rgb);
35         }
36     }
37     return $rgbArray;
38 }

二、二值化

因为人眼可以分别出验证码,所以验证码的RGB信息就会有一定的特点,这时候需要我们观察一下,直接打印RGB数组是不好观察的…………,好多数啊

php实现验证码的识别(初级篇)中,作者的判断依据是

无论验证数字颜色如何变化,该数字的 RGB 值总有一个值小于 125

我们先获取他的灰度,再判断

 1 /*
 2  *获取灰度信息
 3  */
 4 function getGray(){
 5     $grayArray = array();
 6     $size = $this->ImageSize;
 7     $rgbarray = $this->getRgb();
 8     $wid = $size[‘0‘];
 9     $hid = $size[‘1‘];
10     for($i=0; $i < $hid; ++$i){
11         for($j=0; $j < $wid; ++$j){
12             $grayArray[$i][$j] = (299*$rgbarray[$i][$j][‘red‘]+587*$rgbarray[$i][$j][‘green‘]+144*$rgbarray[$i][$j][‘blue‘])/1000;
13         }
14     }
15     return $grayArray;
16 }

然后我们根据灰度信息,打印图片,注意不是打印灰度信息

 1 /*根据灰度信息打印图片*/
 2 function printByGray(){
 3     $size = $this->ImageSize;
 4     $grayArray = $this->getGray();
 5     $wid = $size[‘0‘];
 6     $hid = $size[‘1‘];
 7     for($k=0;$k<25;$k++){
 8         echo $k."\n";
 9         for($i=0; $i < $hid; ++$i){
10             for($j=0; $j < $wid; ++$j){
11                 if($grayArray[$i][$j] < $k*10){
12                     echo ‘■‘;
13                 }else{
14                     echo ‘□‘;
15                 }
16             }
17             echo "|\n";
18         }
19         echo "---------------------------------------------------------------------------------------------------------------\n";
20     }
21
22 }

注意到,从$grayArray[$i][$j] < 80就会有显然的输出,我们观察选择了一个恰当的阈值,得到一个0101的数组,我们已经将我们的图片转化为了字符(1)和背景(0),即二值化。

 1 /*
 2  *根据自定义的规则,获取二值化二维数组
 3  *@return  图片高*宽的二值数组(0,1)
 4  */
 5 function getErzhi(){
 6     $erzhiArray = array();
 7     $size = $this->ImageSize;
 8     $grayArray = $this->getGray();
 9     $wid = $size[‘0‘];
10     $hid = $size[‘1‘];
11     for($i=0; $i < $hid; ++$i){
12         for($j=0; $j <$wid; ++$j){
13             if( $grayArray[$i][$j]    < 90 ){
14                 $erzhiArray[$i][$j]=1;
15             }else{
16                 $erzhiArray[$i][$j]=0;
17             }
18         }
19     }
20     return $erzhiArray;
21 }

三、去除噪点

但是我们发现有一些小点影响了我们的判断

我们可以注意到这些事干扰噪点,但是如果我们是机器的话,我们如何判断这些点是否是字符呢?

所以接下来,我们需要将这些字符去除。

我们判断,如果一个黑点的上下左右的八个点全部是白,我们就认为它是噪点,并予以清除,赋为白

 1 /*
 2  *二值化图片降噪
 3  *@param $erzhiArray二值化数组
 4  */
 5 function reduceZao($erzhiArray){
 6     $data = $erzhiArray;
 7     $gao = count($erzhiArray);
 8     $chang = count($erzhiArray[‘0‘]);
 9
10     $jiangzaoErzhiArray = array();
11
12     for($i=0;$i<$gao;$i++){
13         for($j=0;$j<$chang;$j++){
14             $num = 0;
15             if($data[$i][$j] == 1)
16             {
17                 // 上
18                 if(isset($data[$i-1][$j])){
19                     $num = $num + $data[$i-1][$j];
20                 }
21                 // 下
22                 if(isset($data[$i+1][$j])){
23                     $num = $num + $data[$i+1][$j];
24                 }
25                 // 左
26                 if(isset($data[$i][$j-1])){
27                     $num = $num + $data[$i][$j-1];
28                 }
29                 // 右
30                 if(isset($data[$i][$j+1])){
31                     $num = $num + $data[$i][$j+1];
32                 }
33                 // 上左
34                 if(isset($data[$i-1][$j-1])){
35                     $num = $num + $data[$i-1][$j-1];
36                 }
37                 // 上右
38                 if(isset($data[$i-1][$j+1])){
39                     $num = $num + $data[$i-1][$j+1];
40                 }
41                 // 下左
42                 if(isset($data[$i+1][$j-1])){
43                     $num = $num + $data[$i+1][$j-1];
44                 }
45                 // 下右
46                 if(isset($data[$i+1][$j+1])){
47                     $num = $num + $data[$i+1][$j+1];
48                 }
49             }
50
51                 if($num < 1){
52                     $jiangzaoErzhiArray[$i][$j] = 0;
53                 }else{
54                     $jiangzaoErzhiArray[$i][$j] = 1;
55                 }
56         }
57     }
58     return $jiangzaoErzhiArray;
59
60 }

我们发现噪点消失了。

四、分割

这个时候,我们就需要对单一数字字母进行操作了,我们先将数字提取出来。

有些验证码字符相连,特别难!!!

我们分别从左到右,从右到左,从上到下,从下到上,进行扫描,去除白点,找到边框。

 1 /*
 2  *归一化处理,针对一个个的数字,即去除字符周围的白点
 3  *@param $singleArray 二值化数组
 4  */
 5 function getJinsuo($singleArray){
 6     $dianCount = 0;
 7     $rearr = array();
 8
 9     $gao = count($singleArray);
10     $kuan = count($singleArray[‘0‘]);
11
12     $dianCount = 0;
13     $shangKuang = 0;
14     $xiaKuang = 0;
15     $zuoKuang = 0;
16     $youKuang = 0;
17     //从上到下扫描
18     for($i=0; $i < $gao; ++$i){
19         for($j=0; $j < $kuan; ++$j){
20             if( $singleArray[$i][$j] == 1){
21                 $dianCount++;
22             }
23         }
24         if($dianCount>1){
25             $shangKuang = $i;
26             $dianCount = 0;
27             break;
28         }
29     }
30     //从下到上扫描
31     for($i=$gao-1; $i > -1; $i--){
32         for($j=0; $j < $kuan; ++$j){
33             if( $singleArray[$i][$j] == 1){
34                 $dianCount++;
35             }
36         }
37         if($dianCount>1){
38             $xiaKuang = $i;
39             $dianCount = 0;
40             break;
41         }
42     }
43     //从左到右扫描
44     for($i=0; $i < $kuan; ++$i){
45         for($j=0; $j < $gao; ++$j){
46             if( $singleArray[$j][$i] == 1){
47                 $dianCount++;
48             }
49         }
50         if($dianCount>1){
51             $zuoKuang = $i;
52             $dianCount = 0;
53             break;
54         }
55     }
56     //从右到左扫描
57     for($i=$kuan-1; $i > -1; --$i){
58         for($j=0; $j < $gao; ++$j){
59             if( $singleArray[$j][$i] == 1){
60                 $dianCount++;
61             }
62         }
63         if($dianCount>1){
64             $youKuang = $i;
65             $dianCount = 0;
66             break;
67         }
68     }
69     for($i=0;$i<$xiaKuang-$shangKuang+1;$i++){
70         for($j=0;$j<$youKuang-$zuoKuang+1;$j++){
71             $rearr[$i][$j] = $singleArray[$shangKuang+$i][$zuoKuang+$j];
72         }
73     }
74     return $rearr;
75 }

然后从左到右扫描,找到字符的分割

返回三维数组,每一维就是一个字符。

 1 /*
 2  *切割成三维数组,每个小数字在一个数组里面
 3  *只适用四个数字一起的数组
 4  *@param 经过归一化处理的二值化数组
 5  */
 6 function cutSmall($erzhiArray){
 7     $doubleArray = array();
 8     $jieZouyou = array();
 9
10     $gao = count($erzhiArray);
11     $kuan = count($erzhiArray[‘0‘]);
12
13     $jie = 0;
14     $s = 0;
15     $jieZouyou[$s] = 0;
16     $s++;
17     //从左到右扫描
18
19     for($i=0; $i < $kuan;){
20         for($j=0; $j < $gao; ++$j){
21             $jie = $jie + $erzhiArray[$j][$i];
22         }
23         //如果有一列全部是白,设置$jieZouyou,并且跳过中间空白部分
24         if($jie == 0){
25             $jieZouyou[$s] = $i+1;
26             do{
27                 $n = ++$i;
28                 $qian = 0;
29                 $hou = 0;
30                 for($m=0; $m < $gao; ++$m){
31                     $qian = $qian + $erzhiArray[$m][$n];
32                     $hou = $hou + $erzhiArray[$m][$n+1];
33                 }
34                 $jieZouyou[$s+1] = $n+1;
35             }
36             //当有两列同时全部为白,说明有间隙,循环,知道间隙没有了
37             while($qian == 0 && $hou == 0);
38             $s+=2;
39             $i++;
40         }else{
41             $i++;
42         }
43
44         $jie = 0;
45     }
46     $jieZouyou[] = $kuan;
47     //极端节点数量,(应该是字符个数)*2
48     $jieZouyouCount = count($jieZouyou);
49
50     for($k=0;$k<$jieZouyouCount/2;$k++){
51         for($i=0; $i < $gao; $i++){
52             for($j=0; $j < $jieZouyou[$k*2+1]-$jieZouyou[$k*2]-1; ++$j){
53                 $doubleArray[$k][$i][$j] = $erzhiArray[$i][$j+$jieZouyou[$k*2]];
54             }
55         }
56
57     }
58     return $doubleArray;
59 }

五、倾斜调整

我们发现第三个9有一点倾斜,

我们需要将倾斜的图片“正”过来

人怎么处理的呢,先眼睛观察“倾斜了多少度”,然后把图片扭过来多少度,并且观察->负反馈->大脑传递扭转角度时刻在发生,最后图片就“正”过来了。

人是怎么观察“倾斜”的,以上面的“2”做例子,可能是右上方(左下方)的黑色比左上方(右下方)的多?

我们建立X轴正向向下,Y轴向右的直角坐标系

我们计算每一层的黑点的分布中点坐标,得到一系列离散点,计算这些点所在的直线(线性回归方程的计算,),公式y = b*x+a,

竟然有用到这个公式的一天!!!

大概就是一条倾斜的直线了,通过直线计算直线倾斜角度,然后转这么多的角度,图片应该就“正”了吧。

其中a,b的计算如下

 1 /*
 2  *定义求线性回归A和B的函数
 3  *@param $zuobiaoArray坐标的三维数组
 4  */
 5 function getHuigui($zuobiaoArray){
 6     $y8 = 0;
 7     $x8 = 0;
 8     $x2 = 0;
 9     $xy = 0;
10     $geshu = count($zuobiaoArray);
11     for($i=0;$i<$geshu;$i++){
12         $y8 = $y8+$zuobiaoArray[$i][‘y‘];
13         $x8 = $x8+$zuobiaoArray[$i][‘x‘];
14         $xy = $xy+$zuobiaoArray[$i][‘y‘]*$zuobiaoArray[$i][‘x‘];
15         $x2 = $x2 + $zuobiaoArray[$i][‘x‘]*$zuobiaoArray[$i][‘x‘];;
16     }
17     $y8 = $y8/$geshu;
18     $x8 = $x8/$geshu;
19
20     $b = ($xy-$geshu*$y8*$x8)/($x2-$geshu*$x8*$x8);
21     $a = $y8-$b*$x8;
22     $re[‘a‘] = $a;
23     $re[‘b‘] = $b;
24     return $re;
25     //y = b * x + a
26 }

怎么转角?

1、可以直接对图片进行操作,但是发现有比较大的失真,就没有继续了。
2、或者,对黑点白点的坐标进行操作……

这就是三角函数了,好长时间不碰三角函数,都差点忘记了。

定义函数

 1 /*
 2  *定义转化坐标的函数
 3  *@param $x x坐标即$i
 4  *@param $y y坐标,即j
 5  *@param $b 线性回归方程的b参数
 6  */
 7 function getNewZuobiao($x,$y,$b){
 8     if($x == 0){
 9         if($y>0){
10             $xianJiao = M_PI/2;
11         }elseif($y<0){
12             $xianJiao = -M_PI/2;
13         }else{
14             $p[‘x‘] = 0;
15             $p[‘y‘] = 0;
16             return $p;
17         }
18     }else{
19         $xianJiao = atan($y/$x);
20     }
21     $jiao =$xianJiao-atan($b);
22     $chang = sqrt($x*$x+$y*$y);
23     $p[‘x‘] = $chang*cos($jiao);
24     $p[‘y‘] = $chang*sin($jiao);
25     return $p;
26 }

转角吧

 1 /*
 2  *对【单个】数字的二值化二维数组进行倾斜调整
 3  *@param  $singleArray  高*宽的二值数组(0,1)
 4  */
 5 function singleSlopeAdjust($singleErzhiArray){
 6     $slopeArray = array();
 7     $gao = count($singleErzhiArray);
 8     $chang = count($singleErzhiArray[‘0‘]);
 9
10     //初始化$slopeArray
11     for($i=0;$i<$gao*4;$i++){
12         for($j=0;$j<$chang*4;$j++){
13             $slopeArray[$i][$j] = 0;
14         }
15     }
16
17     //初始化中心坐标(是数组的下标)
18     $centerXfoalt = ($gao-1)/2;
19     $centerYfoalt = ($chang-1)/2;
20     $centerX = ceil($centerXfoalt);
21     $centerY = ceil($centerYfoalt);
22
23     //初始化图片倾斜诶角度
24     /*斜率的计算!!!!!,回归方程*/
25     //从上到下扫描,计算中点,求得一串坐标($i,$ava)
26     for($i=0;$i<$gao;$i++){
27         $Num = 0;
28         $Amount = 0;
29         for($j=0;$j<$chang;$j++){
30             if($singleErzhiArray[$i][$j] == 1){
31                 $Num = $Num+$j;
32                 $Amount++;
33             }
34         }
35         if($Amount == 0){
36             $Ava[$i] = $chang/2;
37         }else{
38             $Ava[$i] = $Num/$Amount;
39         }
40     }
41
42
43     //计算线性回归方程的b与a
44     $zuo = array();
45     for($j=0;$j<count($Ava);$j++){
46         $zuo[$j][‘x‘] = $j;
47         $zuo[$j][‘y‘] = $Ava[$j];
48     }
49     $res = $this->getHuigui($zuo);
50     $zuoB = $res[‘b‘];
51
52
53     for($i=0;$i<$gao;$i++){
54         for($j=0;$j<$chang;$j++){
55             if($singleErzhiArray[$i][$j] == 1){
56                 $splodeZuobiao = $this->getNewZuobiao($i,$j,$zuoB);
57                 $splodeX = $splodeZuobiao[‘x‘];
58                 $splodeY = $splodeZuobiao[‘y‘];
59                 $slopeArray[$splodeX+$gao][$splodeY+$chang] = 1;
60             }
61         }
62     }
63
64     //将预处理的数组空白清理
65     $slopeArray = $this->getJinsuo($slopeArray);
66     return $slopeArray;
67 }

看到正了一些

六、统一大小

上文中因为各种操作,每个字符大小不一,我们需要统一大小

七、特征值的建立

有很多方法

1、逐像素特征提取法
这是一种最简单的特征提取方法。它可以对图像进行逐行逐列的扫描,当遇到黑色像素时取其特征值为1,遇到白色像素时取其特征值为0,这样当扫描结束后就获得一个维数与图像中的像素点的个数相同的特征向量矩阵。

这种方法提取的信息量最大,但是它的缺点也很明显,就是适应性不强。

2、骨架特征提取法

两幅图像由于它们的线条的粗细不同,使得两幅图像差别很大,但是将它们的线条进行细化后,统一到相同的宽度,如一个像素宽时,这是两幅图像的差距就不那么明显。利用图形的骨架作为特征来进行数码识别,就使得识别有了一定的适应性。一般使用细化的方法来提取骨架,细化的算法有很多,如Hilditch算法、Rosenfeld算法等。对经过细化的图像利用EveryPixel函数进行处理就可以得到细化后图像的特征向量矩阵。骨架特征提取的方法对于线条粗细不同的数码有一定的适应性,但是图像一旦出现偏移就难以识别。

3、微结构法

微结构法将图像分为几个小块,统计每个小块的像素分布。本文提取出汉字的39个特征,存储在数组f[0]~f[38]中。具体算法可分为四步:

步骤一:把字符平均分成9份,如图4.1所示,给每一份编号如图4.2,统计每一份内黑色像素的个数,存储在数字tz[0]~tz[9]中,统计在行方向和列方向上每一份内的黑色像素个数和与之相邻的一份内黑色像素个数的比值作为一个特征,例如:行方向上提取特征f[0]=tz[1]/
tz[0],f[1]=tz[2]/ tz[1],f[2]=tz[0]/ tz[2],…,f[8]=tz[6]/ tz[8];列方向上f[9]=tz[3]/
tz[0],f[10]=tz[6]/ tz[3],f[11]=tz[0]/ tz[6],…,f[17]=tz[2]/ tz[8],共18个特征。

步骤二:把字符横向分成三份,如图4.3所示,统计每一份内的黑色像素个数,每一份内的黑色像素个数与前一份内黑色像素个数的比值作为一个特征,f[18]=tz[10]/
tz[9],f[19]=tz[11]/ tz[10],f[20]=tz[9]/
tz[11];把字符纵向分成三份,如图4.4所示,统计每一份内的黑色像素个数,每一份内的黑色像素个数与前一份内黑色像素个数的比值作为一个特征,f[21]=tz[13]/
tz[12],f[22]=tz[14]/ tz[13],f[23]=tz[12]/ tz[14];共六个特征。

步骤三:如图4.5,在竖直方向上找出三列,统计在该列中跳变点的个数,即相邻点像素值从0变到255的次数,共三个特征,记为f[24],f[25],f[26];在水平方向上找出三行列,统计在该行中跳变点的个数,即相邻点象素值从0变到255的次数,共三个特征,记为f[27],f[28],f[29]。

图4.5

步骤四:把每一份内黑色象素的个数tz[0]~tz[9],作为9个特征,记为:f[30]~f[38]。

这样得到汉字的共39个特征,根据这些特征就可以区分每个车牌汉字,进行识别。

我们使用最简单的逐像素特征提取法。

多多增加数据库,识别率会增加的

八、识别验证码

对于一个新的验证码,进行上文操作,然后对比数据库就可以了

 1 /*
 2  *进行匹配
 3  *@param  $Image  图片路径
 4  */
 5 public function run($Image){
 6     $data = array(‘‘,‘‘,‘‘,‘‘);
 7     $result="";
 8     $bilu = ‘‘;
 9     $maxarr = ‘‘;
10
11     //提取特征
12     $this->prepare($Image);
13     $yuanshi = $this->getErzhi();
14     $yijijiangzao = $this->reduceZao($yuanshi);
15     $small = $this->cutSmall($yijijiangzao);
16     for($k=0;$k<4;$k++){
17         $tianchong = $this->tianChong($small[$k]);
18         $tiaozhenjiaodu = $this->singleSlopeAdjust($tianchong);
19         $tongyidaxiao = $this->tongyiDaxiao($tiaozhenjiaodu);
20         for($i=0;$i<20;$i++){
21             for($j=0;$j<20;$j++){
22                 $data[$k] .= $tongyidaxiao[$i][$j];
23             }
24         }
25     }
26
27     // 进行关键字匹配
28     foreach($data as $numKey => $numString)
29     {
30
31         $max = 0;
32         $num = 0;
33         foreach($this->Keys as $value => $key)
34         {
35             similar_text($value, $numString,$percent);
36             if($percent > $max)
37             {
38                 $max = $percent;
39                 $num = $key;
40                 $zim = $value;
41             }
42             if($max>95){
43                 break;
44             }
45         }
46         $result .=$num;
47         $maxarr[] = $max;
48     }
49     // 查找最佳匹配数字
50     $re = $maxarr;
51     $re[] = $result;
52     return $re;
53     //return $result.‘|max|一:‘.$maxarr[‘0‘].‘|二:‘.$maxarr[‘1‘].‘|三:‘.$maxarr[‘2‘].‘|四:‘.$maxarr[‘3‘];
54 }

试试:

PHP之验证码识别

时间: 2024-11-08 14:47:08

PHP之验证码识别的相关文章

车牌识别及验证码识别的一般思路

http://www.pin5i.com/showtopic-22246.html 描述一下思路及算法. 全文分两部分,第一部分讲车牌识别及普通验证码这一类识别的普通方法,第二部分讲对类似QQ验证码,Gmail验证码这一类变态验证码的识别方法和思路. 一.车牌/验证码识别的普通方法 车牌.验证码识别的普通方法为: (1)      将图片灰度化与二值化 (2)      去噪,然后切割成一个一个的字符 (3)      提取每一个字符的特征,生成特征矢量或特征矩阵 (4)      分类与学习.

集美大学教务处验证码识别(二)

[原创,转载请标明作者:森狗] 本文对第二种验证码,即管理员登入后台地址的验证码进行识别. 1.采集一些验证码,0~9都要有 2.观察验证码,用画图工具即可. 观察可发现,噪点即阴影,此处的阴影就是颜色比主体验证码略淡,以此为突破口. 3.去除噪点 color.getGreen() 获取绿色的值int,绿色值(0~255 从深到浅),大于200的就是浅色的噪点 public static int isWhite(int colorInt) { Color color = new Color(co

常见验证码的弱点与验证码识别

http://drops.wooyun.org/tips/141 常见验证码的弱点与验证码识别 insight-labs · 2013/06/08 11:36 0x00 简介 验证码作为一种辅助安全手段在Web安全中有着特殊的地位,验证码安全和web应用中的众多漏洞相比似乎微不足道,但是千里之堤毁于蚁穴,有些时候如果能绕过验证码,则可以把手动变为自动,对于Web安全检测有很大的帮助. 全自动区分计算机和人类的图灵测试(英语:Completely Automated Public Turing t

基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)

基于python语言的tensorflow的‘端到端’的字符型验证码识别 1   Abstract 验证码(CAPTCHA)的诞生本身是为了自动区分 自然人 和 机器人 的一套公开方法, 但是近几年的人工智能技术的发展,传统的字符验证已经形同虚设. 所以,大家一方面研究和学习此代码时,另外一方面也要警惕自己的互联网系统的web安全问题. Keywords: 人工智能,Python,字符验证码,CAPTCHA,识别,tensorflow,CNN,深度学习 2   Introduction 全自动区

【原创】用C#.NET开发通用的验证码识别组件

相信大家在开发过程中,基本都用到过验证码识别程序.一提到验证码识别,绝大多数兄弟想到的都是用C++的效率配上牛逼哄哄的二值化.边缘检测等算法来实现.但这种识别方式的依赖性太强,不可重用,无法扩展,假设对方稍微修改下验证码的变形算法(做过网站的都知道有多简单),可能你累死累活搞出来的识别程序就全部作废了. 这里讲个我们公司的例子,为了识别支付宝登录的验证码,公司花大价钱请了一位牛人B用C++写了个支付宝验证码识别的DLL并做了导出,供我们在.NET平台下直接调用.当我们项目开发快结束的时候,这货竟

验证码识别

  本文所使用的验证码识别的方法非常暴力,高手可忽略.对于在客户端实现的“伪验证码”或使用静态图片的验证码,本文不作讨论.对于验证码的识别,一直以为,只要足够的样本,就可以分析出验证码的特征,从而进行分门别类,再通过和样本做比较,就可以得出正确验证码.这里简单而暴力的验证一下这个一直想验证而没有行动过的想法.做实验的网站是某体检机构,因为它生成的验证码很有规律(不确定是不是静态文件,但就可以当成是算法随机生成的),每个字符的位置相对固定,虽然每个字符的颜色和背景都不一样,但是背景颜色很相近,没有

使用Tesseract-OCR 做验证码识别浅析

使用工具jTessBoxEditor-0.7(这个是在java平台下开发的,所以 它只支持java平台 ,在使用前应该先配置好java环境) tesseract 程序集(因为该程序集是在.net 2.0平台下 开发的,所以 只能支持到2.0 在使用时请注意(也可以自己去网上找别人用更高的版本编译好的)) tesseract-ocr-setup-3.01-1  使用开发语言.net 辅助工具 Visual Studio 至少能支持.net 2.0即可 首先,我们要找到自己需要做验证识别的验证码图片

.NET 开发的-服务于企业,个人用户群的打杂平台-可定制数据采集,刷单抢购,验证码识别各类插件

今天,想给大家介绍下自己做的一个小的插件管理平台,大白鲨智软平台,这不算什么高科技的东西,暂时还是个封闭的插件定制平台 没有提供开发相关的API接口,和开发工具,不过后面会加上去,以我多年的脚本引擎使用和开发经验,撸这个功能上去不会太久^_^ 先上张截图 上班几年专注数据采集平台研发也有日子了,现在成了SOHO,一直想做一个生态圈的数据采集验证码识别的小平台,目前平台看起来是封闭状态的,但是设计上是可以扩展到提供 脚本引擎+API扩展方式来让人轻松愉悦的进行数据采集的小插件开发中,当然,这并不是

利用开源程序(ImageMagick+tesseract-ocr)实现图像验证码识别

利用开源程序(ImageMagick+tesseract-ocr)实现图像验证码识别 分类: 开放项目2012-07-23 17:28 6712人阅读 评论(0) 收藏 举报 tiffimagecompression引擎pascalcharacter --------------------------------------------------低调的分割线--------------------------------------------------- Linux下有两个重要的编程准则

(转)java验证码识别

java验证码识别--1 http://blog.csdn.net/problc/article/details/5794460 java验证码识别--2 http://blog.csdn.net/problc/article/details/5797507 java验证码识别--3 http://blog.csdn.net/problc/article/details/5800093 java验证码识别--4 http://blog.csdn.net/problc/article/detail