python3 破解 geetest(极验)的滑块验证码

from selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.common.action_chains import ActionChainsimport PIL.Image as imageimport time,re, randomimport requeststry:    from StringIO import StringIOexcept ImportError:    from io import StringIO

#爬虫模拟的浏览器头部信息agent = ‘Mozilla/5.0 (Windows NT 5.1; rv:33.0) Gecko/20100101 Firefox/33.0‘headers = {        ‘User-Agent‘: agent        }

# 根据位置对图片进行合并还原# filename:图片# location_list:图片位置#内部两个图片处理函数的介绍#crop函数带的参数为(起始点的横坐标,起始点的纵坐标,宽度,高度)#paste函数的参数为(需要修改的图片,粘贴的起始点的横坐标,粘贴的起始点的纵坐标)def get_merge_image(filename,location_list):    #打开图片文件    im = image.open(filename)    #创建新的图片,大小为260*116    new_im = image.new(‘RGB‘, (260,116))    im_list_upper=[]    im_list_down=[]    # 拷贝图片    for location in location_list:        #上面的图片        if location[‘y‘]==-58:            im_list_upper.append(im.crop((abs(location[‘x‘]),58,abs(location[‘x‘])+10,166)))        #下面的图片        if location[‘y‘]==0:            im_list_down.append(im.crop((abs(location[‘x‘]),0,abs(location[‘x‘])+10,58)))    new_im = image.new(‘RGB‘, (260,116))    x_offset = 0    #黏贴图片    for im in im_list_upper:        new_im.paste(im, (x_offset,0))        x_offset += im.size[0]    x_offset = 0    for im in im_list_down:        new_im.paste(im, (x_offset,58))        x_offset += im.size[0]    return new_im

#下载并还原图片# driver:webdriver# div:图片的divdef get_image(driver,div):    #找到图片所在的div    background_images=driver.find_elements_by_xpath(div)    location_list=[]    imageurl=‘‘    #图片是被CSS按照位移的方式打乱的,我们需要找出这些位移,为后续还原做好准备    for background_image in background_images:        location={}        #在html里面解析出小图片的url地址,还有长高的数值        location[‘x‘]=int(re.findall("background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;",background_image.get_attribute(‘style‘))[0][1])        location[‘y‘]=int(re.findall("background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;",background_image.get_attribute(‘style‘))[0][2])        imageurl=re.findall("background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;",background_image.get_attribute(‘style‘))[0][0]        location_list.append(location)    #替换图片的后缀,获得图片的URL    imageurl=imageurl.replace("webp","jpg")    #获得图片的名字    imageName = imageurl.split(‘/‘)[-1]    #获得图片    session = requests.session()    r = session.get(imageurl, headers = headers, verify = False)    #下载图片    with open(imageName, ‘wb‘) as f:        f.write(r.content)        f.close()    #重新合并还原图片    image=get_merge_image(imageName, location_list)    return image

#对比RGB值def is_similar(image1,image2,x,y):    pass    #获取指定位置的RGB值    pixel1=image1.getpixel((x,y))    pixel2=image2.getpixel((x,y))    for i in range(0,3):        # 如果相差超过50则就认为找到了缺口的位置        if abs(pixel1[i]-pixel2[i])>=50:            return False    return True

#计算缺口的位置def get_diff_location(image1,image2):    i=0    # 两张原始图的大小都是相同的260*116    # 那就通过两个for循环依次对比每个像素点的RGB值    # 如果相差超过50则就认为找到了缺口的位置    for i in range(0,260):        for j in range(0,116):            if is_similar(image1,image2,i,j)==False:                return  i

#根据缺口的位置模拟x轴移动的轨迹def get_track(length):    pass    list=[]    #间隔通过随机范围函数来获得,每次移动一步或者两步    x=random.randint(1,3)    #生成轨迹并保存到list内    while length-x>=5:        list.append(x)        length=length-x        x=random.randint(1,3)    #最后五步都是一步步移动    for i in range(length):        list.append(1)    return list

#滑动验证码破解程序def main():    #打开火狐浏览器    driver = webdriver.Firefox()    #用火狐浏览器打开网页    driver.get("http://www.geetest.com/exp_embed")    #等待页面的上元素刷新出来    WebDriverWait(driver, 30).until(lambda the_driver: the_driver.find_element_by_xpath("//div[@class=‘gt_slider_knob gt_show‘]").is_displayed())    WebDriverWait(driver, 30).until(lambda the_driver: the_driver.find_element_by_xpath("//div[@class=‘gt_cut_bg gt_show‘]").is_displayed())    WebDriverWait(driver, 30).until(lambda the_driver: the_driver.find_element_by_xpath("//div[@class=‘gt_cut_fullbg gt_show‘]").is_displayed())    #下载图片    image1=get_image(driver, "//div[@class=‘gt_cut_bg gt_show‘]/div")    image2=get_image(driver, "//div[@class=‘gt_cut_fullbg gt_show‘]/div")    #计算缺口位置    loc=get_diff_location(image1, image2)    #生成x的移动轨迹点    track_list=get_track(loc)    #找到滑动的圆球    element=driver.find_element_by_xpath("//div[@class=‘gt_slider_knob gt_show‘]")    location=element.location    #获得滑动圆球的高度    y=location[‘y‘]    #鼠标点击元素并按住不放    print ("第一步,点击元素")    ActionChains(driver).click_and_hold(on_element=element).perform()    time.sleep(0.15)    print ("第二步,拖动元素")    track_string = ""    for track in track_list:        #不能移动太快,否则会被认为是程序执行        track_string = track_string + "{%d,%d}," % (track, y - 445)        #xoffset=track+22:这里的移动位置的值是相对于滑动圆球左上角的相对值,而轨迹变量里的是圆球的中心点,所以要加上圆球长度的一半。        #yoffset=y-445:这里也是一样的。不过要注意的是不同的浏览器渲染出来的结果是不一样的,要保证最终的计算后的值是22,也就是圆球高度的一半        ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=track+22, yoffset=y-445).perform()        #间隔时间也通过随机函数来获得,间隔不能太快,否则会被认为是程序执行        time.sleep(random.randint(10,50)/100)    print (track_string)    #xoffset=21,本质就是向后退一格。这里退了5格是因为圆球的位置和滑动条的左边缘有5格的距离    ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()    time.sleep(0.1)    ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()    time.sleep(0.1)    ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()    time.sleep(0.1)    ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()    time.sleep(0.1)    ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=21, yoffset=y-445).perform()    print ("第三步,释放鼠标")    #释放鼠标    ActionChains(driver).release(on_element=element).perform()    time.sleep(3)    #点击验证    # submit = driver.find_element_by_xpath("//div[@class=‘gt_ajax_tip success‘]")    # print(submit.location)    # time.sleep(5)    #关闭浏览器,为了演示方便,暂时注释掉.    #driver.quit()

#主函数入口if __name__ == ‘__main__‘:    pass    main()
时间: 2024-10-19 21:23:52

python3 破解 geetest(极验)的滑块验证码的相关文章

GeeTest 极验验证

前台Html页面 <script src="http://libs.baidu.com/jquery/1.9.0/jquery.js"></script> <script src="http://static.geetest.com/static/tools/gt.js"></script> <div style="margin:300px;" > <div id="yz

GEETEST极验召集互联网大佬齐聚光谷,共同探讨交互安全问题

全球互联网技术在飞速发展的同时,网络安全事件也随之频发.除了直接带来经济损失的网络恶意攻击之外,企业在多个方面也遭受着不同程度的网络恶意攻击,包括品牌形象.管理时间.企业竞争力.客户成交量.用户行为等. 极验自2012年成立以来, 一直专注于利用人工智能技术解决日益严峻的互联网交互安全问题.为了更好的帮助企业应对日益严峻的交互安全形势,极验于9月14日举办的以"新视角.新安全"为主题的线下沙龙在光谷创业咖啡举办. 本次沙龙聚集了盛天网络.斗鱼TV.九州通.长江证券.泰康在线.楚天云.卓

极验滑块坐标识别(一)

一:介绍 一些网站为了区分人机行为,在网站的一些操作上添加验证码机制,来实现反爬虫. 目前比较常见的验证码类型有: 1:传统式验证码 主要通过用户输入图片中的字母,数字,汉字等来验证. 特点:简单易操作,人机交互性较好,但安全系数比较低. 目前通过机器学习技术对传统验证码的识别率已经可以达到90%以上. 2:行为式验证码 行为式验证码是一种较为流行的验证码.从字面来理解,就是通过用户的操作行为来完成验证,而无需去读懂扭曲的图片文字.常见的有两种:拖动式与点触式. 特点:操作简单,体验好,但容易被

极验验证码的破解2-图片还原和滑块位置求解

上一章我们讨论了破解极验验证码的思路和步骤,这一章我将介绍如何还原两张背景图和求解滑块的目标位置. 一.图片还原 我们首先看看页面上给了我们什么参数: 这个是完整的背景图(fullbg)的页面元素,可以看到他们都是来自于同一张原图,只是截取的位置不同.上图红框就是该小图片在原图中的位置,每一张小图片都是10个像素宽,58个像素高,我们再来看看原图: 确实很乱,根本看不出什么东西.如果我们把这个原图下载下来,然后按照页面上的参数截取一个个10像素宽,58像素高的小图片拼接在一起便可以得到完整的背景

极验验证码的破解4-执行破解

经过以上的铺垫,我们就差最后一步了-破解!首选我们来分析一下要做的事情: 1.加载包含验证码的页面,当然是用我们前面讲的phantomaJS来加载啦,因为极验验证码是依赖于js渲染的,我们必须等页面完全渲染完成后再执行拖动 2.收集一些页面的参数发送到java后台服务计算滑块的目标位移并接受结果 3.通过js模拟鼠标事件来实现滑块的移动 4.输出验证结果 好,让我们一步步来讲解如果实现上面的目标. 我们首先新建一个js文件,就叫做geetest_refresh.js好了,我们首先写一些样板代码,

破解极验滑动验证码

阅读目录 一 介绍 二 实现 三 说明 一 介绍 一些网站会在正常的账号密码认证之外加一些验证码,以此来明确地区分人/机行为,从一定程度上达到反爬的效果,对于简单的校验码Tesserocr就可以搞定,如下 但一些网站加入了滑动验证码,最典型的要属于极验滑动认证了,极验官网:http://www.geetest.com/,下图是极验的登录界面 现在极验验证码已经更新到了 3.0 版本,截至 2017 年 7 月全球已有十六万家企业正在使用极验,每天服务响应超过四亿次,广泛应用于直播视频.金融服务.

极验验证码 破解

本文主要提供目前极验的识别思路. 极验验证码主要分为4步. 1/ 还原验证图片.通过分析CSS,发现是固定位置,把一张图片分成若干份,按照指定顺序重新排列,所以难度不大. 2/ 还原好图片后,找出2张图片的差异,即bg(验证图)和fullbg(全图).这个难度也不大,按像素或者按块去扫描.设定一个阈值,当2个图片块或像素的差异值高于这个阈值的时候,就横向向右再扫描几个像素,例如10个,如果这10个像素里面有7个都高于这个像素.那个这个像素所在图片的X坐标,就是我们要的坐标点.根据这种方式,识别坐

极验验证码的破解-开篇

    近几年有个拖动解锁的验证码风头很盛,用过12306的人就知道,它有段时间用的就是这个拖动解锁的验证码,据说就是极验验证码,虽然现在12306的验证码变成了看图识画,安全性和趣味性大大提高,但是也还是被万能的大神破了.由此看来天下没有破不了的验证码,只要功夫深,防火墙也能磨成针.     好了,今天我们来探讨一下极验验证码的破解,这也是我最近一段时间的研究成果.首先声明一下:本博客所讨论的内容仅限于技术研究,请勿用于商业用途,否则后果自负.     我打算分成几个章节来讨论极验验证码所采用

极验验证码的破解3-模拟浏览器渲染

前面我们介绍了如何求解极验验证码的滑块目标位移,下面我就就要开始实施拖动滑块破解了.因为我们采取的是模拟人的行为操作,而极验验证码都是js渲染的,因此我们需要一个工具来帮我们完成这个渲染过程得到一个完整的页面,否则一切都是空谈.这里我将使用casperJs+phantomJs来实现目标. phantomJs号称一个headless的浏览器,也就是包含浏览器内核但是没有界面的浏览器,它是跨平台的,安装很简单,解压到一个目录即可. casperJs是基于phantomJs的封装,提供了更友好的api