python 爬照片模拟浏览器先登录账号

# -*- coding: utf-8 -*-
"""
Created on Mon Mar 7 10:53:40 2016

@author: root
"""
import urllib2
import ssl
from selenium import webdriver
sel=webdriver.Firefox()

loginurl = ‘https://18.63.191.89:80/Account/Login‘
sel.get(loginurl)
sel.find_element_by_id(‘USERNAME‘).send_keys(‘admin‘)
sel.find_element_by_id(‘Password‘).send_keys(‘Admin‘)
inps=sel.find_elements_by_tag_name(‘input‘)
inps[4].click()

cookie = [item["name"] + "=" + item["value"] for item in sel.get_cookies()]
cookiestr = ‘;‘.join(item for item in cookie)

ssl._create_default_https_context=ssl._create_unverified_context

def GetUrlImg(url,filename):

headers = {‘cookie‘:cookiestr}
req = urllib2.Request(url, headers = headers)
response = urllib2.urlopen(req)
text = response.read()
if len(text)>0:
fd = open(filename, ‘w‘)
fd.write(text)
fd.close()

#url = ‘https://18.63.191.89:80/F/Image/?img=1&id=4355‘
#GetUrlImg(url)
#i=2000
for i in range(2753,4517):
url=‘https://18.63.191.89:80/F/Image/?img=1&id={0}‘.format(i)
filename = ‘ID_{:0>4}.jpg‘.format(i)
print url,filename
GetUrlImg(url,‘/root/ID/‘+filename)

时间： 2024-08-24 11:08:56

python 爬照片模拟浏览器先登录账号的相关文章

Python使用mechanize模拟浏览器

Python使用mechanize模拟浏览器之前我使用自带的urllib2模拟浏览器去进行訪问网页等操作,非常多站点都会出错误,还会返回乱码.之后使用了 mechanize模拟浏览器,这些情况都没出现过,真的非常好用.这里向大家推荐一下. mechanize是对urllib2的部分功能的替换,能够更好的模拟浏览器行为,在web訪问控制方面做得更全面. 首先从安装開始吧,以ubuntu系统为例: python 绝大部分第三方软件包.都是标准安装方式,从官网下载之后.解压到一个文件夹内,然后在这个

python下selenium模拟浏览器基础操作

1.安装及下载 selenium安装: pip install selenium 即可自动安装selenium geckodriver下载:https://github.com/mozilla/geckodriver/releases Chromedriver下载:http://npm.taobao.org/mirrors/chromedriver/ 2.保存路径将下载好的geckodriver以及Chromedriver解压到桌面,打开我的电脑,找到Python文件夹中anancode文件

python小练习--模拟用户登录，（3次重试机会，登录成功展示登录账号密码）

知识点使用:1.格式化输出的两种方法---% .formate 2.while循环的使用,及跳出循环的两种方法---break(跳出循环体).continue(结束本次循环,继续下次循环) 3.if条件语句的使用 """ 功能:模拟用户登录,(3次重试机会,登录成功展示登录账号密码) 作者:诸葛日期:29/06/2019 """ i = 3 username = 'zzl' password = '123456' #思路一:先验证账号,再验证密

记：使用python模拟浏览器发送http消息

python自带的urllib,urllib2可以极方便做http操作,在我们按照http方式提交消息请求后,有可能会看见返回这个错误“403 forbidden",这是请求的网站做了阻止,于是我们需要把自己伪装成模拟器.对此,可以加上headers={'User-Agent':user-agent,'cookie':cookie},注意操作的网站需要登录账号的话,就需要加上cookie,这两个值可以通过chrome的”开发者工具“查看: 把他们加上去,然后在请求值那里再加上: req = u

Python爬虫之模拟登录微信wechat

不知何时,微信已经成为我们不可缺少的一部分了,我们的社交圈.关注的新闻或是公众号.还有个人信息或是隐私都被绑定在了一起.既然它这么重要,如果我们可以利用爬虫模拟登录,是不是就意味着我们可以获取这些信息,甚至可以根据需要来对它们进行有效的查看和管理.是的,没错,这完全可以.本篇博主将会给大家分享一下如何模拟登录网页版的微信,并展示模拟登录后获取的好友列表信息. 微信模拟登录的过程比较复杂,当然不管怎么样方法都是万变不离其宗,我们还是使用fiddler抓包工具来模拟登录的过程.好了,下面让我们一步一

web爬虫讲解—Scrapy框架爬虫—Scrapy模拟浏览器登录—获取Scrapy框架Cookies

模拟浏览器登录 start_requests()方法,可以返回一个请求给爬虫的起始网站,这个返回的请求相当于start_urls,start_requests()返回的请求会替代start_urls里的请求 Request()get请求,可以设置,url.cookie.回调函数 FormRequest.from_response()表单post提交,第一个必须参数,上一次响应cookie的response对象,其他参数,cookie.url.表单内容等 yield Request()可以将一个新

Python模拟浏览器实现用户响应

最近工作中遇到一个问题,在集群上运行的任务有时候无法正常结束,或者无法正常启动.这会造成这批运行的任务无法正常结束运行,处于pending的状态,导致后面的任务无法正常启动. 该问题困扰我们项目已经有半年左右了,一直没有想到很好的解决办法.主要原因就是任务的状态只能在浏览器中看出,无法通过后台的日志或者数据库查询得到.在浏览器中,如果我们看到某个任务长时间没有运行时间和状态的变化,就可以把这个任务当做是“僵尸”任务,从而可以将该任务手动结束掉(kill). 春节之后在网上看到一些有关爬虫的文章,

splinter python浏览器自动化操作，模拟浏览器的行为

Splinter可以非常棒的模拟浏览器的行为,Splinter提供了丰富的API,可以获取页面的信息判断当前的行为所产生的结果最近在研究网站自动登录的问题,涉及到需要实现浏览器自动化操作,网上有不少介绍,例如使用pamie,但是只是支持IE,而且项目也较久没有更新了.还有就是利用selenium,可支持多种浏览器.网上资料比较多.经过比较,我选择了Splinter模块,因为利用Splinter开发浏览器自动化操作,编写代码比较简单. 一.Splinter的安装 Splinter的使用必修依

测试开发Python培训：模拟登录新浪微博-技术篇

测试开发Python培训:模拟登录新浪微博-技术篇一般一个初学者项目的起点就是登陆功能的自动化,而面临的项目不同实现的技术难度是不一样的,poptest在做测试开发培训中更加关注技术难点,掌握技术实现思路,提高动手能力.这里通过大家都能接触到的系统新浪微博,作为案例. 模拟登录功能比较简单,很多人在学习自动化的时候都会以登陆来作为自己的第一个学习案例,有点像开发语言中第一段代码都是helloworld!一样.登陆简单的模拟登录,直接发post请求就OK,很容易实现. 这里用新浪微博,就是技术实

猜你喜欢

2017.3.13 下午

下午主要学习练恋有词U7单元单词及其应用.

css侧边栏之综合实例3

2. 3. 4.

TOMCAT服务器配置域名

最近做了个网站,用的是web'服务器是tomcat,框架式SpringMVC,功能做好后,就准备上线使用了, 手上已经有域名以及一台服务器,已经绑定好ip了,剩下的也就是配置Tomcat了,比较简单, ...

[NOI2007]货币兑换Cash（DP+动态凸包）

第一次打动态凸包维护dp,感觉学到了超级多的东西. 首先,set是如此的好用!!!可以通过控制一个flag来实现两种查询,维护凸包和查找斜率k 不过就是重载运算符和一些细节方面有些恶心,90行解决后 ...

3-了解.json文件

1.app.json的配置项下面是微信官方给出的一个json配置文件. { "pages": [ "pages/index/index", "pag ...

[翻译]opengl扩展教程1

[翻译]opengl扩展教程1 原文地址https://www.opengl.org/sdk/docs/tutorials/ClockworkCoders/extensions.php [翻译]ope ...

Java设计模式(Design Patterns In Java)读书摘要——第1章绪论

为何需要模式模式是做事的方法,是实现目标,研磨技术的方法.通俗点说,模式是为了解决某个行业的某个问题的有效的方法或技艺. 为何需要设计模式为了提升代码的水准,是代码变得简洁而易用.模式是一种思想, ...

特征的转换规则 Transfer Routione

声明:原创作品,转载时请注明文章来自SAP师太技术博客:www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将追究法律责任!原文链接:http://www. ...

786ujnhb

http://www.zgsmbb.com/com/wkajvm4grqc/http://www.zgsmbb.com/com/whj66ni1ttd/http://www.zgsmbb.com/co ...

UEditor文本编辑器

Ueditor是由百度web前端研发部开发所见即所得的编辑器,具有轻量,可定制,注重用户体验等特点.Ueditor基于BSD开源协议,除了具有代码精简.加载迅速的轻量级特质外,还采用了分层理念,使开 ...

spark遇到的错误1-内存不足

原来的代码: JavaRDD<ArticleReply> javaRdd = rdd.flatMap(new FlatMapFunction<String, ArticleReply ...

太阳能尘世间刀女开始忙了....

http://www.zww.cn/baike/t/7/345577.htm http://www.zww.cn/baike/t/6/345576.htm http://www.zww.cn/b ...

一种JavaScript 类的设计模式

一种JavaScript 类的设计模式尽管前面介绍了如何定义一个类,如何初始化一个类的实例,但既可以在function定义的函数体中添加成员,又可以用prototype 定义类的成员,代码显的很混乱, ...

Redis源码阅读-sds字符串源码阅读

redis使用sds代替char *字符串, 其定义如下: typedef char *sds; struct sdshdr { unsigned int len; unsigned int free ...

修改 OWA 修改密码的生效时间

从 Exchange 中文站之前的文章配置 OWA 下次登录时更改密码中, 我们知道在 Exchange 2010 SP1 当中是可以配置在 OWA 中修改域用户的密码的,那么不知道你是否有发现,当用 ...

关于Python包的安装

各个环境下安装方法都差不多,我这里用的是windows系统,安装好Python后,将Python安装目录以及安装目录下的Scripts目录加入环境变量Path变量下,如果仅在一个系统用户下使用Pyth ...

libpcap 的 bpf

tcpdump -d //参看 bpf 编译后的代码 # tcpdump -i eth0 -n 'vlan && tcp' -d (000) ldh [12] (001) jeq #0 ...

大型网站技术架构——网站架构的伸缩性设计

首先,所谓网站的伸缩性,指不需要改变网站的软硬件设计,仅仅通过改变部署的服务器数量就可以扩大或者缩小网站的服务处理能力.在整个互联网行业的发展渐进演化中,最重要的技术就是服务器集群,通过不断地向集群中 ...

oracle视图及其他对象操作

视图及其他对象操作实验目的 (1) 掌握视图的建立.查询.修改.删除操作. (2) 掌握同义词的建立.查询.修改.删除操作,比较对同义词的操作与对原数据库对象的操作是否一致. (3) 掌握序列的建立 ...

MSIL 教程（二）：数组、分支、循环、使用不安全代码和如何调用Win32 API（转）

转自:http://www.cnblogs.com/Yahong111/archive/2007/08/16/857574.html 续上文[翻译]MSIL 教程(一) ,本文继续讲解数组.分支.循环 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.030 s.