Python入门小练习 003 利用cookielib模拟登录获取账户信息

为了方便, 使用chinaunix的账户获取账户主题. 有些网站可能需要验证码,  找一些不用验证码的网站

下面 ****** 很多个星号的均为私密信息, 所以用星号代替

#!/usr/bin/python
# -*- encoding:utf-8 -*-

import urllib
import urllib2
import cookielib
import re
import chardet      #判断字符串编码的包,用法为 charset.detect(str)  详细示例 http://www.cnblogs.com/zhanhg/p/4392089.html

filename = ‘cookie.txt‘
#声明一个MozillaCookieJar对象实例来保存cookie,之后写入文件
cookie = cookielib.MozillaCookieJar(filename)

#handler = urllib2.HTTPCookieProcessor(Cookie)
#opener = urllib2.build_opener(handler)
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))

postdata = urllib.urlencode({
    ‘stuid‘:‘*******‘,
    ‘pwd‘:‘*******‘
    })

#登录chinaunix的url链接
loginurl = ‘http://bbs.chinaunix.net/member.php?mod=logging&action=login&logsubmit=yes‘

#模拟登录,把cookie保存到变量
result = opener.open(loginurl,postdata)

#保存cookie到cookie.txt文件中
cookie.save(ignore_discard=True, ignore_expires=True)

#查询的链接
gradeurl = ‘http://bbs.chinaunix.net/home.php?m*********************‘

result = opener.open(gradeurl)
html = result.read()

reg = r‘<a href\=\"thread.*?" >(.*?)</a>‘
a = re.findall(reg,html)
for x in a:
    print(x.decode(‘gb2312‘))
时间: 2024-08-04 06:38:04

Python入门小练习 003 利用cookielib模拟登录获取账户信息的相关文章

Python3之利用Cookie模拟登录

利用Cookie模拟登录步骤: 1.       在浏览器输入http://demo.bxcker.com,输入用户名和密码登录. 2.登录成功点"客户管理"模块. 3. 进入客户管理模块,显示客户列表. 4.通过抓包工具抓取客户列表,得到登录后的Cookie信息. GET http://demo.bxcker.com/customer/index.shtml HTTP/1.1 Host: demo.bxcker.com Connection: keep-alive Pragma: n

POST信息模拟登录获取页面内容

最近项目里有一个是要模拟登录后,访问固定页面获取内容的要求,一开始用JQ AJAX好像不支持跨域请求.后使用.net中HttpWebRequest对象来获取.一开始访问总是无法在第二个页面正常访问,好像没通过登录验证,用postman模拟提交正常,后查询出原是忘记在第二次请求没把cookies关联上,关联上后请求正常. string wurl=""; string username="haxinet"; string userpwd="haxinet&qu

Python入门小建议

"java从心"正式更名"KEN DO EVERTHING".Ken(Can) Do Everything,无所不能 Believe youseft then you can do everthing ! 我也是刚踏入python的大门,所以只能给点小建议,而不是指导(暂时只接触了python爬虫) 入门3部曲 1.语法学习,推荐可以看菜鸟教程上的python3语法 https://www.runoob.com/python3/python3-tutorial.ht

利用scrapy模拟登录知乎

闲来无事,写一个模拟登录知乎的小demo. 分析网页发现:登录需要的手机号,密码,_xsrf参数,验证码 实现思路: 1.获取验证码 2.获取_xsrf 参数 3.携带参数,请求登录 验证码url : "https://www.zhihu.com/captcha.gif?r={t}&type=login&lang=en".format(t=t)  # t 为时间戳 登录界面url : "https://www.zhihu.com/#signin" 手

python入门小程序2

1.猜年龄 age_of_princal=78 guess_age =int(input(">>:")) if guess_age == age_of_princal: print("you are right") 2.猜年龄加强版 age_of_princal=78 guess_age =int(input(">>:")) if guess_age == age_of_princal: print("you a

Python入门小程序1

学习了FishC的Python零基础入门第4节,本次的内容是Python的while循环语句和条件语句. 1. 用一个条件语句实现猜数字的小程序 程序设定一个数字,用户输入一个数字,判断是否猜对. temp=input("猜猜我心中的数字:") guess=int(temp) if guess==8: print("猜对!") else: print("猜错了!") print("游戏结束!") 2. 改进程序1 上一个程序中

Python入门小程序(一)

学习了FishC的Python零基础入门第4节,本次的内容是Python的while循环语句和条件语句. 1. 用一个条件语句实现猜数字的小程序 程序设定一个数字,用户输入一个数字,判断是否猜对. temp=input("猜猜我心中的数字:") guess=int(temp) if guess==8: print("猜对!") else: print("猜错了!") print("游戏结束!") ###运行结果: 2. 改进程

Python入门小练习 002 批量下载网页链接中的图片

我们常常需要下载网页上很多喜欢的图片,但是面对几十甚至上百张的图片,一个一个去另存为肯定是个很差的体验. 我们可以用urllib包获取html的源码,再以正则表达式把匹配的图片链接放入一个list中,使用for循环来依次下载list中的链接. import re import urllib a = raw_input("Please input a URL: ") s = urllib.urlopen(a) s2 = s.read() def image(s2): reg = r'sr

python入门小知识2

if语句小程序示例 1. user_name = "wang"password = 123inp_user_name = input(">>:")inp_password = int(input (">>:"))if inp_user_name == user_name and inp_password == password:    print("pass")else:    print("