通过抓包，实现Python模拟登陆各网站，原理分析！

一、教程简介

1.1 基本介绍

通过分析登陆流程并使用 Python 实现模拟登陆到一个实验提供的网站，在实验过程中将学习并实践 Python 的网络编程，Python 实现模拟登陆的方法，使用 Firefox 抓包分析插件分析网络数据包等知识。

模拟登录可以帮助用户自动化完成很多操作，在不同场合下有不同的用处，无论是自动化一些日常的繁琐操作还是用于爬虫都是一项很实用的技能。本课程通过 Firefox 和 Python 来实现，环境要求如下：

Python 库：urllib, http.cookiejar, Django
Firefox 要求：装有 live http header插件 (已提供)

1.3 材料

1.4 准备

1) 安装抓包插件Live Http Headers

2)启动web应用

使用 ps -aux | grep codebox 查询获得 codebox 的进程号，然后使用 kill -9 进程号停止 codebox 进程。执行过程见下图：

首先安装demo依赖的web框架django，并测试是否安装成功：

启动成功后在浏览器中输入 http://localhost:8000/polls 看到登录页面表示启动成功

二、分析登录过程

要通过编程实现登录，首先需要理解一般Web应用的登陆过程。

2.1 抓取请求

2.2原理分析

为什么是2个请求而不是1个呢?通过分析登录请求发现，登陆成功之后服务器发送了302重定向响应，服务器要求浏览器重新请求首页，这就产生了第二个请求。再来分析第二个请求，可以看到它相比登录请求多了一个请求头：

整个登录流程如下图所示：

服务器到底是如何区别不同用户的session的？为什么登陆成功会后要回写cookie呢？

2.3小结

对于服务器来说，登录=验证+写session。对于浏览器来说，登录=发送登录信息+获取带sessionid的cookie。可以说，只要获得了sessionid，就算实现了模拟登录。有了它我们便可以游离于系统之中。

三、使用Python实现登录(简单实例)

理解了登录过程的原理和细节之后，开始用Python来编写模拟登陆程序吧。

3.1导入模块

不要忘记编写文件头、导入必要的依赖模块

3.2构造登录请求

登录请求的实体部分如下：

全部Python代码：

附加参数

防盗链

Web 应用的资源都是有url的，只要获得了url就能够在任何地方引用。听起来很方便，但这可能会导致你的资源被别人盗用。

3.3发送请求并保存cookie

Python代码如下：

如果登陆成功

就可以在指定的文件my_cookies.txt中看到sessionid了。

3.4 使用cookie访问系统服务

在我们模拟登录成功后，就可以直接通过opener打开这个url来使用这项系统服务。代码实现如下：

如果有是在另外一个python文件中使用这个cookie的话，再打开url之前需要先载入cookie：

教程取自实验楼。

原文地址：https://www.cnblogs.com/q1613161916/p/9305733.html

时间： 2024-12-29 11:13:29

通过抓包，实现Python模拟登陆各网站，原理分析！的相关文章

Python模拟登陆万能法-微博|知乎

Python模拟登陆让不少人伤透脑筋,今天奉上一种万能登陆方法.你无须精通HTML,甚至也无须精通Python,但却能让你成功的进行模拟登陆.本文讲的是登陆所有网站的一种方法,并不局限于微博与知乎,仅用其作为例子来讲解. 用到的库有"selenium"和"requests".通过selenium进行模拟登陆,然后将Cookies传入requests,最终用requests进行网站的抓取.优点就是不但规避了"selenium"其本身抓取速度慢的问题

Python模拟登陆万能法

此文转自:https://zhuanlan.zhihu.com/p/28587931 转录只是为了方便学习,感谢他的分享 Python模拟登陆让不少人伤透脑筋,今天奉上一种万能登陆方法.你无须精通HTML,甚至也无须精通Python,但却能让你成功的进行模拟登陆.本文讲的是登陆所有网站的一种方法,并不局限于微博与知乎,仅用其作为例子来讲解. 用到的库有"selenium"和"requests".通过selenium进行模拟登陆,然后将Cookies传入reque

jmeter数据库，charles抓包，Python循环语句

jmeter数据库,charles抓包,Python循环语句一.Jemeter数据库添加jar包数据库 jemeter=>浏览添加JDBC Connection Configuration 配置数据 mysqlurl:jdbc:mysql://ip:port/db?useUnicode=true&characterEncoding=utf8&allowMultiQueries=true driver class:com.mysql.jdbc.Driver 4. 操作

模拟登陆 12306网站

目录模拟登陆 12306网站准备需求分析实现代码原文地址:https://www.cnblogs.com/guokaifeng/p/11695389.html

python模拟登陆实践

对于一些需要登陆的网址爬取数据,需要登录才能访问.本文介绍如何利用python进行模拟登陆准备工具: 1.搭建django 框架用于模拟登陆 2.fiddler抓包工具,chrome浏览器 3.pycharm 编辑器步骤: 1.开启django 服务,这里就不多描述,直接百度一下,就能找到很多答案(记得创建一个superuser,以便后面的登陆 ) 进入 http://127.0.0.1:8000/admin/ 这是django自带的后台,进行登陆时,django自带了 cs

Python模拟登陆２:获取电子科大研究生成绩

前面小试了一把能够成功登陆,但是这下要获取成绩可是废了好多功夫.首先他这个登陆只是登陆了一个frame框架页面,里面还有个js的二次跳转页面.还会自动登陆一次.只有在IE或者谷歌等http抓包才看的出来隐藏的地址. 开始以为很简单直接在第二个登陆页面提交post 谁知道他会自动跳转到第一个登陆页面前端白痴的我有点乱入了. 最后试来试去, 偷偷去看了下cookies ,尝试性的直接提交了cookies想不到成功了. 但是这个cookies是在成绩页面不知道是request还是respo

Python模拟登陆

模拟人人登陆 #encoding=utf-8 import urllib2 import urllib import cookielib def renrenBrower(url,user,password): #登陆页面,能够通过抓包工具分析获得,如fiddler.wireshark login_page = "http://www.renren.com/PLogin.do" try: #获得一个cookieJar实例 cj = cookielib.CookieJar() #cook

Python模拟登陆练习——imooc.com登陆

写下这篇文章的时候,是博主学习python的第三天( 也许是第四天:( ),python是博主接触的第二门解释型语言(第一门是javascript). 讲真在很久之前就想要用博客记录自己的学习历程了,然而就像写日记一样,写着写着就放弃了-.- so今天决定给自己一个好的开端~ 博主的学习方式是直奔目的,遇到问题百度各种博客,网站,百度找不到google找,就这样.这种学习方式是真的见效快,但显而易见,基础会比较薄弱. 因此学习python的基本语法,就直奔爬虫了! ---------------

Python模拟登陆：模拟登陆电子科大信息门户测试

最近在学习Python的网络操作,网上有很多模拟登陆方法.这里做个笔记. 没有验证码的还是比较容易的. #coding:utf-8 import re import urllib import urllib2 import cookielib import os import json import sys import time from urllib import quote,unquote from urllib2 import HTTPError from urllib2 import

猜你喜欢

Linux使用find查找最后修改时间超过三天的文件并移动到指定目录

使用场景:应用程序,如tomcat,每天都会生成新的日志文件,时间一长,占用大量的磁盘,需要定期清理这些文件. 代码如下: find /tomcat/logs/*.log -ctime +3 -exe ...

一步步学WebSocket（2）编程式WebSocket

接上篇,这篇我们采用编程式WebSocket实现上篇的例子: 服务端Endpoint,不再使用ServerEndpoint注解: public class ProgramerServer extend ...

python3第一天学习（数据类型）

参考blog地址:http://www.cnblogs.com/wupeiqi/articles/5444685.html,然后根据上面知识点练习并总结. 一.数字(int) 1.数字类型说明在 ...

11g新特性之自适应游标共享（Adaptive Cursor Sharing）

自适应游标共享会使包含绑定变量的单个语句拥有多个执行计划,所谓自适应是指执行计划会依据绑定变量的具体值而适配一个最适合该值的执行计划. 隐藏参数_optimizer_adaptive_cursor_s ...

Linux常用命令(第二版) --系统开关机命令

系统开关机命令说明-服务器不会经常的关机,重启,没有故障,服务器不会关机.因此这些命令就显得不是很常用. 1.shutdown /usr/sbin/shutdown e.g. shutdown -h ...

jxl对excel删除行

简单记录下: package com.pingan; import java.io.File; import java.util.regex.Matcher; import java.util.reg ...

编程题：strcmp（）函数的作用是：从左到右逐个字符比较。遇见‘\0’为止。

编程题:strcmp()函数的作用是:从左到右逐个字符比较.(按照字符对应的ascii码值比较)遇见'\0'为止. #include<stdio.h> #include<string ...

搭建vue开发环境的步骤,六步完成

搭建vue开发环境的步骤,其实也挺简单的,之前这环境的配置也困扰着我一:在搭建vue的开发环境之前,一定一定要先下载node.js,vue的运行是要依赖于node的npm的管理工具来实现,下载地址:h ...

高性能mysql - Schema与数据类型优化

MySQL支持的数据类型非常多,选择正确的数据类型对于获得高性能至关重要.选择数据类型的几个原则1.更小的通常更好2.简单就好,如使用date,time,datetime来存储时间而不是字符串 3.尽 ...

elasticsearch 中文API bulk(六)

bulk API bulk API允许开发者在一个请求中索引和删除多个文档.下面是使用实例. import static org.elasticsearch.common.xcontent.XCont ...

java trim

rim方法一般用来去除空格,但是根据JDK API的说明,该方法并不仅仅是去除空格,它能够去除从编码’\u0000′ 至 ‘\u0020′ 的所有字符. 回车换行也在这20个字符之中,以下是一个示例: ...

ExcelHelper office 导出

要是服务器上没有装着excel 可以用c#导出excel表吗 2009-08-10 17:36 风之成 | 分类:办公软件 | 浏览2279次租用的空间服务器上没有装着office excel,可 ...

如何用手机进行本地前端调试

在做前端开发时需要进行真机测试和调试,除了进行远程调试,我们能不能在本地就实现手机调试呢? 一般我们会用chrome来模拟移动设备显示效果,但还是有很多情况到了移动设备上才会出现.所以在进行响应式开发 ...

手势跟踪论文学习：Realtime and Robust Hand Tracking from Depth（四）Hand Initialization

论文阅读原创,转载请标明出处:http://blog.csdn.net/ikerpeng/article/details/39251373 在多次的阅读这篇论文以后才明白文章的结构为什么这样安排:将H ...

rabbitmq 简单应用

rabbitmqctl list_usersrabbitmqctl list_vhostsrabbitmqctl add_user rabbit rabbit rabbitmqctl set_user ...

关于DOM的优化以及js的性能问题

http://www.ruanyifeng.com/blog/2014/10/event-loop.html 写的很好的JavaScript运行机制的详解: http://web.jobbole. ...

nginx生产配置

user www www; worker_processes 8; error_log /data/logs/nginx_error.log crit; pid /usr/local/webserve ...

js函数的各种写法与调用

以下是我见过的各种js函数的各种写法以及调用,虽然有些写法及其调用我不清楚其专业术语叫啥,但并不影响我写一个总结笔记. 我们刚开始接触js语音,经常看到的这种名叫“使用function关键字来定义函数 ...

妙用perfmon Alert抓dump

抓dump文件,经常是解决众多疑难杂症的不二手段.但是很多时候,我们没办法抓.比如说几秒内的线程数暴涨200个,然后迅速回落程序跑了两天,内存涨到某个数字就自己OOM了原因不外乎都是时间短,没有 ...

透明度 background:rgba() 兼容IE8 ；边框只针对IE8 出现

.z_mask{ font-size: 13px; width: 100%; height: 100%; background: rgba(0,0,0,.5); -ms-filter:"pr ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.020 s.