基于python的request库，模拟登录csdn博客

以前爬虫用urllib2来实现，也用过scrapy的爬虫框架，这次试试requests，刚开始用，用起来确实比urllib2好，封装的更好一些，使用起来简单方便很多。

安装requests库

最简便的方法就是使用pip来安装：pip install requests；如果需要安装特定版本，则在后面加上版本号即可：pip install requests == 1.9.7，这样就搞定了。

快速上手的小例子

下面说一个最简单的例子：

第一行，引入requests库，这是必然的。

第二行，通过get方法获取百度首页的内容。

第三行，把返回的response内容，输出出来。

果然很简单，这样就可以发送一个get请求，同理，也可以使用requests.post,requests.put,requests.options,requests.head，发送请求。

模拟登录csdn

我们需要其他的辅助工具

浏览器：Firefox

浏览器插件：tamper data，firebug

我们需要tamper data来拦截请求，因为chrome没有这个功能的插件，所以这个只能使用firefox来做（除了拦截请求chrome没有，其他的工作都可以使用chrome）。

分析登录过程

1.打开登录页面

我们首先打开csdn的登录页面：https://passport.csdn.net/account/login?ref=toolbar，这个链接，前面的部分是登录的网址，问号后面的参数，referer，就是你从哪里跳过来的，也许是一个页面跳转到登录的，toolbar就是我自己点击顶部导航栏，然后跳转到登录页面的。

2.清除相关的cookie

为了清除不必要的干扰，我们先清除掉所有的相关的cookie，这样方便我们分析哪些参数是必须的。