一、session和cookie
简单来讲cookie机制采用的是在客户端保持状态的方案,而session机制采用的是在服务器端保持状态的方案。
同时我们也看到,由于采用服务器端保持状态的方案在客户端也需要保存一个标识,所以session机制可能需要借助于cookie机制来达到保存标识的目的。
二、cookie是什么?
Cookie,有时也用其复数形式 Cookies,指某些网站为了辨别用户身份、
进行 session 跟踪而储存在用户本地终端上的数据(通常经过加密)。
定义于 RFC2109 和 2965 中的都已废弃,最新取代的规范是 RFC6265[1]。
Cookie其实就是浏览器缓存。
cookie的内容主要包括:名字,值,过期时间,路径和域。路径与域一起构成cookie的作用范围。
三、 cookie的生命周期
如果某个cookie没有设置过期时间,则表示这个cookie的生命期为浏览器会话期间,关闭浏览器窗口,cookie就消失。这种生命期为浏览器会话期的cookie被称为会话cookie。
会话cookie一般不存储在硬盘上而是保存在内存里,当然这种行为并不是规范规定的。若设置了过期时间,浏览器就会把cookie
保存到硬盘上,关闭后再次打开浏览器,这些cookie仍然有效直到超过设定的过期时间。存储在硬盘上的cookie可以在不同的浏
览器进程间共享,比如两个IE窗口。而对于保存在内存里的cookie,不同的浏览器有不同的处理方式。
对于设置了过期时间的cookie,可以称为持久cookie。
四、session
session机制是一种服务器端的机制,当程序需要为某个客户端的请求创建一个session时,服务器首先检查这个客户端的请求里是否已包含了一个session标识
(称为session id),如果已包含则说明以前已经为此客户端创建过session,服务器就按照session id把这个session检索出来
使用(检索不到,会新建一个),如果客户端请求不包含session id,则为此客户端创建一个session并且生成一个与此session相
关联的session id,session id的值应该是一个既不会重复,又不容易被找到规律以仿造的字符串,这个session id将被在本次响应中返回给客户端保存。保存这个session id的方式可以采用cookie,这样在交互过程中浏览器可以自动的按照规则把这个标识发送给服务器。一般这个cookie的名字都是类似于SEEESIONID。
五、两者之间的区别
- 1.存在的位置
cookie 存在于客户端,临时文件夹中
session:存在于服务器的内存中,一个session域对象为一个用户浏览器服务。 - 2.安全性
cookie存在于客户端,安全性低.
session存在于服务端,安全性高。 - 3.生命周期
cookie的生命周期是累计的,从创建时,就开始计时,20分钟后,cookie生命周期结束。
session的生命周期是间隔的,从创建时,开始计时如在20分钟,没有访问session,那么session生命周期被销毁。但是,如果在20分钟内(如在第19分钟时)访问过session,那么,将重新计算session的生命周期。
另外关机会造成session生命周期的结束,但是对cookie没有影响
六、cookie在爬虫中的应用
1、以任何方式,如浏览器、selenium、封包方式等,获得对应的cookies
2、将cookies保存,可以是在内存、文件、数据库等
3、在你想要应用已有的cookie的 项目 中,已各种方式:文件、数据库、网络等,获取到对应的cookie,
然后进行设置,接着就可以访问对应的资源了
原文地址:https://www.cnblogs.com/pythoner6833/p/9054868.html