一、介绍
http服务通信过程
从发送端到接收端,所包含的头部信息,一层一层剥离。
URN: Uniform Resource Naming,统一资源命名 示例: P2P下载使用的磁力链接是URN的一种实现 magnet:?xt=urn:btih:660557A6890EF888666
URL: Uniform Resorce Locator,统一资源定位符,用于 描述某服务器某特定资源位置
两者区别:URN如同一个人的名称,而URL代表一个人的 住址。换言之,URN定义某事物的身份,而URL提供查找 该事物的方法。URN仅用于命名,而不指定地址
IP(独立IP):即Internet Protocol,指独立IP数。一天内来自 相同客户机IP地址只计算一次,记录远程客户机IP地址的计 算机访问网站的次数,是衡量网站流量的重要指标
PV(访问量): 即Page View, 页面浏览量或点击量,用户每 次刷新即被计算一次,PV反映的是浏览某网站的页面数,PV 与来访者的数量成正比,PV并不是页面的来访者数量,而是 网站被访问的页面数量
UV(独立访客):即Unique Visitor,访问网站的一台电脑为一 个访客。一天内相同的客户端只被计算一次。可以理解成访 问某网站的电脑的数量。网站判断来访电脑的身份是通过来 访电脑的cookies实现的。如果更换了IP后但不清除cookies, 再访问相同网站,该网站的统计中UV数是不变的
网站统计:http://www.alexa.cn/rank/
示例:
甲乙丙三人在同一台通过ADSL上网的电脑上(中间没有断网 ),分别访问www.magedu.com网站,并且每人各浏览了2个 页面,
那么网站的流量统计是:
IP:1 PV:6 UV:1
若三人都是ADSL重新拨号后,各浏览了2个页面,则
IP:3 PV:6 UV:1
web服务请求处理步骤
1、客户端建立链接(三次握手) 2、接收请求
3、http处理请求 4、访问被请求的资源
5、构建响应 6、发送响应 7、记录处理过程(日志)
一次完整的http请求处理过程
1、建立连接:接收或拒绝连接请求
2、接收请求:接收客户端请求报文中对某资源的一次请求的过程
Web访问响应模型(Web I/O)
多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求
复用I/O结构:启动一个进程,同时响应N个连接请求
实现方法:多线程模型和事件驱动
多线程模型:一个进程生成N个线程,每线程响应一个连接请求
事件驱动:一个进程处理N个请求
复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求 ,同时接收M*N个请求
3、处理请求:服务器对请求报文进行解析,并获取请求的资 源及请求方法等相关信息,根据方法,资源,首部和可选的 主体部分对请求进行处理
元数据:请求报文首部
<method> <URL> <VERSION> 方法URL版本
HEADERS 格式 name:value 标题 值
<request body> 请求主体
示例:
Host: www.magedu.com 请求的主机名称
Server: Apache/2.4.7
4、访问资源:
服务器获取请求报文中请求的资源web服务器,即存放了 web资源的服务器,负责向请求者提供对方请求的静态资源,或 动态运行后生成的资源
资源放置于本地文件系统特定的路径:DocRoot :DocRoot > /var/www/html
web服务器资源路径映射方式:
(a) docroot (b) alias (c) 虚拟主机docroot (d) 用户家目录docroot
5、构建响应报文:
一旦Web服务器识别除了资源,就执行请求方法中描述 的动作,并返回响应报文。响应报文中 包含有响应状态码、响 应首部,如果生成了响应主体的话,还包括响应主体
1)响应实体:如果事务处理产生了响应主体,就将内容放在 响应报文中回送过去。响应报文中通常包括:
描述了响应主体MIME类型的Content-Type首部
描述了响应主体长度的Content-Length
实际报文的主体内容
2)URL重定向:web服务构建的响应并非客户端请求的资源 ,而是资源另外一个访问路径
如360buy.com 跳转到jd.com
3)MIME类型:
Web服务器要负责确定响应主体的MIME类型。多种配置服 务器的方法可将MIME类型与资源管理起来
魔法分类:Apache web服务器可以扫描每个资源的内容,并 将其与一个已知模式表(被称为魔法文件)进行匹配,以决定每个 文件的MIME类型。这样做可能比较慢,但很方便,尤其是文件 没有标准扩展名时
显式分类:可以对Web服务器进行配置,使其不考虑文件的 扩展名或内容,强制特定文件或目录内容拥有某个MIME类型
类型协商: 有些Web服务器经过配置,可以以多种文档格 式来存储资源。在这种情况下,可以配置Web服务器,使其可 以通过与用户的协商来决定使用哪种格式(及相关的MIME类型 )"最好"
6、发送响应报文
Web服务器通过连接发送数据时也会面临与接收数据一 样的问题。服务器可能有很多条到各个客户端的连接,有些是空 闲的,有些在向服务器发送数据,还有一些在向客户端回送响应 数据。服务器要记录连接的状态,还要特别注意对持久连接的处 理。对非持久连接而言,服务器应该在发送了整条报文之后,关 闭自己这一端的连接。对持久连接来说,连接可能仍保持打开状 态,在这种情况下,服务器要正确地计算Content-Length首部 ,不然客户端就无法知道响应什么时候结束了
7、记录日志
最后,当事务结束时,Web服务器会在日志文件中添加 一个条目,来描述已执行的事务
特性:
高度模块化:core + modules
DSO: Dynamic Shared Object 动态加/卸载
MPM:multi-processing module多路处理模块
MPM工作模式
prefork:多进程I/O模型,每个进程响应一个请求,默认模型 (比较耗资源)
一个主进程:生成和回收n个子进程,创建套接字,不响应请求
多个子进程:工作work进程,每个子进程处理一个请求;系统初始 时,预先生成多个空闲进程,等待请求,最大不超过1024个 (主进程--多个子进程,子进程只对应一个线程)
worker:复用的多进程I/O模型,多进程多线程,IIS使用此模型
一个主进程:生成m个子进程,每个子进程负责生个n个线程,每个 线程响应一个请求,并发响应请求:mn (子进程对应多个线程)
event:事件驱动模型(worker模型的变种)
一个主进程:生成m个子进程,每个进程直接响应n个请求,并发响 应请求:mn,有专门的线程来管理这些keep-alive类型的线程,当有 真实请求时,将请求传递给服务线程,执行完毕后,又允许释放。这样 增强了高并发场景下的请求处理能力 (子进程对应多个线程,但是有线程专门管理其它线程,又空闲的回收)
httpd-2.2: event 测试版,centos6默认
httpd-2.4:event 稳定版,centos7默认
二、安装
原文地址:http://blog.51cto.com/11566825/2119640