http与www服务概念详解

HTTP超文本传输协议

html页面标记语言

www万维网

端口21  ftp

22  ssh

25  smtp

3306 mysql

873  rsync

161  snmp

111  rpc

3389

80

443  https

110  pop3

53  dns

curl -I www.baidu.com 查看网站头部信息 200表示服务器返回成功。

http请求流程:

osi模型中的应用层协议,http协议的重要应用是www服务

获取ip在dns本地缓存表查找,网关DNS查找

dns解析流程

建立TCP连接

用户访问网站基本流程

html、xml,shtml,jpg,js,css,swf,avi,wmv,flv等都属于静态页面。

静态网页容易被搜索引擎收录,所以很多时候需要将动态转成静态便于排名靠前增加点击率。

静态网页没有数据库支持,所以大量信息的网站不适合用静态的。

动态网页:服务端解析,效率远不如静态网页。用户注册、用户登录、在线调查,投票、用户管理、订单管理、发博文等。asp、aspx,php,jsp,do,并且常伴随?,&等。

架构优化:效率很差,并发也很低,尽可能转换成静态网页提供服务。

静态:动态-------10:1  系统架构师和程序架构师的职责。

伪静态就是将动态伪装成静态,其实还是动态,主要是修改了域名地址,目的是便于搜索收录,但并不能提升网站的性能,反而下降,转换时消耗资源。并发量不是很大时可以做伪静态,更新频率很快的业务也没必要做动转静,伪静态就非常好。

异步,消息中间件、消息队列就是让动态转静态。

web3.0是web2.0的替代物,以用户为中心,动态页面为主,智能化人与人机器的交流。10兆,全视频的网络,这才像web3.0。

传统页面布局:表格

现在:DIV+CSS,载入更快,降低流量成本提升用户体验,更有效率,保持视觉一致性,有利于搜索引擎收录,对浏览者和浏览器更具有亲和力。

java的解释器:tomcat(小型互联网公司)/resin( 大型互联网公司)/weblogic(传统行业)/jboss(淘宝)

赶集网:日200-300万人访问。

PV:PAGE VIEW 页面浏览量或点击量,用户每次刷新即被计算一次。用户发出,服务器回馈就叫一个pv,打开一个页面就一次pv,打开一个链接就是一次pv,有些网站为防止刷pv会在页面底部嵌入一个js来统计。

如果一个用户访问赶集网,你觉得平均会产生多少pv?几个-几十个

赶集网日ip300万,那么你估计下pv能有多少,3000万+。吹牛可以说pv,最主要的是有多少人看到,这才是广告商中意的。

uv:一个人访问记一个uv,通过不同技术方法来记录,实际会有误差。每次请求的信息内部都包含了你电脑的一些信息,比如:ip地址,请求发出的时间,浏览器版本,操作系统版本等等。也就是满足同一共同特征的就叫同一ip。问题是多人一个电脑。

ip/pv的度量:

pv的度量

1、分析web服务的访问日志(排除js、css各种图片),html,php。

2、在所有页面结尾,嵌入js程序(GA),传给统计服务器。

3、用第三方大家比较信任的统计工具(GA)。

ip的度量:

1、分析web服务的访问日志,去重。

2、在所有页面结尾,嵌入js程序(GA),传给统计服务器。

3、用第三方大家比较信任的统计工具(GA)。

session()和cookie(客户端用户)的区别是uv的一个补充,也就是浏览器发出请求后,服务端会发一个cookie放在客户端的c盘,这个cookie也包含了服务器信息,访问时间,访问了哪些页面等等。也不太精准,比uv好点,但很多用户手动删了cookie就统计不了了。

并发:每秒网站服务器最大响应的用户请求数?

正确理解:单位时间内,服务器能够同时处理的最大连接数。

查看网站排名、ip、pv的地址:

http://alexa.chinaz.com/?domain=google.com

查看网站排名的地址:

http://www.alexa.com/siteinfo/weibo.com


网站


ip(万)


pv(万)


机器数


www.51cto.com


40


80-100


30台


www.ganji.com


120-150


1000-1200


200


www.58.com


100-12


1600


30-400


www.weibo.com


3000-4000


10000-20000


1000多


www.taobao.com


7000-8000


60000-100000


10000

awstats:抓取ip连接数然后排序,可查出ip连接的情况。

uniq:去重,把重复的行去掉。-c 去重计数。相邻一样的才能去重。

sort:对一个文本的行进行排序。-n按数字排序,-r倒序,-t分隔符,类似awk的-F,cut的-d,-k指定按哪列排序。

awk -F “/” ‘{print $3}’ oldboy.log|sort|uniq -c|sort -nr 去重计数按倒序排列。

时间: 2024-08-04 22:24:22

http与www服务概念详解的相关文章

DNS服务相关概念详解

实验环境:RHEL 32Bit DNS服务相关概念详解 DNS是一种域名解析服务,DNS服务的核心以及DNS服务的标准都是基于一个软件来实现的,这个软件叫做BIND(Berkeley Internet Name Domain),互联网上几乎所有的DNS服务都是由BIND来构建的,虽然也有其它的DNS服务构建标准,但是它们的使用语法以及工作机制都和BIND非常接近. ·Linux服务器和Windows服务器的比较 Linux服务器在没有SELinux的时候它的安全级别和Windows服务器的安全级

varnish基础概念详解

varnish基础概念详解 比起squid更加轻量级,大致有以下几个特点: ·可以基于内存缓存,也可以在磁盘上缓存,但是就算存放在磁盘上,也不能实现持久缓存 只要进程崩溃,此前缓存统统失效,无论是在内存还是在磁盘,但是现在已经具备持久缓存功能,但是仍然在实验阶段,经常容易崩溃,而且最大大小不能超过1G 如果期望内存大小超过几十个G,比如图片服务器,纯粹使用内存,性能未必好,这时候可以使用磁盘进行缓存,或SSD X 2 做RAID 避免磁盘损坏,在实现随机访问上 ssd硬盘要比机械硬盘要好的多,如

SOA概念详解

1.概述 1.1基本定义 SOA(Service-Oriented Architecture)既面向服务的体系结构,是一个组件模型,它将应用程序员的不同功能但是(称为服务)通过定义良好的接口联系起来.SOA建立在Web服务的基础上,它可以看做是B/S模型.XML/Web Service技术之后的自然延伸.SOA将能够帮助我们站在一个新的告诉理解企业级架构中的各种组件的开发.部署形式,它将帮助企业系统架构这以更迅速.更可靠.更具有重用性的性能架构整个业务系统.较之以往,以SOA架构的系统能够更加从

LINUX 信号概念详解

LINUX 信号概念详解 我们运行如下命令,可看到Linux支持的信号列表: # kill -l 1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP 6) SIGABRT 7) SIGBUS 8) SIGFPE 9) SIGKILL 10) SIGUSR1 11) SIGSEGV 12) SIGUSR2 13) SIGPIPE 14) SIGALRM 15) SIGTERM 17) SIGCHLD 18) SIGCONT 19) SIGSTOP

Linux 程序设计学习笔记----终端及串口编程基础之概念详解

转载请注明出处,谢谢! linux下的终端及串口的相关概念有: tty,控制台,虚拟终端,串口,console(控制台终端)详解 部分内容整理于网络. 终端/控制台 终端和控制台都不是个人电脑的概念,而是多人共用的小型中型大型计算机上的概念. 1.终端 一台主机,连很多终端,终端为主机提供了人机接口,每个人都通过终端使用主机的资源. 终端有字符哑终端和图形终端两种. 控制台是另一种人机接口, 不通过终端与主机相连, 而是通过显示卡-显示器和键盘接口分别与主机相连, 这是人控制主机的第一人机接口.

iOS定位服务编程详解

现在的移动设备很多都提供定位服务,使用iOS系统的iPhone.iPod Touch和iPad都可以提供位置服务,iOS设备能提供3种不同途径进行定位:Wifi, 蜂窝式移动电话基站, GPS卫星 iOS 不像Android系统在定位服务编程时,可以指定采用哪种途径进行定位.iOS的API把底层这些细节屏蔽掉了,开发人员和用户并不知道现在设备是采用 哪种方式进行定位的,iOS系统会根据设备的情况和周围的环境,采用一套最佳的解决方案.这个方案是这样的,如果能够接收GPS信息,那么设备优先采用 GP

RAID0 RAID1 RAID3 RAID5 RAID6 RAID10 RAID50概念详解

RAID0 RAID1 RAID3 RAID5 RAID6 RAID10 RAID50概念详解摘要:RAID 0又称为Stripe或Striping(条带卷),它代表了所有RAID级别中最高的存储性能.RAID 0提高存储性能的原理是把连续的数据分散到多个磁盘上存取,这样,系统有数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求.这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性能RAID 1又称为Mirror或Mirroring(镜像卷),它的宗旨是最大

Rsync服务配置详解,实现服务器间数据同步!

1.1 什么是rsync? rsync是Unix下的一款应用软件,它能同步更新两处计算机的文件与目录,并适当利用差分编码以减少数据传输.rsync中一项与其他大部分类似程序或协议中所未见的重要特性是镜像对每个目标只需要一次传送.rsync可拷贝/显示目录属性,以及拷贝文件,并可选择性的压缩以及递归拷贝. 在常驻模式(daemon mode)下,rsync默认监听TCP端口873,以原生rsync传输协议或者通过远程shell如RSH或者SSH伺服文件.SSH情况下,rsync客户端运行程序必须同

Linux vsftpd服务配置详解

[背景] 近日,一朋友domino服务器要进行升级.迁移,搭建了linux测试系统,也开启vsftpd服务,可是配置的ftp账号,程序无法正常下载附件. [问题跟踪] 通过ftp客户端连接工具登录,发现未跳转到ftp账号指定的目录下面. cat /etc/vsftpd.config发现开启了: local_root=/home/test 将此注释重启ftp服务正常. 附录(vsftpd配置详解): vsftpd服务器配置文件"/etc/vsftpd/vsftpd.conf",以此为例.