【摘自】http://blog.renren.com/blog/254459622/799372165
浏览器首先查询DNS服务器,将www.taobao.com转换成ip地址。负载均衡的第一步,将你的访问分配到不同的入口,尽可能保证你所访问的入口是所有入口中可能较快的一个。
通过这个入口成功的访问了www.taobao.com的实际的入口ip地址。产生了一个PV,即Page View,页面访问。
一次访问时生成页面给你看的任务便会被分配给其中一台服务器完成。其中最关键的便是LVS,Linux Virtual Server,世界上最流行的负载均衡系统之一,
同一个域名下并发加载的资源数量是有限制的,将上述这些资源文件分布在好多个域名下,变相的绕过浏览器的这个限制,同时也为下文的CDN工作做准备。
不同地区不同网络(电信、联通等)之间互访会非常缓慢,CDN节点,这样便保证了大流量分散已经在各地访问的加速。
如何保证全国各地的CDN节点中都会同步的存在这几张图片供用户使用呢?淘宝开发了分布式文件系统TFS(taobao file system)来处理这类问题。
输入的内容基于一个分词库进行的分词操作。据你输入的搜索词进行你的购物意图分析。
(1)浏览型:(2)查询型:(3)对比型:(4)确定型:
即便是商家多次修改了宝贝详情页,你仍然能够通过‘已买到的宝贝’查看当时的快照。较为重要的是Tair,淘宝自行研发的分布式KV存储方案。
为了快速及时传输同步这些日志数据,淘宝研发了TimeTunnel,用于进行实时的数据传输,交给后端系统进行计算报表等操作。
经过淘宝系统1:120的极限压缩存储在淘宝的数据仓库中。并且通过一个叫做云梯的,由2000多台服务器组成的超大规模数据系统不断的进行分析和挖掘。