LinkedIn架构--2008

在JavaOne 2008的会议上，著名社交网站LinkedIn的开发者做了2个关于LinkedIn网站的架构技术的演讲：

LinkedIn - A Professional Social Network Built with Java Technologies and Agile Practices
LinkedIn Communication Architecture

可以看一下LinkedIn网站的基本情况：

LinkedIn世界顶尖级别流量

2千2百万用户
每个月4百万独立用户访问
每天4千万page view
每天2百万搜索流量
每天25万邀请发送
每天1百万的回答提交
每天2百万的email消息发送

LinkedIn 系统架构

操作系统：Solaris (running on Sun x86 platform and Sparc)
应用服务器：Tomcat and Jetty as application servers
数据库：Oracle and MySQL as DBs
没有ORM，直接用JDBC No ORM (such as Hibernate); they use straight JDBC
用ActiveMQ在发送JMS. (It’s partitioned by type of messages. Backed by MySQL.)
用lucene做搜索Lucene as a foundation for search
Spring做逻辑架构Spring as glue
Hudson作为集成测试框架

2003－2005

一个整体的web程序
一个核心数据库
在Cloud中缓存所有network图，Cloud是用来做缓存的独立server。
用lucene做搜索，也跑在Cloud中。

2006架构变动

读写分离：复制另外一个数据库，减少直接load核心数据库，另外一个server来管理非只读数据库的数据更新。
把搜索从Cloud中移出来，单独一个server跑搜索
增加Databus数据总线来更新数据，这是通过分布式更新的核心组件，任何组件都需要Databus

2008架构变动

WebApp不再任何事情都它自己做，把业务逻辑分成很多部分，通过server群来做。
WebApp仍然提供用户界面给用户，但是，通过server群来管理用户资料，小组等等。
每个服务有自己的域数据库。
新的架构允许其他应用链接LinkedIn，比如增加的招聘和广告业务。

Linked性能指标

LinkedIn 集群: web事件跟踪记录和在线寻找
6 nodes, 400 GB of data, 12 clients
mixed load (67 % Get , 33 % Put)

Throughput 吞吐量
1433 QPS (node)
4299 QPS (cluster)

Latency延迟
GET
50 % percentile 0.05 ms
95 % percentile 36.07 ms
99 % percentile 60.65 ms
PUT
50 % percentile 0.09 ms
95 % percentile 0.41 ms
99 % percentile 1.22 ms

云缓存

图缓存：通过databus更新，关机时持久化到硬盘。

原子型的网络关系缓存：通过云计算构建；与会员用户session绑定。

云缓存大小

22M nodes, 120M edges
需要12GB RAM
在生产环境要跑40个实例
从硬盘重建Cloud一个实例需要8个小时，启动开机。
缓存通过C++实现，用JNI调用。

Voldemort

应用在LinkedIn ，不是关系数据库。
是一种带有存储系统的内存缓存。这样就不需要单独缓存了。
云存储：使用Voldemort实现只读 read-only index，使用Hadoop作为数据文件。建立TB级别数据处理。

数据模型

紧凑的, 压缩的二进制数据
类型是 int, double, float, String, Map, List, Date, etc.
会员数据格式如:
{
‘member_id‘: ‘int32‘,
‘first_name‘: ‘string‘,
’last_name‘: ’string’,
‘age’ : ‘int32’
…
}
数据作为一个顺序被序列化的文件保存在 Hadoop
数据格式也作为一个顺序文件保存，
数据schema只读，动态由Java/Pig 任务读取。

时间： 2024-10-27 10:50:12

LinkedIn架构--2008的相关文章

LinkedIn架构进化简史

LinkedIn创建于2003年,主要目标是连接你的个人人脉以得到更好的的工作机会.上线第一周只有2700个会员,之后几年,LinkedIn的产品.会员.服务器负载都增长非常快. 今天,LinkedIn全球用户已经超过3.5亿.我们每天每秒有上万个页面被访问,移动端流量已占到50%以上.所有这些接口请求都从后台获取,达到每秒上百万级. 那么,我们是怎么做到的呢? 早些年 - Leo LinedIn开始跟很多网站一样,只有一台应用服务做了全部工作.这个应用我们给它取名叫"Leo".它包含

web架构链接汇总

WikiPedia 技术架构学习分享 YouTube 的架构扩展 Internet Archive 的海量存储浅析 LinkedIn 架构笔记 Tailrank 网站架构 Twitter 的架构扩展: 100 倍性能提升财帮子(caibangzi.com)网站架构 Yupoo! 的网站技术架构 37Signals 架构 Flickr 的访问统计实现以及其他 PlentyOfFish 网站架构学习 Yahoo!社区架构有关 Alexa 与 AOL 部署集群文件系统 eBay 的存储一瞥 eBa

各大互联网公司架构演进之路汇总 - 分享自@开发者头条

大型网站架构演化历程 Web 支付宝和蚂蚁花呗的技术架构及实践支付宝的高可用与容灾架构演进聚划算架构演进和系统优化 (视频+PPT) 淘宝交易系统演进之路 (专访) 淘宝数据魔方技术架构解析秒杀系统架构分析与实战腾讯社区搜索架构演进(视频+PPT) 京东峰值系统设计京东咚咚架构演进新浪微博平台架构微博图床架构揭秘微博推荐架构的演进当当网系统分级与海量信息动态发布实践当当网架构演进及规划实现(视频+PPT) LinkedIn架构这十年 Facebook's software a

网站架构资料集（转）

add by zhj:很多文章是转自www.itivy.com,很可惜,这个网站已经无法访问,不过,你可以用Google搜索一下这些文章,另外各大网站架构总结笔记也能看到部分转载的原文. 原文:http://www.diguage.com/archives/41.html 扯扯蛋以前见过零零散散地介绍一些知名网站架构的分析文章.最近D瓜哥也想研究一下各大知名网站的架构.所以,就搜集了一下这方面资料.限于时间问题,这篇文章分享的文章并没有都看完,所以不保证所有文章的质量.另外,如果有朋友发现

平安科技移动开发二队技术周报（第十三期）

平安科技移动开发二队技术周报(第十三期) @author ASCE1885的 Github 简书微博 CSDN 业界新闻 1)Android曝严重安全漏洞 95%设备受影响网络安全公司Zimperium研究人员日前表示,他们在Android设备中发现了一处安全漏洞,允许黑客在用户全然不知的情况下远程访问Android设备. 2)2015年第一季度移动安全报告-阿里聚安全 2015年第一季度,安卓平台受病毒感染设备呈上升趋势,感染总量高达2406.6万,平均每7.6台设备就有1台设备染毒. 3

sciense

I hate the word "networking." It must be one of the most overused words in the English language. It gets thrown at you by every person you ask for advice during a job search. I'm as guilty as anyone of using it too much: It's one of the most fre

【Windows】Windows Server 2008 R2：核心基础架构

核心基础架构 Windows Server提供了核心基础架构服务以支持网络的运行.Windows Server技术已经成熟了,其中的角色和功能也同样成熟了.Windows Server 2008 R2继续改进了核心基础架构服务,这些服务一直都是Windows Server的一部分,它们为我们的业务提供了一个稳固的基础.点击以下核心基础架构角色以了解更多: Active Directory(AD) 应用程序和Web服务可用性和可量测性备份和恢复-Windows Server Backup Br

SQL SERVER 2005/2008 中关于架构的理解(二)

本文上接SQL SERVER 2005/2008 中关于架构的理解(一) 架构的作用与示例用户与架构(schema)分开,让数据库内各对象不再绑在某个用户账号上,可以解决SQL SERVER 2000及以前版本中“用户离开公司＂问题,也就是在拥有该对象的用户离开公司,或离开该职务时,不必要大费周章地更改该用户所有的对象属于新的用户所有.另外,也可让 DBA 在安装某个套装软件时,设置该套装软件所用的数据库对象都属于某个特定的架构,容易区别.也就是说,在单一数据库内,不同部门或目的的对