LinkedIn架构--2008

在JavaOne 2008的会议上,著名社交网站LinkedIn的开发者做了2个关于LinkedIn网站的架构技术的演讲:

LinkedIn - A Professional Social Network Built with Java Technologies and Agile Practices
LinkedIn Communication Architecture

可以看一下LinkedIn网站的基本情况:

LinkedIn世界顶尖级别流量

2千2百万用户
     每个月4百万独立用户访问
     每天4千万page view
     每天2百万搜索流量
     每天25万邀请发送
     每天1百万的回答提交
     每天2百万的email消息发送



LinkedIn 系统架构

  • 操作系统:Solaris (running on Sun x86 platform and Sparc)
  • 应用服务器:Tomcat and Jetty as application servers
  • 数据库:Oracle and MySQL as DBs
  • 没有ORM,直接用JDBC No ORM (such as Hibernate); they use straight JDBC
  • 用ActiveMQ在发送JMS. (It’s partitioned by type of messages. Backed by MySQL.)
  • 用lucene做搜索Lucene as a  foundation for search
  • Spring做逻辑架构Spring as glue
  • Hudson作为集成测试框架


2003-2005

  • 一个整体的web程序
  • 一个核心数据库
  • 在Cloud中缓存所有network图,Cloud是用来做缓存的独立server。
  • 用lucene做搜索,也跑在Cloud中。

2006架构变动

  • 读写分离:复制另外一个数据库,减少直接load核心数据库,另外一个server来管理非只读数据库的数据更新。
  • 把搜索从Cloud中移出来,单独一个server跑搜索
  • 增加Databus数据总线来更新数据,这是通过分布式更新的核心组件,任何组件都需要Databus

2008架构变动

  • WebApp不再任何事情都它自己做,把业务逻辑分成很多部分,通过server群来做。
  • WebApp仍然提供用户界面给用户,但是,通过server群来管理用户资料,小组等等。
  • 每个服务有自己的域数据库。
  • 新的架构允许其他应用链接LinkedIn,比如增加的招聘和广告业务。



Linked性能指标

  • LinkedIn 集群: web事件跟踪记录和在线寻找
  • 6 nodes, 400  GB of data, 12 clients
  • mixed load  (67 % Get , 33 % Put)
  • Throughput 吞吐量
  • 1433 QPS  (node)
  • 4299 QPS  (cluster)
  • Latency延迟
  • GET
  • 50 % percentile 0.05 ms
  • 95 % percentile 36.07 ms
  • 99 % percentile 60.65 ms
  • PUT
  • 50  % percentile 0.09 ms
  • 95 % percentile 0.41 ms
  • 99 % percentile 1.22 ms


云缓存

  • 图缓存:通过databus更新,关机时持久化到硬盘。
  • 原子型的网络关系缓存:通过云计算构建;与会员用户session绑定。

云缓存大小

  • 22M nodes, 120M edges
  • 需要12GB RAM
  • 在生产环境要跑40个实例
  • 从硬盘重建Cloud一个实例需要8个小时 ,启动开机。
  • 缓存通过C++实现,用JNI调用。

Voldemort

  • 应用在LinkedIn ,不是关系数据库。
  • 是一种带有存储系统的内存缓存。这样就不需要单独缓存了。
  • 云存储:使用Voldemort实现只读 read-only index,使用Hadoop作为数据文件。建立TB级别数据处理 。



数据模型

  • 紧凑的, 压缩的二进制数据
  • 类型是 int, double, float, String, Map, List, Date, etc.
  • 会员数据格式如:
  • {
  • ‘member_id‘: ‘int32‘,
  • ‘first_name‘: ‘string‘,
  • ’last_name‘: ’string’,
  • ‘age’       : ‘int32’
  • }
  • 数据作为一个顺序被序列化的文件保存在 Hadoop
  • 数据格式也作为一个顺序文件保存,
  • 数据schema只读, 动态由Java/Pig 任务读取。
时间: 2024-10-27 10:50:12

LinkedIn架构--2008的相关文章

LinkedIn架构进化简史

LinkedIn创建于2003年,主要目标是连接你的个人人脉以得到更好的的工作机会.上线第一周只有2700个会员,之后几年,LinkedIn的产品.会员.服务器负载都增长非常快. 今天,LinkedIn全球用户已经超过3.5亿.我们每天每秒有上万个页面被访问,移动端流量已占到50%以上.所有这些接口请求都从后台获取,达到每秒上百万级. 那么,我们是怎么做到的呢? 早些年 - Leo LinedIn开始跟很多网站一样,只有一台应用服务做了全部工作.这个应用我们给它取名叫"Leo".它包含

web架构链接汇总

WikiPedia 技术架构学习分享 YouTube 的架构扩展 Internet Archive 的海量存储浅析 LinkedIn 架构笔记 Tailrank 网站架构 Twitter 的架构扩展: 100 倍性能提升 财帮子(caibangzi.com)网站架构 Yupoo! 的网站技术架构 37Signals 架构 Flickr 的访问统计实现以及其他 PlentyOfFish 网站架构学习 Yahoo!社区架构 有关 Alexa 与 AOL 部署集群文件系统 eBay 的存储一瞥 eBa

各大互联网公司架构演进之路汇总 - 分享自@开发者头条

大型网站架构演化历程 Web 支付宝和蚂蚁花呗的技术架构及实践 支付宝的高可用与容灾架构演进 聚划算架构演进和系统优化 (视频+PPT) 淘宝交易系统演进之路 (专访) 淘宝数据魔方技术架构解析 秒杀系统架构分析与实战 腾讯社区搜索架构演进(视频+PPT) 京东峰值系统设计 京东咚咚架构演进 新浪微博平台架构 微博图床架构揭秘 微博推荐架构的演进 当当网系统分级与海量信息动态发布实践 当当网架构演进及规划实现(视频+PPT) LinkedIn架构这十年 Facebook's software a

网站架构资料集(转)

add by zhj:很多文章是转自www.itivy.com,很可惜,这个网站已经无法访问,不过,你可以用Google搜索一下这些文章,另外 各大网站架构总结笔记 也能看到部分转载的原文. 原文:http://www.diguage.com/archives/41.html 扯扯蛋 以前见过零零散散地介绍一些知名网站架构的分析文章.最近D瓜哥也想研究一下各大知名网站的架构.所以,就搜集了一下这方面资料.限于时间问题,这篇文章分享的文章并没有都看完,所以不保证所有文章的质量.另外,如果有朋友发现

推荐系统资料汇总

大数据/数据挖掘/推荐系统/机器学习相关资源Share my personal resources 视频大数据视频以及讲义http://pan.baidu.com/share/link?shareid=3860301827&uk=3978262348浙大数据挖掘系列http://v.youku.com/v_show/id_XNTgzNDYzMjg=.html?f=2740765用Python做科学计算http://www.tudou.com/listplay/fLDkg5e1pYM.htmlR语

平安科技移动开发二队技术周报(第十三期)

平安科技移动开发二队技术周报(第十三期) @author ASCE1885的 Github 简书 微博 CSDN 业界新闻 1)Android曝严重安全漏洞 95%设备受影响 网络安全公司Zimperium研究人员日前表示,他们在Android设备中发现了一处安全漏洞,允许黑客在用户全然不知的情况下远程访问Android设备. 2)2015年第一季度移动安全报告-阿里聚安全 2015年第一季度,安卓平台受病毒感染设备呈上升趋势,感染总量高达2406.6万,平均每7.6台设备就有1台设备染毒. 3

sciense

I hate the word "networking." It must be one of the most overused words in the English language. It gets thrown at you by every person you ask for advice during a job search. I'm as guilty as anyone of using it too much: It's one of the most fre

【Windows】Windows Server 2008 R2:核心基础架构

核心基础架构 Windows Server提供了核心基础架构服务以支持网络的运行.Windows Server技术已经成熟了,其中的角色和功能也同样成熟了.Windows Server 2008 R2继续改进了核心基础架构服务,这些服务一直都是Windows Server的一部分,它们为我们的业务提供了一个稳固的基础.点击以下核心基础架构角色以了解更多: Active Directory(AD) 应用程序和Web服务 可用性和可量测性 备份和恢复-Windows Server Backup Br

SQL SERVER 2005/2008 中关于架构的理解(二)

本文上接SQL SERVER 2005/2008 中关于架构的理解(一)      架构的作用与示例 用户与架构(schema)分开,让数据库内各对象不再绑在某个用户账号上,可以解决SQL SERVER 2000及以前版本中“用户离开公司"问题,也就是在拥有该对象的用户离开公司,或离开该职务时,不必要大费周章地更改该用户所有的对象属于新的用户所有.另外,也可让 DBA 在安装某个套装软件时,设置该套装软件所用的数据库对象都属于某个特定的架构,容易区别.也就是说,在单一数据库内,不同部门或目的的对