分布式技术追踪 2017年第十三期

分布式系统实践

1. 阿里HBase超详实践总结

http://dwz.cn/5D5Q21

摘要: 这篇文章详细解释了阿里HBase在跨机房复制, 高可用等方面的工作, 特别是多集群的数据复制方案, 非常值得参考和学习.

2. 龙(Dragon) - facebook 分布式 图索引查询引擎

http://dwz.cn/5FhNVM

摘要: Facebook的Dragon是一个用嵌入式RocksDB作为存储引擎的分布式图数据库索引服务, Dragon运用了很多优化技术将id1和id2的关系和对象数据在同一个物理机上共存使得查询变得更加高效, 满足”好友的生日”这类的查询请求

服务化和虚拟化技术

1. 基于Nginx和Consul构建高可用及自动发现的Docker服务架构

http://dwz.cn/5D5qCQ

摘要: Consul是一款可定制性比较强的开源服务发现组件, 功能完毕, 这篇文章结合Consul Template来兼容已有应用, 构建服务发现系统.

2. Kubernetes 1.6:大规模的多用户、多负载支持

http://dwz.cn/5E81KU

摘要: K8s 1.6于3月28日发布, 支持的节点规模扩充到5000个, 15万个pod, 同时在调度, 存储上还丰富了很多新功能.

高可用技术

1. 技术解读:Facebook开源内存数据库Beringei,如何做到极致的压缩率

http://dwz.cn/5DiAVX

摘要: Facebook开源的Beringei针对时间序列数据的特点, 采用特殊的压缩算法, 可以获取近10倍的存储容量, 查询延时缩短了73倍, 吞吐量提高了14倍, 做度量数据存储的同学不妨参考参考.

丰富多彩的计算机世界

1. 旅游推荐系统的演进

http://dwz.cn/5Dibpl

摘要: 很多产品中都少不了推荐行为, 这篇文章非常详细的介绍了美团酒旅团队的个性化推荐策略, 对推荐系统感兴趣的同学千万不要错过.

2. 百度朱凯华:智能搜索和对话式OS最新技术全面解读

http://dwz.cn/5DI783

摘要: 这篇文章记录了我厂首席架构师朱凯华在上海计算机学会做的演讲, 高屋建瓴的介绍了AI在百度搜索和对话交互中的作用, 非常值得阅读, 推荐给大家.

时间: 2024-11-05 13:11:30

分布式技术追踪 2017年第十三期的相关文章

分布式技术追踪 2017年第二十三期

分布式系统实践 1. 比较Apache Hadoop 生态系统中不同的文件格式和存储引擎的性能 http://dwz.cn/63s0D7 摘要: 这篇文章提出了在Apache Hadoop 生态系统中对比一些当前流行的数据格式和可用的存储引擎的性能:Apache Avro, Apache Parquet, Apache HBase 和 Apache Kudu 空间效率, 提取性能, 分析扫描以及随机数据查找等领域.这有助于理解它们中的每一个如何(何时)改善你的大数据工作负载的处理能力. 2. 谈

分布式技术追踪 2017年第二十二期

分布式系统实践 1. 列式存储的另一面 http://dwz.cn/62D4i5 摘要: 列存是很多数据库的数据存储方式, 可以有效压缩和访问相近的行, 在很多场景下效率都很高. 但是列存也并非没有缺点, 这篇文章总结了列存的几个缺点, 总之还是要根据具体场景来决定使用列存还是行存. 2. 最终一致性Basic-Paxos算法 http://dwz.cn/62ZeBS 摘要: 介绍Paxos协议的文章有很多, 不过这篇文章总体来说解释的非常清楚, 推荐大家阅读. 微服务技术 1. 3万多个实例,

分布式技术追踪 2017年第十四期

分布式系统实践 1. 稳定和性能如何兼顾?58大数据平台的技术演进与实践 http://dwz.cn/5GIKUX 摘要: 本文将为你分享58大数据平台在最近一年半内技术演进的过程,包括:58大数据平台目前的整体架构是怎么样的:最近一年半的时间内我们面临的问题.挑战以及技术演进过程:以及未来的规划. 2. 斗鱼大数据的玩法 http://dwz.cn/5GV3PL 摘要: 这篇文章介绍了斗鱼大数据平台的基本架构, 包括对Hive, Impala, Spark, HBase等经典开源组件的运用,

分布式技术追踪 2017年第十二期

p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 31.2px "Helvetica Neue"; color: #111111 } p.p2 { margin: 0.0px 0.0px 0.0px 0.0px; font: 17.3px "Helvetica Neue"; color: #222222 } p.p3 { margin: 0.0px 0.0px 0.0px 0.0px; font: 17.3px "

分布式技术追踪 2017年第二十四期

分布式系统实践 1. Google和Linkedin的老司机是如何管理海量数据的 http://dwz.cn/66Tkqx 摘要: 一直都听说数据仓库里需要元数据管理, 但是没看见过具体的设计. 这篇文章总结了Google和Linkedin发布的元数据管理系统的论文和开源实现, 值得学习. 2. 聊聊基于Lucene的搜索引擎核心技术实践 http://dwz.cn/62DWZf 摘要: 这篇文章介绍了Lucence的基本原理以及Lucence衍生出来的两个平台级产品Solr和Elastic S

分布式技术追踪 2017年第二十期

分布式系统实践 1. MySQL索引设计背后的数据结构及算法详解 http://dwz.cn/5VOkgp 摘要: 很多同学都知道MySQL的数据库索引采用了B+tree, 但是恐怕不理解其原理. 本文详细介绍了B-tree和B+tree原理以及在MySQL中的运用. 2. 分布式开放消息系统的原理与实践 http://dwz.cn/5Yd5Mz 摘要: 本文详细阐述了阿里开源的分布式消息队列RocketMQ的设计细节, 让我们体会体会RocketMQ的设计独特之处. 微服务技术 1. SRE在

分布式技术追踪 2017年第二十八期

分布式系统实践 1. 给 spark 开发者介绍下Flink :Flink vs Spark http://dwz.cn/6hnu9B 摘要: 当Spark如火如荼的时候, 天上突然掉下了一个Flink. 这篇文章简要的对Spark和Flink进行了对比, 帮助大家认识Flink. 2. sysbench在美团点评中的应用 http://dwz.cn/6i5QUj 摘要: 测试一个数据库的性能是一个加深对数据库原理充分理解的非常好的环节, 这篇文章虽然只介绍了MySQL的测试方法, 其思想也适用

分布式技术追踪 2017年第十九期

分布式系统实践 1. BigData-'基于代价优化'究竟是怎么一回事? http://dwz.cn/5Vq8T8 摘要: 很多同学应该都有认识, SQL的join操作很可能是性能杀手, 如果写的不好, 性能可能会大幅度下降. 很多SQL引擎都尝试进行join的优化, 其中基于代价的优化(CBO)是一种非常有效的手段, 这篇文章深入浅出的介绍了CBO的原理. 2. 从分布式到云端服务:Google Spanner 成长之路 http://dwz.cn/5VjE0v 摘要: 距离 Google 开

分布式技术追踪 2017年第十六期

分布式系统实践 1. 微信高可用分布式数据库PhxSQL设计与实现 http://dwz.cn/5MDqea 摘要: 微信团队的PhxSQL的文章之前也推荐过, 本期再推荐一篇整体介绍PhxSQL的文章, 相关代码已经开源. 2. 以交易系统为例,看分布式事务架构的五大演进 http://dwz.cn/5Nm64k 摘要: 分布式事务在交易系统中普遍存在, 本文总结了实现分布式事务的五大演进, 使我们清晰的了解分布式事务的各种实现原理. 服务化和虚拟化技术 1. Java 微服务框架新选择:Sp