分布式技术追踪 2017年第二十三期

分布式系统实践

1. 比较Apache Hadoop 生态系统中不同的文件格式和存储引擎的性能

http://dwz.cn/63s0D7

摘要: 这篇文章提出了在Apache Hadoop 生态系统中对比一些当前流行的数据格式和可用的存储引擎的性能:Apache Avro, Apache Parquet, Apache HBase 和 Apache Kudu 空间效率, 提取性能, 分析扫描以及随机数据查找等领域。这有助于理解它们中的每一个如何(何时)改善你的大数据工作负载的处理能力。

2. 谈谈分布式Aggregation

http://dwz.cn/64bZ6I

摘要: 在大数据SQL引擎中(大体上都是OLAP引擎),Aggregation和Join的计算性能直接影响着查询速度,本文主要介绍了笔者在使用MapReduce和Impala系统中对实现Aggregation操作的理解,最后详细介绍了Impala能够实现高速的单个DISTINCT COUNT查询的原理,希望能够能够对于读者有点帮助和启发.

微服务技术

1. 探索Kubernetes的网络原理及方案

http://dwz.cn/64wpT5

摘要: 虚拟化网络是k8s中最不容易理解的部分, 这篇文章对k8s的网络原理以及常见的解决方案进行了分析和对比, 帮助大家理解网络虚拟化技术.

2. Netflix如何在上万台机器中管理微服务?

http://dwz.cn/65aTVV

摘要: 本文主要介绍了 Netflix OSS 贡献的 Eureka,Hystrix 和 Ribbon,由于篇幅限制,其他的组件将在后续的文章中介绍, 这些开源组件和 Spring Boot/Spring Cloud 都有良好的集成,通过注解的方式配合 Properties 文件,能够解决管理大规模服务时遇到的通用问题。

高可用技术

1. 三篇文章了解 TiDB 技术内幕 —— 谈调度

http://dwz.cn/65aNfa

摘要: 分布式存储系统必须具备高可用, 这篇文章介绍了TiDB实现高可用的技术, 非常值得学习.

2. 阿里高可用的两大法宝

http://dwz.cn/65bmCH

摘要: 这篇文章介绍了阿里实施全链路压测的技术, 供大家参考.

丰富多彩的计算机世界

1. 不要再重复造轮子了,造牢固的地基吧

http://dwz.cn/63BKud

摘要: C++生态发展太缓慢了, 有几个C++程序员没有写过基础库? 这篇文章介绍了整理C++基础库的心得.

2. 代码审查关注什么:SOLID 原则

http://dwz.cn/64wEcm

摘要: SOLID是软件开发中非常重要的五个原则, 这篇文章介绍了代码审查时如何发现并解决违背这五大原则的问题.

时间: 2024-09-29 16:11:20

分布式技术追踪 2017年第二十三期的相关文章

分布式技术追踪 2017年第二十二期

分布式系统实践 1. 列式存储的另一面 http://dwz.cn/62D4i5 摘要: 列存是很多数据库的数据存储方式, 可以有效压缩和访问相近的行, 在很多场景下效率都很高. 但是列存也并非没有缺点, 这篇文章总结了列存的几个缺点, 总之还是要根据具体场景来决定使用列存还是行存. 2. 最终一致性Basic-Paxos算法 http://dwz.cn/62ZeBS 摘要: 介绍Paxos协议的文章有很多, 不过这篇文章总体来说解释的非常清楚, 推荐大家阅读. 微服务技术 1. 3万多个实例,

分布式技术追踪 2017年第十三期

分布式系统实践 1. 阿里HBase超详实践总结 http://dwz.cn/5D5Q21 摘要: 这篇文章详细解释了阿里HBase在跨机房复制, 高可用等方面的工作, 特别是多集群的数据复制方案, 非常值得参考和学习. 2. 龙(Dragon) - facebook 分布式 图索引查询引擎 http://dwz.cn/5FhNVM 摘要: Facebook的Dragon是一个用嵌入式RocksDB作为存储引擎的分布式图数据库索引服务, Dragon运用了很多优化技术将id1和id2的关系和对象

分布式技术追踪 2017年第二十四期

分布式系统实践 1. Google和Linkedin的老司机是如何管理海量数据的 http://dwz.cn/66Tkqx 摘要: 一直都听说数据仓库里需要元数据管理, 但是没看见过具体的设计. 这篇文章总结了Google和Linkedin发布的元数据管理系统的论文和开源实现, 值得学习. 2. 聊聊基于Lucene的搜索引擎核心技术实践 http://dwz.cn/62DWZf 摘要: 这篇文章介绍了Lucence的基本原理以及Lucence衍生出来的两个平台级产品Solr和Elastic S

分布式技术追踪 2017年第二十期

分布式系统实践 1. MySQL索引设计背后的数据结构及算法详解 http://dwz.cn/5VOkgp 摘要: 很多同学都知道MySQL的数据库索引采用了B+tree, 但是恐怕不理解其原理. 本文详细介绍了B-tree和B+tree原理以及在MySQL中的运用. 2. 分布式开放消息系统的原理与实践 http://dwz.cn/5Yd5Mz 摘要: 本文详细阐述了阿里开源的分布式消息队列RocketMQ的设计细节, 让我们体会体会RocketMQ的设计独特之处. 微服务技术 1. SRE在

分布式技术追踪 2017年第二十八期

分布式系统实践 1. 给 spark 开发者介绍下Flink :Flink vs Spark http://dwz.cn/6hnu9B 摘要: 当Spark如火如荼的时候, 天上突然掉下了一个Flink. 这篇文章简要的对Spark和Flink进行了对比, 帮助大家认识Flink. 2. sysbench在美团点评中的应用 http://dwz.cn/6i5QUj 摘要: 测试一个数据库的性能是一个加深对数据库原理充分理解的非常好的环节, 这篇文章虽然只介绍了MySQL的测试方法, 其思想也适用

分布式技术追踪 2017年第二十五期

分布式系统实践 1. 获得PCC性能大赛背后的RocksDB引擎:5分钟全面了解其原理 http://dwz.cn/68s1H8 摘要: RocksDB是Google LevelDB的优化版本, 由facebook开源, 本文简要介绍了RocksDB的特性. 2. 一篇文章掌握Sql-On-Hadoop核心技术 http://dwz.cn/69U8Gv 摘要: 这篇文章对查询引擎的技术总结的很到位, 推荐对查询引擎感兴趣的同学阅读. 微服务技术 1. 微服务入门指南 http://dwz.cn/

分布式技术追踪 2018年第二十期

分布式系统实践 1. TiDB中的混沌实践 https://mp.weixin.qq.com/s/ORKcguLhXVkkr6yionecJg 摘要: 混沌工程可以让我们的分布式系统更健壮. 2. 四个架构设计案例分析及其背后的架构师思维 https://mp.weixin.qq.com/s/FsZUYnfEnDZ0dAsJ3hcA5Q 摘要: 这篇文章从4个实际案例入手, 总结了架构的本质是管理复杂性, 以及抽象, 分层, 分治和演化思维这4种最基本的方法. 资源管理和微服务技术 1. 阿里集

分布式技术追踪 2018年第二十六期

分布式系统实践 1. 十问 TiDB :关于架构设计的一些思考 https://mp.weixin.qq.com/s/m2_Mf0-x_KpPHbnOawyy2A 摘要: 文章描述的这些问题其实也是设计一个分布式存储系统通常需要考虑的问题, 尽管文章以TiDB为背景, 但是仍然对分布式系统的设计有很强的参考价值. 2. 数据库事务隔离标准分析 https://mp.weixin.qq.com/s/kZRARy099VANRfJv21-G9Q 摘要: 数据库的隔离级别是一个复杂的概念, 加上mvc

分布式技术追踪 2017年第二十七期

分布式系统实践 1. 分布式系统中的时间和顺序--关于Spanner中的Linearizability http://dwz.cn/6gcYDC 摘要: 本文主要介绍了分布式系统中 Linearizability 概念,以及它与 Serializability 的区别,并介绍了 Spanner 中是如何通过 TrueTime 来实现 Linearizability. 2. PacificA:微软设计的分布式存储框架 http://dwz.cn/6fZzz6 摘要: PacificA是微软为大规模