坑系列 --- 高可用架构的银弹

0. 承上启下

之前那篇文章写出来以后我就觉得会有很多不同的意见,哈哈,那只代表我个人的意见啊,欢迎讨论。

先说说之前那一篇,我举例子举的OA系统,并不是说OA一定要这么设计,只是一种夸张的手法,为了说明后面的完全脱离了业务场景来进行技术架构的设计就是过度设计,并不是说OA系统太简单所以不能这么设计,另外,写PHP效率低也只是打个比方,并非贬低全世界最好的语言,很多人拿这两个来喷实在没必要。

好了,说今天这一篇的正题了,上一篇写了整体架构设计中的过度设计,这篇来说说高可用吧。

1. 迷信架构可以解决高可用,但并没有银弹

高可用,我知道一旦带上这个词,不管写什么都会有人有不同意见,我说说我认为的高可用下的坑吧。

我想很多人理解的高可用就是单台机器挂掉了整个服务不会挂掉,所以写代码的时候使用集群的思想去写代码,比如做成无状态的服务,保证在集群使用的时候无状态,单机故障不影响服务,从而达到高可用的效果。

由这种思想搭建起来的系统很可能长成下面这个样子,我想很多人都看到过这种架构模式吧。

?

首先,这种架构模式本身并没什么问题,而且也确实很好,有服务发现,有集群,单台机器挂掉了还有其他机器可使用,在搜索系统,推荐系统,广告系统,网站后台系统中都在大量使用。

很多人接收到的信息是有了上图的那种架构,那么这个系统就变成了一个高可用的系统了,觉得这种架构模式就是高可用的一颗银弹了。

但实际上,上图的系统解决的主要是下面的两个问题。

  • 数据同步,主要是公共配置这种少量数据的在各个机器间的同步。
  • 服务发现,新增或者减少机器以后,让其他机器能感知得到有新节点加入或者有老节点下线了。

除了上面两个问题以外,最后才是解决所谓的高可用的问题,这里用了所谓两个字,因为我觉得高可用这种东西不是一个架构的模式能解决的,一个高可用的系统是代码级别解决的,不是靠几个开源模块能解决的。

有些人总认为高可用系统有银弹,在各种论坛,会议上看到各种架构,而且基本上都用到了一些成熟的开源软件,所以觉得有了这些以后就可以是一个高可用的系统了,我有zookeeper,那么服务单机挂了,服务照常跑,但实际上然并卵,zookeeper解决的是外部不可控因素导致的机器挂了,比如机器硬盘坏了,网络断了,这种因素导致的服务挂了,zookeeper能解决,你代码出问题导致机器挂了,zookeeper下挂1000台机器也解决不了啊,一般情况下还是一挂全挂。

比如一个分布式的搜索系统,索引分片了,所以有个集群,有50台机器,每个分片大概10台机器,并且机器可以动态增加减少,集群用zookeeper管理,这算高可用系统吗?这可是一个标准的搜索系统的高可用架构,也只能说,在代码优秀的前提下,这个系统高可用了,网络问题和机器硬件问题已经比较难搞挂整个集群了。但一旦代码有个小bug,或者索引数据生成的时候出现了点问题,一般情况下,集群就全挂了,谈何高可用。

高可用没有银弹,你在各处看到的,听到的,学习到的各种高可用架构,他们只会告诉你这个系统架构多么牛逼,用几个框框框住某几个模块,然后告诉你,这个框框里的服务各种突发情况都能自适应,流量洪峰来了线性加机器就能解决,对你来说却是然并卵,他们没有告诉你他们的代码有多牛逼,并且只有在这个前提下才高可用的,想纯粹靠几个框框来架构出一个高可用的系统,那是PPT架构师。

真正的高可用不用纠结架构设计,只需要代码的健壮,健壮的代码加上主备系统设计,不需要其他的,基本上就是一个高可用的系统了,银行的核心数据处理中心加上异地灾备就是这样子的,你敢说他不是高可用的?

所以,写好代码吧,才能高可用,学习架构,更多的只是对提高系统全局性认识的一种补充,高可用的架构不存在,存在的只有高可用的代码

2. 一个栗子

我前段时间看到过这样一个系统,这是一个O2O的创业公司的后台的一个模块,主要功能是给刚打开APP的用户提供一个个性化的推荐页面,外部接入了一些其他系统产生的一些数据。

数据从其他系统推过来以后,先是接入到一个kafka的消息队列,数据进来了以后有一个服务的集群获取这个数据,不同的服务通过kafka不同的topic获取,然后二次加工这些数据,生成一个结构化的个性化数据,把生成的数据存到redis集群中,每个APP用户对应redis中一个key,前面的APP调用API以后,直接从redis集群中获取数据返回,这些个集群都用zookeeper管理的。

这么架构出来,消息队列是为了解决第三方数据推送太猛,做缓存用的,而redis集群其实是为了解决前端APP的高并发访问的。

我先问了一下,消息队列这个集群在其他系统模块也在用,这没问题,大家都要用嘛,部署一个集群也很应该哈。

但是这个redis集群只有这里在用,这里我觉得有点问题了,有必要做个带zookeeper的集群吗?只是为了打开APP的个性化页面,用个redis集群?不是大家共用资源的话,我觉得完全没必要redis集群,一主一备足矣,还容易维护。如果你觉得单机内存不够大,可以用redis2.0,开启VM功能,突破物理内存的限制,redis还能自己在内存保持热点数据。

你说这样是为了解决高并发下的高可用,如果redis挂了,还能自动切换,这么说吧,我觉得一个系统中,排除硬件故障的问题,一般情况下,等你的服务全挂光了,redis也还坚挺着。并且redis的并发能力简直只能用恐怖来形容,单机2,3万的QPS(数据大小2,3kb左右)完全没什么问题,一个创业公司的日活用户量一般情况下也没必要用集群去抗并发吧?

后来,我建议他们把redis集群干掉,换成单机主备的,而且我发现所谓的个性化推荐其实大部分人看到的页面是一样的,这也很好理解,初期没数据的情况下,个性化推荐出来的东西也不够丰富,redis集群的内存使用率其实很低,于是我进一步建议他们用nginx+lua的本地字典来缓存最热的数据,后面挂个redis,变成一个三级缓存(redis本地磁盘,redis内存,nginx本地字典)。如果真的业务量上来了,换成redis集群也很容易,现在就没必要浪费机器资源了,毕竟创业公司嘛。

恩,最后他们冲我投来鄙夷的目光,这架构,人家看不上,万一突然一天用户量暴增怎么办,而且最关键的是人家不差钱,好吧,呵呵。

3. 高可用的银弹在哪?

瞎扯了这么多,有没有高可用的银弹呢?恩,优秀的代码就是一切高可用架构的基石和银弹,优秀的代码加上合理的架构就是高可用的架构,一个高可用的架构不是靠开源软件搭积木来得到的,成熟的开源软件解决的是把一部分本应该你写的代码变得更优秀。

好吧,欢迎大家继续讨论:)

时间: 2024-10-23 03:39:14

坑系列 --- 高可用架构的银弹的相关文章

proxysql 系列 ~ 高可用架构

一 整体架构二 proxysql层    proxysql+keepalived对外提供vip    1  这里有一点要注意,虽然keepalived有脑裂危险,但是对于向proxysql这种无状态中间件确实没什么影响 2  需要维护至少两份配置文件,保证每个节点的配置文件都唯一三 mysql层     mysql+mha做故障转移四 proxysql故障转移原理    0 定义好mysql集群写服务器组合读服务器组的对应关系    1 proxysql监控读mysql的read_only值 

亿级商品详情页架构演进技术解密 | 高可用架构系列

亿级商品详情页架构演进技术解密 | 高可用架构系列 --http://mp.weixin.qq.com/s?__biz=MzAwMDU1MTE1OQ==&mid=210272034&idx=1&sn=3be9d2b53c7fec88716ee8affd2515f8&scene=1&srcid=UfXZNNOVZZyZjQmp0VOh&from=groupmessage&isappinstalled=0#rd 此文是开涛在[三体高可用架构群]之分享内容

【亲述】Uber容错设计与多机房容灾方案 - 高可用架构系列

此文是根据赵磊在[QCON高可用架构群]中的分享内容整理而成.转载请事先联系赵磊及相关编辑. 赵磊,Uber高级工程师,08年上海交通大学毕业,曾就职于微软,后加入Facebook主要负责Messenger的后端消息服务.这个系统在当时支持Facebook全球5亿人同时在线.目前在Uber负责消息系统的构建并推进核心服务在高可用性方向的发展. 前言 赵磊在7月21号的全球架构师峰会深圳站上,做了主题演讲:Uber高可用消息系统构建,对于这个热门主题,高可用架构群展开了热议,大家对分布式系统中的各

mysql数据库高可用架构-----MHA-0.56的详解

大家都知道,任何线上环境,都必须搭载高可用架构,是web的,也要是数据库的,严格来说更是整个架构的高可用. mysql作为时下比较热的数据库,高可用架构更加需求大.不过,以前老旧那一套已经不合时宜,现在用的比较多的就是MHA和PXC了. PXC的优势是做到同写同回滚,达到数据高度一致性,通过一些程序和代码来做第三方分发,可以做到一定程度的读写分离,是个相当不错的高可用解决方案,不过对网络要求比较高,配置也略复杂一些,最好是同一个机房里面做,不过这并不是本文重点,后面找时间再写相关的文章. 本文要

雪球在股市风暴下的高可用架构改造分享

本文根据唐福林老师在“高可用架构”微信群所做的<股市风暴下的雪球架构改造经验分享>整理而成,转发请注明来自微信公众号ArchNotes. 唐福林,雪球首席架构师,负责雪球业务快速增长应对及服务性能与稳定架构优化工作.毕业于北京师范大学,硕士学位.之前曾任微博平台资深架构师,微博技术委员会成员.长期关注并从事互联网服务后端性能及稳定性架构优化工作. 雪球公司介绍 雪球 聪明的投资者都在这里. web 1.0:新闻资讯,股价信息,K线图 web 2.0:SNS 订阅,分享,聊天 web 3.0:移

读书笔记5大型网站的高可用架构

一.网站实现高可用的手段 实现高可用架构的主要手段是数据和服务的冗余备份和失效转移,一旦某些服务器宕机,就将服务切换到其他可用的服务器上,如果磁盘损坏,则从备份的磁盘读取数据 二.可用性度量与考核 首先,不得不说:要保证一个网站永远完全可用几乎是一件不可能完成的任务(Mission Impossible,是不是有点碟中谍的感觉). (1)如何度量网站可用性? 一个神奇的数字—9!你有几个9,就代表了你的可用性.例如QQ可用性达到了4个9:99.99% ①2个9=基本可用 ②3个9=较高可用 ③4

美团点评数据库高可用架构的演进与设想

本文介绍最近几年美团点评MySQL数据库高可用架构的演进过程,以及我们在开源技术基础上做的一些创新.同时,也和业界其它方案进行综合对比,了解业界在高可用方面的进展,和未来我们的一些规划和展望. MMM 在2015年之前,美团点评(点评侧)长期使用MMM(Master-Master replication manager for MySQL)做数据库高可用,积累了比较多的经验,也踩了不少坑,可以说MMM在公司数据库高速发展过程中起到了很大的作用. MMM的架构如下. 如上所示,整个MySQL集群提

【高可用架构】借助Envoy工具发布项目到多台服务器

前言 在上一篇,我们已经成功在开发机上部署了Deploy项目,下面我们继续在开发机上安装Envoy 两台应用服务器的IP 192.168.10.12 192.168.10.18 [高可用架构]系列链接:待部署的架构介绍 演示 安装envoy 全局安装envoy,你也可以安装在当前项目下 composer global require laravel/envoy 在项目的根目录下创建Envoy.blade.php文件,首先我们先来测试一下Envoy是否可以正常工作 # vi Envoy.blade

【高可用架构】用Nginx实现负载均衡(三)

前言 在上一篇,已经用Envoy工具统一发布了Deploy项目代码.本篇我们来看看如何用nginx实现负载均衡 负载均衡器IP 192.168.10.11 [高可用架构]系列链接:待部署的架构介绍 演示 配置应用服务器 首先,需要将上一篇部署的两台应用服务器,都能够单独访问 配置192.168.10.12.192.168.10.18上nginx的config # vi /etc/nginx/config.d/dev.deploy.goods.conf server { listen 80; se