关于系统高可用方面的理解

这方面涉及到的知识怎么说呢, 硬件偏多一点,软件少一点,一般的小公司部署完了,十年8年可能都不会改动一下。

所以一般公司的IT管理人员并不容易熟悉这块。尤其是现在,存储出问题了,厂商来人给你更换,服务器也是如此。

那么是不是很难呢,经过我一系列的了解,结果是,没什么难的。下面我简单扼要的总结一下:

高可用的意思就是尽可能保持系统的不间断使用的可靠性。

比如,你公司有一台服务器,需要24小时不停运转,那么有一天硬件坏了怎么办?

几个方面涉及:

硬件:服务器的硬盘,这是主存数据的地方,要有严格的备份措施。

服务器的其它部件,主要原则是不能成为性能方面的瓶颈。

电源:要有双电源,外加UPS

网络:最好两家提供商,如一家电信,一家网通,这样在网络有问题的时候,至少可以保持可用。

软件:软件方面主要是数据库,数据库的数据备份很重要,这块要展开讲。

先说硬件方面,有如下几个方案:

1,服务器这块可以双机热备,具体实施不难,主要是ha软件这块,比较智能化了现在。市场上比较流行的 rose,seri,nec等等。

2,负载均衡方面,可以利用windows集群,也可以利用硬件和软件。

3,数据备份这块可以采取raid,小企业一般是raid5 或者 raid10, 但要经常查,一旦发现存储报警,要马上更换硬盘。

4,存储也可以冗余,比如做raid5后,再加一块到3块硬盘,做hotspare,就是raid5的备份。

5,服务器里的硬盘同样可以做raid,比如2块,可以做raid1.

6,数据库冗余技术,可以通过复制,镜像来做,但是有延迟,可能还会有丢数据的情况。这一点其实在实际的环境当中,尤其是数据影响不大的公司,完全是可以接受的,因为即使有数据丢失,也是可以补的。如果实在要求严格,如军队之类 ,那只能通过ha镜像软件了。

7,细节方面,硬件方面,双机热备+共享存储模式,开关机顺序要注意。两网卡,心跳线,光纤,存储连接线等等, 要安装好。

总结:按冗余安全级别,网络忽略,我的理解如下:

1,服务器+单块硬盘。数据库不备份。

2,服务器+单块硬盘,数据库定期完整备份。

3,  服务器+单块硬盘,数据库定期完整备份。加每天差异备份。

4,服务器+单块硬盘,数据库定期完整备份。加每天差异备份。加每小时日志备份。

5,服务器+双硬盘变raid1,数据库定期完整备份。加每天差异备份。加每小时日志备份。

6,服务器+双硬盘变raid1,数据库定期完整备份。加每天差异备份。加每小时日志备份,再加同模式异地备份,可以放到局域网其它电脑上。

7,服务器自带硬盘存储数据+存储存储数据。

8,服务器自带硬盘存储数据+存储存储数据。加存储热备,单块或全部。

9,双机热备+共享存储

10,nas 或者sas

11,大数据的话,异地灾备。

写到这,不想 写了,无非是各种方式的叠加。服务器raid配置好后,装好软件后,常检查一下存储的硬盘,查检查一下软件的数据就可以了。

我这里几个地区的服务器都类于das,这么长时间都没有问题。

时间: 2024-10-11 14:45:04

关于系统高可用方面的理解的相关文章

系统高可用

讨论系统高可用时,我们在讨论什么? 系统高可用,或者说系统的可用性,在计算机领域是一个相当久远并且重要的概念.小到CPU芯片.内存.硬盘等硬件组件,大到支付宝.微信等日常互联网服务,在设计.开发.维护的时候,都离不开对它的考量.本文首先介绍跟系统可用性相关的关键概念,然后讨论高可用系统的评价指标. 系统和模块 一个系统的可用性,由组成这个系统的模块的可用性,以及模块之间的关系决定.模块可以看成一个系统,由更小的子模块组成,而系统可以看成一个模块,从而组成更大的系统.所以计算机系统的可用性,可以一

系统高可用与有罪推定论

最新IT圈最火的支付宝与携程,注定要将蓝翔神技与运维逆袭载入史册.无论故障的过程与真实原因如何,都足以让大家对整个生产系统的建设进行反思并加以检讨. 多年以来各设备厂商,解决方案都在强调自身系统可用有多高,可用达到n个9.而这些n个9的SLA承诺通常是在使用统计学上的概念,甚至于在配置了双机或集群的状态下,计算可用性直接将故障率直接相乘,即(1-(1-99%)*(1-99%))=99.99%.这样的算法对于实际工作来说,其实是无意义的. 系统出故障好比中彩票,谈论百分比毫无意义.中了的人就是中了

浅述实现系统高可用,常用的解决手段

所谓可用性,是指某系统能够提供正常服务的特性. 可用性的高低是使用不可用时间占总时间的比例来衡量.不可用时间是从故障发生到故障恢复的时间.比如,可用性 4 个 9 的系统(99.99%),它一年宕机时间不能超过53分钟(=365*24*60*(1-0.9999)).做到高可用系统,需要尽可能的降低故障发生的次数和减少故障持续的时间. 出现系统不可用的原因,一种是人为的,比如发布了有 bug 的代码.不规范的发布流程导致的宕机或者网站访问量过载造成的雪崩等:另一种则是非人为的,由于外部系统和环境的

支付系统高可用架构设计实战

对于互联网应用和企业大型应用而言,多数都尽可能地要求做到7*24小时不间断运行,而要做到完全的不间断运行可以说“难于上青天”. 为此,对应用的可用性程度一般衡量标准有三个9到五个9. 对于一个功能和数据量不断增加的应用,要保持比较高的可用性并非易事.为了实现高可用,付钱拉从避免单点故障.保证应用自身的高可用.解决交易量增长等方面做了许多探索和实践. 在不考虑外部依赖系统突发故障,如网络问题.三方支付和银行的大面积不可用等情况下,付钱拉的服务能力可达99.999%. 本文重点讨论如何提高应用自身的

Linux系统高可用集群软件之Keepalived

Keepalived 集群软件是一个基于VRRP协议来实现的LVS(四层协议)服务高可用方案,可以利用避免单节点故障.LVS服务需要有2台服务器运行Keepalived服务,一台为主服务器(MASTER),一台为备份服务器(BACKUP),但是对外只有一个虚拟IP,主服务器会发送特定的消息给备份服务器,当备份服务器收不到这个消息的时候,备份服务器认为主服务器宕机并会接管虚拟IP提供服务,从而保证了服务的高可用性. 1.环境说明 系统:Centos 6.5 64位 软件:Keepalived ip

Linux系统高可用集群软件之HeartBeat

服务器环境: node1:192.168.1.100    10.0.0.1 node2:192.168.1.102    10.0.0.2 服务:apache 1.配置系统的网络环境 node1节点: (1)配置IP地址 [[email protected] yum.repos.d]# cd /etc/sysconfig/network-scripts/[[email protected] network-scripts]# vim ifcfg-eth0 DEVICE=eth0HWADDR=0

corosync 实现 MariaDB 数据库服务的高可用

方案: corosync + pacemaker  提供HA的解决方案. 使用NFS共享服务器导出的共享文件系统做为数据目录: 拓扑图如下: 一.配置HA高可用集群的各节点间能够基于主机名通讯. 1.设置主机名 (1).在 192.168.60.128 主机设置 编辑/etc/sysconfig/network文件,使得主机名永久有效 [[email protected] ~]# vim /etc/sysconfig/network HOSTNAME=node2.9527du.com 使用hos

Keepalived+LVS+Nginx负载均衡之高可用

Keepalived+LVS+Nginx负载均衡之高可用 上一篇写了nginx负载均衡,此篇实现高可用(HA).系统整体设计是采用Nginx做负载均衡,若出现Nginx单机故障,则导致整个系统无法正常运行.针对系统架构设计的高可用要求,我们需要解决Nginx负载均衡出现单机故障时,系统正常运行的需求.所以系统架构引入Keepalived组件,实现系统高可用. 一.Keepalived介绍 Keepalived是分布式部署系统解决系统高可用的软件,结合LVS(Linux Virtual Serve

高可用集群原理解析

HA(High Avaliablity,高可用)集群的出现是为了使集群的整体服务尽可能可用,从而减少由计算机硬件和软件易错性所带来的损 失.如果某个节点失效,它的备援节点将在几秒钟的时间内接管它的职责. 一.高可用原理简述 我们在要做高可用的节点上安装好实现高可用功能的程序,这些程序最核心的包括两个部分:心跳监测部分和资源管理部分:通过资源管理器的配置接口定义资源,并将配置文件同步到其它节点,节点之间在心跳监测层通过相互发送报文来告诉对方自己当前的状态,如果在指定的时间内未收到对方发送的报文,那