HA集群之DRBD实现MySQL高可用

一、前言

本篇博文只是实现Corosync + Pacemaker + DRBD + MySQL，实现MySQL的高可用。更多的基础知识在前几篇博文中已有涉猎，故更多的理论细节将不再此篇中详述。

若想了解高可用基础知识，请参考：http://hoolee.blog.51cto.com/7934938/1406951

若想了解Corosync + Pacemaker，请参考：http://hoolee.blog.51cto.com/7934938/1409395

若想了解DRBD，请参考：http://hoolee.blog.51cto.com/7934938/1410121

二、实现方式

双节点实现：

node1: 172.16.1.11 node1.hoo.com

node2: 172.16.1.12 node2.hoo.com

vip: 172.16.1.100

三、Corosync + Pacemaker搭建集群环境

1.配置主机名

节点名称很关键，集群每个节的名称都得能互相解析。/etc/hosts中的主机名配置结果必须跟”uname -n”的解析的结果一致。

node1/node2都添加：

node1示例：

# vim /etc/hosts

172.16.1.11 node1.hoo.com node1

172.16.1.12 node2.hoo.com node2

# ifconfig eth0 172.16.1.11 up

# hostname node1.hoo.com

# uname -n

# vim /etc/sysconfig/network //重启才生效，source也不生效

hostname=node1.hoo.com

2.配置node之间SSH互信

node1:

#ssh-keygen -t rsa -f ~/.ssh/id_rsa -P ‘‘

# ssh-copy-id -i .ssh/id_rsa.pub [email protected]

node1:

#ssh-keygen -t rsa -f ~/.ssh/id_rsa -P ‘‘

# ssh-copy-id -i .ssh/id_rsa.pub [email protected]

node1：测试

# ssh node2.hoo.com ‘date’;date

3.同步时间

# crontab -e
*/5* * * * /usr/sbin/ntpdate172.16.0.1 &> /dev/null

4.安装corosync和pacemaker

所有节点均安装

# yum install corosync pacemaker -y

# rpm -ql corosync

//配置目录：/etc/corosync

//配置模板：/etc/corosync/corosync.conf.example

//服务器脚本：/etc/rc.d/init.d/corosync

5.安装资源管理器客户端命令接口工具crmsh

从pacemaker 1.1.8开始，crmsh发展成了一个独立项目，叫crmsh。pacemaker默认不提供命令接口工具，需要单独安装crmsh。

//crmsh依赖pssh

# yum -y install pssh-2.3.1-2.el6.x86_64.rpm

# yum -y install crmsh-1.2.6-4.el6.x86_64.rpm

6.配置主配置文件

[[email protected] ~]# cd /etc/corosync/

[[email protected] corosync]# cp corosync.conf.example corosync.conf

[[email protected] corosync]# vi corosync.conf

compatibility: whitetank #表示是否兼容0.8之前的版本

totem { #图腾，定义集群中各节点中通信机制以及参数

version: 2 #图腾的协议版本号，不修改

secauth: on #安全认证功能是否启用，当使用aisexec时，会非常消耗CPU

threads: 0 #实现认证时的并行线程数，0表示默认配置

interface { # 指定在哪个接口发心跳信息，子模块

ringnumber: 0 #冗余环号，节点有多个网卡是可定义，避免心跳信息成环。

bindnetaddr: 192.168.1.0 #绑定心跳网段

mcastaddr: 226.94.8.8 #心跳组播地址

mcastport: 5405 #心跳组播使用端口

ttl: 1 #表示只向外播一次

}

logging { # 跟日志相关

fileline: off #指定要打印的行

to_stderr: no #是否发送到标准错误输出，即屏幕

to_logfile: yes#记录到日志文件

to_syslog: no #记录到系统日志syslog

logfile: /var/log/cluster/corosync.log #日志文件路径

debug: off #是否启动调试

timestamp: on #是否打印时间戳

logger_subsys { #日志的子系统

subsys: AMF

debug: off

}

service {

ver: 0

name: pacemaker #定义corosync启动时同时启动pacemaker

# use_mgmtd: yes

}

aisexec { #表示启动ais的功能时，以哪个用户的身份运行

#这个块可不定义，corosync默认就是以root身份运行的

user: root

group: root

}

amf { # 跟编程接口相关的

mode: disabled

}

7.生成认证key

用corosync-keygen生成key时，由于要使用/dev/random生成随机数，因此如果新装的系统操作不多，如果没有足够的熵，狂敲键盘即可，随意敲，敲够即可。（关于random使用键盘敲击产生随机数的原理可自行google）

实验演示没有足够的熵，这里将采用投机的方式，生产环境，切切不可。

//投机的认证方式

# mv /dev/random /dev/lala

# ln /dev/urandom /dev/random //将随机数生成器链接至伪随机数生成器

# corosync-keygen //生成密钥文件，用于节点通信，会生成authkey文件

# rm -rf /dev/random //删除链接

# mv /dev/lala /dev/random //还原随机数生成器

8.copy配置给node2

1	`[[email protected] corosync]# scp authkey corosync.conf node2:/etc/corosync/`

9.启动corosync

1 2	`[[email protected] corosync]# service corosync start` `[[email protected] corosync]# ssh node2 "service corosync start"`

10.检查启动情况

//查看corosync引擎是否正常启动

[[email protected] corosync]# grep -e "Corosync Cluster Engine" -e "configuration file" /var/log/messages

//查看初始化节点通知是否正常发出

[[email protected] corosync]# grep TOTEM /var/log/messages

//检查启动过程中是否有错误产生

[[email protected] corosync]# grep ERROR: /var/log/messages | grep -v unpack_resources

//查看pacemaker是否正常启动

[[email protected] corosync]# grep pcmk_startup /var/log/messages

四、安装配置DRBD

1.安装DRBD

node1/node2均安装

//确定内核版本

# uname -r

//安装与版本对应的内核模块和用户空间管理工具

# yum -y install drbd-8.4.3-33.el6.x86_64.rpm drbd-kmdl-2.6.32-431.el6-8.4.3-33.el6.x86_64.rpm

2.配置DRBD

node1

[[email protected] ~]# vim /etc/drbd.conf //查看主配置文件

# You can find an example in /usr/share/doc/drbd.../drbd.conf.example

include "drbd.d/global_common.conf";

include "drbd.d/*.res";

//修改全局配置文件
# vim /etc/drbd.d/global_common.conf
global {   //全局配置
        usage-count no;  #让linbit公司收集目前drbd的使用情况，yes为参加，我们这里不参加设置为no
        # minor-count dialog-refresh disable-ip-verification
}
common {
        handlers {    #处理器
                # These are EXAMPLE handlers only.
                # They may have severe implications,
                # like hard resetting the node under certain circumstances.
                # Be careful when chosing your poison.
                pri-on-incon-degr "/usr/lib/drbd/notify-pri-on-incon-degr.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f";
                // 定义了如果主节点降级了怎么处理的
                pri-lost-after-sb "/usr/lib/drbd/notify-pri-lost-after-sb.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f";
                //这个定义了如果有脑裂了之后找不到主节点怎么处理的
                local-io-error "/usr/lib/drbd/notify-io-error.sh; /usr/lib/drbd/notify-emergency-shutdown.sh; echo o > /proc/sysrq-trigger ; halt -f";
                //定义了一旦本地节点发生IO错误时应该怎么处理
                # fence-peer "/usr/lib/drbd/crm-fence-peer.sh";
                # split-brain "/usr/lib/drbd/notify-split-brain.sh root";
                # out-of-sync "/usr/lib/drbd/notify-out-of-sync.sh root";
                # before-resync-target "/usr/lib/drbd/snapshot-resync-target-lvm.sh -p 15 -- -c 16k";
                # after-resync-target /usr/lib/drbd/unsnapshot-resync-target-lvm.sh;
        }
        startup {    //定义一个节点启动时另一个节点应该怎么做
                # wfc-timeout    //等待另一个节点上线的超时时长
                # degr-wfc-timeout   //等待超时后做降级处理
                # outdated-wfc-timeout  //过期的等待超时
                # wait-after-sb   //脑裂之后等待多长时长
        }
        options {
                # cpu-mask on-no-data-accessible
        }
        disk {
                on-io-error detach;  #同步错误的做法是分离
                # size max-bio-bvecs on-io-error fencing disk-barrier disk-flushes
                # disk-drain md-flushes resync-rate resync-after al-extents
                # c-plan-ahead c-delay-target c-fill-target c-max-rate
                # c-min-rate disk-timeout
        }
        net {
                protocol C;
                cram-hmac-alg "sha1";  #设置加密算法sha1
                shared-secret "mydrbd";  #设置加密key
                # protocol timeout max-epoch-size max-buffers unplug-watermark
                # connect-int ping-int sndbuf-size rcvbuf-size ko-count
                # allow-two-primaries cram-hmac-alg shared-secret after-sb-0pri
                # after-sb-1pri after-sb-2pri always-asbp rr-conflict
                # ping-timeout data-integrity-alg tcp-cork on-congestion
                # congestion-fill congestion-extents csums-alg verify-alg
                # use-rle
        }
        syncer {    # 同步相关的设置
                rate 1000M; #设置重新同步(re-synchronization)速度
        #re-synchronization时候，如果有大量不一致的数据，
        #我们不可能将所有带宽都分配给drbd做re- synchronization，
        #这样会影响对外提提供服务。rate的设置需要考虑IO能力。
        #一般来说，设置网络IO能力和磁盘IO能力中最小者的30%的带宽给re- synchronization是比较合适的（官方说明）
        # drbd还提供了一个临时的rate更改命令，可以临时性的更改syncer的rate 值：
        #drbdsetup /dev/drbd0 syncer -r 100M
        #这样就临时的设置为100M。
        #结束之后，通过
        #drbdadm adjust resource_name 来让drbd按照配置中的rate工作。
        }
}

3.为节点准备磁盘分区

node1/node2都需要准备，分好区不需要格式化，系统能识别就行可

# fdisk /dev/sda //具体不详述

# kpart -af /dev/sda

# partx -a /dev/sda //一次识别不出来，可以多重复几次

4.定义资源

# cd /etc/drbd.d/
# vim mystore.res
resource mystore {            #定义一个资源，用关键字resource；
  on node1.hoo.com {          #on说明在哪个节点上，跟uname -n保持一致
    device    /dev/drbd0;     #在磁盘上表现的drbd叫什么名；
    disk      /dev/sda5;      #所使用的磁盘设备是哪个；
    address   172.16.1.11:7789;  #监听的套接字,默认监听在7789端口上；
    meta-disk internal;         #内部存放metadata
  }
  on node2.hoo.com {
    device    /dev/drbd0;
    disk      /dev/sda5;
    address   172.16.1.12:7789;
    meta-disk internal;
  }
}

5.同步配置文件

1	`# scp global_common.conf mystore.res node2:/etc/drbd.d/`

6.初始化资源

node1/node2均初始化

1	`# drbdadm create-md mystore`

7.启动DRBD服务

node1/node2均启动

1	`# service drbd start`

8.查看启动状态

//以下两种方式均可查看

# cat /proc/drbd

或

# drbd-overview

//初始化后，两个节点均处于Secondary状态

9.选择主节点

将node1提升为主节点

1	`[[email protected] ~]# drbdadm primary --force mystore`

观察

1 2	`# drbd-overview` `//两节点开始同步数据`

10.格式化并挂载

[[email protected] ~]# mke2fs -t ext4 /dev/drbd0

[[email protected] ~]# mkdir /drbd

[[email protected] ~]# mount /dev/drbd0 /drbd

11.测试

//复制文件到DRBD设备

[[email protected] ~]# cd /drbd/

[[email protected] drbd]# cp /etc/inittab /drbd/

//角色转换，将node1降级

[[email protected] ~]# drbdadm secondary mystore

//将node2提升为主

[[email protected] ~]# drbdadm primary mystore

[[email protected] ~]# mkdir /drbd

[[email protected] ~]# mount /dev/drbd0 /drbd

[[email protected] ~]# cd /drbd

[[email protected] ~]# ls

//inittab文件存在

DRBD确定正常工作。

12.将node1的DRBD设置为主节点并挂载，设置MySQL数据目录

//将node2降级
[[email protected] ~]# mount /drbd
[[email protected] ~]# drbdadm secondary mystore
//将node1提升为主
[[email protected] ~]# drbdadm primary mystore

[[email protected] ~]# drbd-overview
  0:web/0  Connected Primary/Secondary UpToDate/UpToDate C r-----
[[email protected] ~]# mkdir /mydata
[[email protected] ~]# mount /dev/drbd0 /mydata/
[[email protected] ~]# cd /mydata/
[[email protected] mydata]# mkdir data
[[email protected] mydata]# chown -R  mysql.mysql /mydata/data/

五、MySQL的安装配置

1.安装MySQL

node1/node2均安装

# tar xf mysql-5.5.33-linux2.6-x86_64.tar.gz -C /usr/local/
# cd /usr/local/
# ln -sv mysql-5.5.33-linux2.6-x86_64 mysql
# chown -R root:mysql /usr/local/mysql/*

2.创建mysql用户mysql组

node1/node2均配置

# groupadd -g 3306 mysql
# useradd -u 3306 -g mysql -s /sbin/nologin -M mysql

3.提供配置文件

[[email protected] ~]# cp /usr/local/mysql/support-files/my-large.cnf /etc/my.cnf
[[email protected] ~]# vim /etc/my.cnf
#增加一行
datadir = /mydata/data

4.初始化MySQL

[[email protected] data]# /usr/local/mysql/scripts/mysql_install_db --datadir=/mydata/data/ --basedir=/usr/local/mysql --user=mysql

5.提供启动脚本

[[email protected] ~]# cp /usr/local/mysql/support-files/mysql.server /etc/init.d/mysqld
[[email protected] ~]# chmod +x /etc/init.d/mysqld

6.启动并测试MySQL

[[email protected] data]# service mysqld start
Starting MySQL..... SUCCESS!
[[email protected] data]# /usr/local/mysql/bin/mysql
//启动成功

7.将node1上mysql配置文件与启动脚本复制到node2上

[[email protected] ~]# scp /etc/my.cnf node2:/etc/
[[email protected] ~]# scp /etc/init.d/mysqld node2:/etc/init.d/

8.关闭mysql并设置开机不启动

[[email protected] ~]# service mysqld stop
[[email protected] data]# chkconfig mysqld off
[[email protected] data]# chkconfig mysqld --list

9.node2上启动并测试MySQL

node2设为主节点

[[email protected] ~]# umount /mydata/
[[email protected] ~]# drbdadm secondary web
[[email protected] ~]# drbd-overview
[[email protected] ~]# drbdadm primary web
[[email protected] ~]# drbd-overview
[[email protected] ~]# mkdir /mydata
[[email protected] ~]# mount /dev/drbd0 /mydata/
[[email protected] ~]# cd /mydata/
[[email protected] mydata]# ll
    //data目录存在

启动测试MySQL

[[email protected] data]# service mysqld start
[[email protected] data]# /usr/local/mysql/bin/mysql
//成功

停止mysql,设置开机不启动

[[email protected] ~]# service mysqld stop
[[email protected] ~]# chkconfig mysqld off
[[email protected] ~]# chkconfig mysqld --list

六、实现高可用

1.关闭drbd并设置开机不启动

node1/node2均设置

# service drbd stop

# chkconfig drbd off

# chkconfig drbd --list

2.添加brbd资源

[[email protected] ~]# crm
crm(live)# configure
crm(live)configure# property stonith-enabled=false    //禁用stonith
crm(live)configure# property no-quorum-policy=ignore  //双节点设置忽略
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# show
crm(live)configure# meta ocf:linbit:drbd   //查看drbd的详细信息
crm(live)configure# primitive mysqlstore ocf:linbit:drbd params drbd_resource=mystore op monitor role=Master interval=30s timeout=20s op monitor role=Slave interval=60s timeout=20s op start timeout=240s op stop timeout=100s
            //定义资源
crm(live)configure# verify
crm(live)configure# master ms_mysqlstore mysqlstore meta master-max=1 master-node-max=1 clone-max=2 clone-node-max=1 notify=”True”
            //定义主资源
crm(live)configure# verify
crm(live)configure# commit

2.添加文件系统资源

定义文件系统资源，让服务器切换时自动挂载

crm(live)configure# primitive drbdfs ocf:heartbeat:Filesystem params device=/dev/drbd0 directory=/mydata fstype=ext4 op monitor interval=30s timeout=40s on-fail-restart op start timeout=60 op stop timeout=60
crm(live)configure# verify
crm(live)configure# commit
//定义排列约束：
crm(live)configure# collocation drbdfs_with_ms_mysqlstore_master inf: drbdfs ms_mysqlstore:Master
        //drbd与文件系统在一起
crm(live)configure# verify
//定义顺序约束：
crm(live)configure# order drbdfs_after_ms_mysqlstore_master mandatory: ms_mysqlstore:promote drbdfs:start
crm(live)configure# show
crm(live)configure# commit

验证：

[[email protected] ~]# crm status

3.添加mysql资源

crm(live)# configure
crm(live)configure# primitive mysqld lsb:mysqld
//定义排列约束
crm(live)configure# colocation mysqld_with_mystore inf: mysqld mystore
crm(live)configure# verify
crm(live)configure# show
crm(live)configure# commit
//定义顺序约束
crm(live)configure# order mysqld_after_mystore mandatory: mystore mysqld
crm(live)configure# verify
crm(live)configure# show
crm(live)configure# commit

验证：

[[email protected] ~]# crm status

4.添加vip资源

crm(live)# configure
crm(live)configure# primitive vip ocf:heartbeat:IPaddr params ip=192.168.1.100 nic=eth0 cidr_netmask=255.255.255.0
//定义排列约束
crm(live)configure# colocation vip_with_ms_mysqldrbd inf: ms_mysqldrbd:Master vip
crm(live)configure# verify
crm(live)configure# show
crm(live)configure# commit

验证：

[[email protected] ~]# crm status

七、测试使用

1.登录mysql

[[email protected] ~]# /usr/local/mysql/bin/mysql
//正常

2.模拟故障

[[email protected] ~]# crm
crm(live)# node standby node1.hoo.com
crm(live)# show

验证：

[[email protected] ~]# crm status

登录测试：

[[email protected] ~]# /usr/local/mysql/bin/mysql
//正常

HA集群之DRBD实现MySQL高可用,布布扣,bubuko.com

时间： 2024-12-28 11:33:14

HA集群之DRBD实现MySQL高可用的相关文章

HA专题: Corosync+Pacemaker+drbd实现MySQL高可用

大纲前言实验拓扑实验环境实验步骤安装前准备工作配置DRBD 配置MySQL 配置Corosync+Pacemaker 测试我遇到的问题总结前言上篇文章我们介绍了drbd的相关原理.编译安装.简单的实现. drbd虽然可以保证数据的可靠性但是我们上次的实现还有很多的缺陷,这次我们将drbd定义为HA集群的一个资源,可以实现让多个节点自动切换drbd的主从模式并结合MySQL实现其数据的高可用实验拓扑实验环境实验步骤安装前准备工作配置一个HA集群的前提需要配置时间同步,

基于Corosync + Pacemaker+DRBD实现MySQL高可用集群

前言在众多的高可用集群解决方案中,除了Heartbeat之外,Corosync也能提供类似于Heartbeat一样的功能,而且目前RedHat官方提供的高可用集群解决方案的程序包都以Corosync为主,所以在未来的日子Corosync会逐渐取代Heartbeat.本文带来的是基于Corosync + Pacemaker+DRBD的MySQL高可用集群解决方案. 相关介绍 Corosync Corosync是从OpenAIS中分支出来的一个项目,它在传递信息的时候可以通过一个简单的配置文件来定

HA集群之DRBD浅析及实现DRBD高可用

一.DRBD概述 DRBD (Distributed Replicated Block Device) 是 Linux 平台上的分散式储存系统. 由内核模组.用户空间工具组成,通常用于高可用性(high availability, HA)集群.其实现方式是通过网络在服务器之间的对块设备(硬盘,分区,逻辑卷等)进行镜像.你可以把它看作是一种网络RAID1. DRBD的工作模式如下图: DRBD工作的位置在文件系统的buffer cache和磁盘调度器之间,数据进入Buffer Cache后,DRB

corosync+pacemaker and drbd实现mysql高可用集群

DRBD:Distributed Replicated Block Device 分布式复制块设备,原理图如下 DRBD 有主双架构和双主架构的,当处于主从架构时,这个设备一定只有一个节点是可以读写的,另外的节点是不可读的,连挂载都不可能,只有一个节点是主的,其它节点都是从的.当做为主主架构时,需要达到几个条件,1.在高可用集群中启用DRBD; 2. 启用分布式文件锁功能,即需要把磁盘格式化为集群文件系统(如GFS2,OCFS2等):3. 把DRBD做成资源. 数据的存储过程: 当某个进程存

HA专题: 使用pacemaker+corosync实现MySQL高可用

HA专题: 使用pacemaker+corosync实现MySQL高可用前言上篇文章我们介绍了使用pacemkaer+corosync实现简单的nginx高可用, 这篇文章我们介绍如何使用pacemaker+corosync实现MySQL高可用, 并且此次我们手动编辑配置文件来实现corosync的配置实验拓扑实验环境主机 IP 功用 node1.anyisalin.com 172.16.1.2 MySQL服务, HA节点 node2.anyisalin.com 172.16.1.3

linux高可用集群heartbeat实现http的高可用

linux高可用集群的种类很多,比如常见的heartbeat,corosync,rhcs,keepalived,这些集群软件的出现为我们的业务生产环境提供了高可用的保证,本文将简单介绍一下用heartbeat的v2版本来处理一个简单的http高可用集群的搭建. 在实现http高可用集群之前,首先至少需要2台主机,并且需要做3点基本的准备工作: 1.设置节点名称,并且集群中的所有节点都能通过节点名称去解析集群中的所有主机.为了集群服务的高可用性,这里选择使用/etc/hosts,而且要保证unam

Linux集群之corosync+pacemaker+drbd实现MySQL高可用

一.drbd简介 drbd即Distributed Replicated Block Device(分布式磁盘块设备),drbd一个基于软件实现的,不共享任何东西,通过复制的方式在存储之间构建所谓镜像模式机制的磁盘,从而使得一个数据可以存储为多份, drbd的核心功能是在内核中实现. 二.drbd原理每一个主机都提供一个块设备,块的大小是一模一样的,当主机上的进程需要存储数据时,需要向内核申请,任何用户空间的进程都没有直接操作硬件的权限,事实上驱动磁盘是在内核靠驱动程序来实现的,任何一个进程存

15套java互联网架构师、高并发、集群、负载均衡、高可用、数据库设计、缓存、性能优化、大型分布式项目实战视频教程

* { font-family: "Microsoft YaHei" !important } h1 { color: #FF0 } 15套java架构师.集群.高可用.高可扩展.高性能.高并发.性能优化.Spring boot.Redis.ActiveMQ.Nginx.Mycat.Netty.Jvm大型分布式项目实战视频教程视频课程包含: 高级Java架构师包含:Spring boot.Spring cloud.Dubbo.Redis.ActiveMQ.Nginx.Mycat

corosync+pacemaker+drbd实现mysql高可用

实验环境: 虚拟机2台安装corosync+pacemaker,使用的操作系统为CentOS6.5. 虚拟机IP:172.16.103.2.172.16.103.3 实验步骤: 前提准备:两台虚拟机时间同步,能够使用/etc/hosts文件基于主机名进行通信. 一.安装corosync + pacemaker: # yum install corosync # yum install pacemaker 二.安装drbd软件包: drbd软件包有两部分组成:内核模块和用户空间的管理工具,在内核版