服务器负载均衡数据同步的实现

今天老师讲了服务器的架构,虽然简单,但还是有难点的,还要在此基础上进行扩展。

其中有关于服务器负载均衡时的数据同步,百度过后,看到了前辈们的分享:

利用inotify+rsync实现linux文件批量更新

批量同步、批量更新,这应该是做运维的朋友们经常做的工作,rsync是linux下一款非常强大的同步工具,采用差异同步的方法,只上传文件/文件夹的不同部分,同时可以对上传部分先进行压缩,所以rsync的传输效率是很高的但rsync也有缺点,最大的问题就是每次执行rsync命令都会遍历目标目录,当文件不多时,这没什么问题,一旦文件数到了一定规模,那么每次遍历都会消耗很多资源,如果只对经常改动的目录进行同步,也可以忽略这个问题,如果每次改动的目录多较大,那么就要用到inotify了,Inotify是一种强大的、细粒度的、异步的文件系统事件监控机制,Linux内核从2.6.13 起,加入了对Inotify的支持,通过Inotify可以监控文件系统中的添加、删除、修改、移动等各种事件,但inotify只提供了C语言接口,不方便调用,所以我们需要先安装inotify-tools

一、系统环境:
CentOS_5.7-x86_64
更新源服务器:192.168.9.227
目的服务器:192.168.9.226  192.168.9.228  ... ...

二、目的服务器配置:192.168.9.226 192.168.9.228(rsync服务端):
1、检查rsync是否安装

  1. rpm -qa|grep rsync

如果没有发装,执以下命令进行安装

  1. yum -y install rsync

2、定义rsync配置文件/etc/rsyncd.conf
192.168.9.226:

  1. cat >> /etc/rsyncd.conf << EOF
  2. uid = nobody
  3. gid = nobody
  4. use chroot = no
  5. max connections = 100
  6. timeout = 600
  7. pid file = /var/run/rsyncd.pid
  8. lock file = /var/run/rsyncd.lock
  9. log file = /var/log/rsyncd.log
  10. [web1]
  11. path = /data/www1/
  12. ignore errors
  13. read only = no
  14. list = no
  15. hosts allow = 192.168.9.0/255.255.255.0
  16. auth users = www1
  17. secrets file = /etc/www1.pwd
  18. EOF

192.168.9.228:

  1. cat >> /etc/rsyncd.conf << EOF
  2. uid = nobody
  3. gid = nobody
  4. use chroot = no
  5. max connections = 100
  6. timeout = 600
  7. pid file = /var/run/rsyncd.pid
  8. lock file = /var/run/rsyncd.lock
  9. log file = /var/log/rsyncd.log
  10. [web2]
  11. path = /data/www2/
  12. ignore errors
  13. read only = no
  14. list = no
  15. hosts allow = 192.168.9.0/255.255.255.0
  16. auth users = www2
  17. secrets file = /etc/www2.pwd
  18. EOF

3、rsyncd.conf配置文件详解
uid = nobody      //运行RSYNC守护进程的用户
gid = nobody      //运行RSYNC守护进程的组
use chroot = 0    //不使用chroot
max connections = 0   // 最大连接数,0为不限制
port = 873  //默认端口873

下面这些文件是安装完RSYNC服务后自动生成的文件
pid file = /var/run/rsyncd.pid    //pid文件的存放位置
lock file = /var/run/rsync.lock   //锁文件的存放位置.指定支持max connections参数的锁文件,默认值是/var/run/rsyncd.lock.
log file = /var/log/rsyncd.log    //日志记录文件的存放位置

Timeout = 300
通过该选项可以覆盖客户指定的IP超时时间.通过该选项可以确保rsync服务器不会永远等待一个崩溃的客户端.超时单位为秒钟,0表示没有超时定义,这也是默认值.对于匿名rsync服务器来说,一个理想的数字是600.

Log format = %t %a %m %f %b
通过该选项用户在使用transfer logging可以自己定制日志文件的字段.其格式是一个包含格式定义符的字符串,可以使用的格式定义符如下所示:
%h 远程主机名
%a 远程IP地址
%l 文件长度字符数
%p 该次rsync会话的进程id
%o 操作类型:" send" 或" recv"
%f 文件名
%P 模块路径
%m 模块名
%t 当前时间
%u 认证的用户名(匿名时是null)
%b 实际传输的字节数
%c 当发送文件时,该字段记录该文件的校验码
默认log格式为:" %o %h [%a] %m (%u) %f %l" ,一般来说,在每行的头上会添加" %t [%p] " .在源代码中同时发布有一个叫rsyncstats的perl脚本程序来统计这种格式的日志文件.

#transfer logging = yes
使rsync服务器使用ftp格式的文件来记录下载和上载操作在自己单独的日志中.

syslog facility = local3
指定rsync发送日志消息给syslog时的消息级别,常见的消息级别是:uth, authpriv, cron, daemon, ftp, kern, lpr, mail, news, security, sys-log, user, uucp, local0, local1, local2, local3,local4, local5, local6和local7.默认值是daemon.

模块参数
[web1]   //这里是认证的模块名,在client端需要指定
path = /data/www1/  //需要做镜像的目录,不可缺少!
comment = backup web  //这个模块的注释信息
ignore errors    //可以忽略一些无关的IO错误
read only = yes  //该选项设定是否允许客户上载文件.如果为true那么任何上载请求都会失败,如果为false并且服务器目录读写权限允许那么上载是允许的.默认值为true.
list = no        //不允许列文件
auth users = bak    //认证的用户名,如果没有这行则表明是匿名,此用户与系统无关
该选项指定由空格或逗号分隔的用户名列表,只有这些用户才允许连接该模块.这里的用户和系统用户没有任何关系.如果" auth users" 被设置,那么客户端发出对该模块的连接请求以后会被rsync请求challenged进行验证身份这里使用的challenge/response认证协议.用户的名和密码以明文方式存放在" secrets file" 选项指定的文件中.默认情况下无需密码就可以连接模块(也就是匿名方式).

secrets file = /etc/www1.pwd      //密码和用户名对比表,密码文件自己生成
该选项指定一个包含定义用户名:密码对的文件.只有在" auth users" 被定义时,该文件才有作用.文件每行包含一个username:passwd对.一般来说密码最好不要超过8个字符.没有默认的secures file名,需要限式指定一个(例如:/etc/www1.pwd).注意:该文件的权限一定要是600,否则客户端将不能连接服务器.

hosts allow = 192.168.9.0/255.255.255.0  //允许主机或网段
该选项指定哪些IP的客户允许连接该模块.客户模式定义可以是以下形式:
单个IP地址,例如:192.168.9.227
整个网段,例如:192.168.9.0/24,也可以是192.168.9.0/255.255.255.0
多个IP或网段需要用空格隔开,“*”则表示所有,默认是允许所有主机连接.

hosts deny = 0.0.0.0/0  //禁止主机

4、建立认证文件/etc/www1.pwd ,此文件须与配置文件中指定文件名保持一致
此处格式为:username:password,安全问题,并不建议实际使用中使用root用户
192.168.9.226:

  1. echo "www1:741852" >> /etc/www1.pwd

192.168.9.228:

  1. echo "www2:951753" >> /etc/www2.pwd

并且我们需要设置此文件的权限为600

  1. chmod 600 /etc/www1.pwd
  2. chmod 600 /etc/www2.pwd
  3. chmod 600 /etc/rsyncd.conf

5、建立motd文件(可有可无)
rsyncd.motd记录了rsync服务的欢迎信息,你可以在其中输入任何文本信息,如:

  1. echo "Welcome to use the rsync services!" >> /var/rsyncd.motd

6、启动rsync

  1. /usr/bin/rsync --daemon
  2. echo "/usr/bin/rsync --daemon" >> /etc/rc.local

三、更新源服务器配置:192.168.9.227 (rsync客户端)
1、inotify 可以监视的文件系统事件包括:
IN_ACCESS,即文件被访问
IN_MODIFY,文件被 write
IN_ATTRIB,文件属性被修改,如 chmod、chown、touch 等
IN_CLOSE_WRITE,可写文件被 close
IN_CLOSE_NOWRITE,不可写文件被 close
IN_OPEN,文件被 open
IN_MOVED_FROM,文件被移走,如 mv
IN_MOVED_TO,文件被移来,如 mv、cp
IN_CREATE,创建新文件
IN_DELETE,文件被删除,如 rm
IN_DELETE_SELF,自删除,即一个可执行文件在执行时删除自己
IN_MOVE_SELF,自移动,即一个可执行文件在执行时移动自己
IN_UNMOUNT,宿主文件系统被 umount
IN_CLOSE,文件被关闭,等同于(IN_CLOSE_WRITE | IN_CLOSE_NOWRITE)
IN_MOVE,文件被移动,等同于(IN_MOVED_FROM | IN_MOVED_TO)
注:上面所说的文件也包括目录。

2、安装inotify-tools
在安装inotify-tools前请先确认你的linux内核是否打到了2.6.13,并且在编译时开启了CONFIG_INOTIFY选项,也可以通过以下命令检测

  1. ls /proc/sys/fs/inotify


如果有 max_queued_events,max_user_instances,max_user_watches 三项就说明支持

  1. wget http://cloud.github.com/downloads/rvoicilas/inotify-tools/inotify-tools-3.14.tar.gz
  2. tar xvf inotify-tools-3.14.tar.gz
  3. cd inotify-tools-3.14
  4. ./configure
  5. make;make install

3、编写rsync监控脚本

  1. vi /root/rsync.sh

-m, 即--monitor,表示始终保持事件监听状态。

  1. #!/bin/bash
  2. host1=192.168.9.226
  3. host2=192.168.9.228
  4. src=/data/www/
  5. des1=web1
  6. des2=web2
  7. user1=www1
  8. user2=www2
  9. /usr/local/bin/inotifywait -mrq --timefmt ‘%d/%m/%y %H:%M‘ --format ‘%T %w%f‘ \
  10. -e modify,delete,create,attrib \
  11. ${src} \
  12. | while read file
  13. do
  14. rsync -vzrtopg --delete --progress ${src} ${user1}@${host1}::${des1} --password-file=/etc/www1.pwd &&
  15. rsync -vzrtopg --delete --progress ${src} ${user2}@${host2}::${des2} --password-file=/etc/www2.pwd &&
  16. echo "${files} was rsynced" >> /tmp/rsync.log 2>&1
  17. echo "---------------------------------------------------------------------------"
  18. done

-r, 即--recursive,表示递归查询目录。
-q, 即--quiet,表示打印出监控事件。
-e, 即--event,通过此参数可以指定要监控的事件,常见的事件有modify、delete、create、attrib等
--timefmt:指定时间的输出格式
--format:指定变化文件的详细信息

建立认证文件  (rsync客户端认证文件只用加入密码)

  1. echo "741852" >> /etc/www1.pwd
  2. echo "951753" >> /etc/www2.pwd
  3. chmod 600 /etc/www1.pwd
  4. chmod 600 /etc/www2.pwd
  1. /bin/sh -n /root/rsync.sh  //语法检查
  2. chmod +x /root/rsync.sh
  3. nohup sh /root/rsync.sh &
  4. echo "nohup sh /root/rsync.sh &" >> /etc/rc.local

四、同步测试
在更新源服务器上新建一个文件,运行以下的命令,看文件是否可以正常同步,看有无报错信息

  1. rsync -vzrtopg --delete --progress /data/www1/ [email protected]::web1 --password-file=/etc/www1.pwd

将要更新的文件提交到更新源服务器中,这样就通过inotify+rsync批量的将更新文件同步到所有的目的服务器中,相当方便快捷

服务器负载均衡数据同步的实现

时间: 2024-08-29 23:27:05

服务器负载均衡数据同步的实现的相关文章

LAMP平台基于NFS实现web服务器负载均衡

前言 随着访问量的逐渐增大,一台web服务器可能已经无法满足需求,这就需要增加web服务器的数量了,于是问题就来了:如何保证两台服务器数据同步呢?本文将讲解如何基于NFS实现web服务器的负载均衡及数据同步. NFS服务介绍 NFS(Network File System)网络文件系统,允许一个系统通过网络共享目录和文件,通过使用NFS,用户和程序可以像访问本地文件一样访问远端系统上的文件.NFS本身没有提供数据传输的功能,必须借助于远程过程调用(RPC)协议来实现数据的传输. 配置文件 NFS

公司网络web服务器负载均衡解决方案

公司网络web服务器负载均衡解决方案 随着公司产品业务的推广发展壮大,对服务器的硬件性能.相应速度.服务稳定性.数据可靠性的要求越来越高.今后服务器的负载将难以承受所有的访问.从公司的实际情况,运营成本网络安全性考虑,排除使用价格昂贵的大型服务器.以及部署价格高昂的专用负载均衡设备. DNS轮询负载均衡解决方案虽然成本低廉但是安全性能不是很好,加上公司产品的特殊性需要用户验证的体系,在会话保持方面是一大缺陷,会话保持,如果是需要身份验证的网站,在不修改软件构架的情况下,这点是比较致命的,因为DN

服务器负载均衡基础概念

服务器负载均衡:按字面理解就是将网络流量负载负担.根据不同网络层次可分为二层负载.三层负载.四层负载.七层负载. 三层负载:三层负载最好理解,所以先讲三层负载.三层负载基于IP地址来分担的.对于了解NAT技术的人来说更好理解.一般拓扑如下: 负载设备(SLB)对外提供一个VIP(虚拟IP),客户端通过访问虚IP,SLB将客户端流量调调度服务器端.类似NAT中一对多效果.如客户端C1第一访问VIP调度到服务器A上,第二次访问就调度到服务器B上.我们称这种轮询调度为轮询调度算法,调度规则称为调度算法

PIOLINK服务器负载均衡解决方案设计

PIOLINK服务器负载均衡解决方案设计 系统设计的基本原则 l 实用.先进.安全.可扩展是本系统设计的基本原则 本建议书首先是满足现有和可预见未来几年内的应用要求:其次是考虑在投资增加很少的前提下,选择目前可以提供最先进技术手段的设备和系统方案:最后要考虑实现的安全系统面对应用要有长远发展的能力. l 稳定性和可靠性 对于业务系统的底层传输平台的网络系统必须要保证其工作的可靠性和稳定性,保证常年的不间断运行,这样才能提供及时.准确.可靠的信息支持. l 安全性 安全性是信息系统建设所必须优先解

LVS详解及基于LVS实现web服务器负载均衡

前言 LVS(Linux Virtual Server)Linux虚拟服务器,是一个虚拟的服务器集群系统.本项目在1998年5月由章文嵩博士成立,是中国国内最早出现的自由软件项目之一.通过LVS提供的负载均衡技术和Linux操作系统可实现一个高性能.高可用的服务器群集,从而以低成本实现最优的服务性能. 集群基础 集群简介 集群(Cluster)是一组相互独立的.通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理.一个客户与集群相互作用时,集群像是一个独立的服务器.集群配置是用

Nginx+Tomcat服务器负载均衡实践方案

1.    为何选择Nginx+Tomcat做负载均衡? 1.1. Nginx是什么? Nginx(发音同 engine x)是一款轻量级的Web 服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器,并在一个BSD-like 协议下发行.由俄罗斯的程序设计师Igor Sysoev所开发,供俄国大型的入口网站及搜索引擎Rambler(俄文:Рамблер)使用.其特点是占有内存少,并发能力强,事实上nginx的并发能力确实在同类型的网页服务器中表现较好,中国大陆使用nginx网站用户

inux 下查看服务器负载均衡

linux 下查看服务器负载均衡 uptime 20:57:21 up  9:18,  1 user,  load average: 0.73, 0.66, 0.50 #显示当前用户数,以及最近1 分钟内.5分钟内.15 分钟内系统的平均负载 more /proc/loadavg 0.64 0.64 0.50 2/251 4705 #用于显示系统1秒钟平均负载.5秒钟平均负载.15秒钟平均负载.总作业数.正在运行的作业总数 shell> more /proc/stat cpu  69415 0

多链路及服务器负载均衡原理与设备构建方案

随着互联网的飞速发展,越来越多的商务活动通过互联网完成,网络性能却越来越不能满足日益增多互联网需求.随着因特网用户的急剧增多,用户越来越感受到应答时间延迟和带宽的不足.为了解决这些问题,用户为优化网络环境投入了大量的资金,但结果并未达到预期的效果.用户迫切需一套改善网络系统4S-Stability(安定性).Scalability(扩展性).Speed(高速性).Security(安全性)的最佳解决方案. PIOLINK负载均衡解决方案有两方面的含义:首先,大量的并发访问或数据流量分担到多台节点

LB 服务器负载均衡【旁路部署】

LB旁路部署案例一. 需求 为了实现服务器对外网用户提供服务的可靠性,客户在现网中部署了LB设备,LB采用旁路方式部署,要求外网主机访问时的流量经过LB轮询到内部服务器,一台服务器down机不影响其正常业务.二. 拓扑环境三. 配置思路 配置各个设备ip地址及路由,保证ip可达 配置检测模板 配置ip地址池 配置实服务组,调用检测模板和ip地址池 配置实服务,关联实服务组 配置虚服务器,关联实服务组 测试四. 配置步骤配置脚本如下所示:出口NAT设备配置: sysname NAT # syste