rsync简介
rsync(rem ote synchronize)是一个远程数据同步工具,可通过 LAN/WAN 快速同步多台主机之间的文件。也可以使用 rsync 同步本地硬盘中的不同目录。
rsync是用于替代rcp的一个工具,rsync 使用所谓的 rsync算法进行数据同步,这种算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度非常快。
rsync支持大多数的类 Unix 系统,无论是 Linux、Solaris 还是 BSD上 都经过了良好的测试。 CentOS系统默认就安装了rsync软件包。 此外,在windows平台下也有相应的版本,如cwrsync
rsync特点
rsync 具有如下的基本特性:
- 可以镜像保存整个目录树和文件系统
- 可以很容易做到保持原来文件的权限、时间、软硬链接等
- 无须特殊权限即可安装
- 优化的流程,文件传输效率高
- 可以使用 rsh、ssh 方式来传输文件,当然也可以通过直接的 socket 连接
- 支持匿名传输,以方便进行网站镜象
在使用 rsync 进行远程同步时,可以使用两种方式:远程Shell方式(建议使用 ssh,用户验证由 ssh 负责)和C/S方式(即客户连接远程 rsync 服务器,用户验证由 rsync 服务器负责)。
无论本地同步目录还是远程同步数据,首次运行时将会把全部文件拷贝一次,以后再运行时将只拷贝有变化的文件(对于新文件)或文件的变化部分(对于原有文件)。rsync 在首次复制时没有速度优势,速度不如 tar,因此当数据量很大时您可以考虑先使用 tar 进行首次复制,然后再使用 rsync 进行数据同步。
镜像、备份和归档
实施备份的两种情况:
- 需保留备份历史归档:在备份时保留历史的备份归档,是为了在系统出现错误后能恢复到从前正确的状态。这可以使用完全备份和增量备份来完成。
- 可以使用 tar 命令保存归档文件。
- 为了提高备份效率,也可以使用 rsync 结合 tar 来完成。
- 无需保留备份历史归档:若无需从历史备份恢复到正确状态,则只备份系统最“新鲜”的状态即可。这可以简单地使用 rsync 同步来完成。此时通常称为镜像。镜像可以分为两种:
- 被镜像的目录在各个主机上保持相同的位置。此时一般是为了实施负载均衡而对多个主机进行同步镜像。例如:将主机A的/srv/www 目录同步到主机B的/srv/www目录等。
- 被镜像的目录在各个主机上不保持相同的位置。例如:主机 A 和主机 B 都运行着各自的业务,同时又互为镜像备份。此时主机A的/srv/www目录同步到主机B的/back ups/hosta/www 目录;主机B的/srv/www目录同步到主机A的/back ups/hostb/www 目录等。
rsync命令
rsync是一个功能非常强大的工具,其命令也有很多功能选项。rsync的命令格式为:
1)本地使用: rsync [OPTION...] SRC... [DEST] 2)通过远程 Shell 使用: 拉: rsync [OPTION...] [[email protected]]HOST:SRC... [DEST] 推: rsync [OPTION...] SRC... [[email protected]]HOST:DEST 3)访问 rsync 服务器: 拉: rsync [OPTION...] [[email protected]]HOST::SRC... [DEST] 推: rsync [OPTION...] SRC... [[email protected]]HOST::DEST 拉: rsync [OPTION...] rsync://[[email protected]]HOST[:PORT]/SRC... [DEST] 推: rsync [OPTION...] SRC... rsync://[[email protected]]HOST[:PORT]/DEST
其中:
- SRC: 是要复制的源位置
- DEST: 是复制目标位置
- 若本地登录用户与远程主机上的用户一致,可以省略 [email protected]
- 使用远程 shell 同步时,主机名与资源之间使用单个冒号“:”作为分隔符
- 使用 rsync 服务器同步时,主机名与资源之间使用两个冒号“::”作为分隔符
- 当访问 rsync 服务器时也可以使用 rsync://URL
- “拉”复制是指从远程主机复制文件到本地主机
- “推”复制是指从本地主机复制文件到远程主机
- 当进行“拉”复制时,若指定一个 SRC 且省略 DEST,则只列出资源而不进行复制
下面列出常用选项:
选项 | 说明 |
---|---|
-a,--archive | 归档模式,表示以递归方式传输文件,并保持所有文件属性,等价于 -rlptgoD (注意不包括 -H) |
-r,--recursive | 对子目录以递归模式处理 |
-l,--links | 保持符号链接文件 |
-H,--hard-links | 保持硬链接文件 |
-p,--perms | 保持文件权限 |
-t,--times | 保持文件时间信息 |
-g,--group | 保持文件属组信息 |
-o,--owner | 保持文件属主信息 (super-user only) |
-D | 保持设备文件和特殊文件 (super-user only) |
-z,--compress | 在传输文件时进行压缩处理 |
--exclude=PATTERN | 指定排除一个不需要传输的文件匹配模式 |
--exclude-from=FILE | 从FILE中读取排除规则 |
--include=PATTERN | 指定需要传输的文件匹配模式 |
--include-from=FILE | 从FILE中读取包含规则 |
--copy-unsafe-links | 拷贝指向SRC路径目录树以外的链接文件 |
--safe-links | 忽略指向SRC路径目录树以外的链接文件(默认) |
--existing | 仅仅更新那些已经存在于接收端的文件,而不备份那些新创建的文件 |
--ignore-existing | 忽略那些已经存在于接收端的文件,仅备份那些新创建的文件 |
-b,--backup | 当有变化时,对目标目录中的旧版文件进行备份 |
--backup-dir=DIR | 与-b结合使用,将备份的文件存到 DIR 目录中 |
--link-dest=DIR | 当文件未改变时基于 DIR 创建硬链接文件 |
--delete | 删除那些接收端还有而发送端已经不存在的文件 |
--delete-before | 接收者在传输之前进行删除操作 (默认) |
--delete-during | 接收者在传输过程中进行删除操作 |
--delete-after | 接收者在传输之后进行删除操作 |
--delete-excluded | 在接收方同时删除被排除的文件 |
-e,--rsh=COMMAND | 指定替代 rsh 的 shell 程序 |
--ignore-errors | 即使出现 I/O 错误也进行删除 |
--partial | 保留那些因故没有完全传输的文件,以是加快随后的再次传输 |
--progress | 在传输时显示传输过程 |
-P | 等价于--partial--progress |
--delay-updates | 将正在更新的文件先保存到一个临时目录(默认为 “.~tmp~”),待传输完毕再更新目标文件 |
-v,--verbose | 详细输出模式 |
-q,--quiet | 精简输出模式 |
-h,--human-readable | 输出文件大小使用易读的单位(如,K,M等) |
-n,--dry-run | 显示哪些文件将被传输 |
--list-only | 仅仅列出文件而不进行复制 |
--rsync-path=PROGRAM | 指定远程服务器上的 rsync 命令所在路径 |
--password-file=FILE | 从 FILE 中读取口令,以避免在终端上输入口令,通常在 cron 中连接 rsync 服务器时使用 |
-4,--ipv4 | 使用 IPv4 |
-6,--ipv6 | 使用 IPv6 |
--version | 打印版本信息 |
--help | 显示帮助信息 |
若使用普通用户身份运行rsync命令,同步后的文件的属主将改变为这个普通用户身份。
若使用超级用户身份运行rsync命令,同步后的文件的属主将保持原来的用户身份。
rsync的基本使用
在本地磁盘同步数据
# rsync -a --delete /home /backups # rsync -a --delete /home/ /backups/home.0
在指定复制源时,路径是否有最后的 “/” 有不同的含义,例如:
- /home: 表示将整个 /home 目录复制到目标目录
- /home/:表示将 /home 目录中的所有内容复制到目标目录
使用基于ssh的rsync远程同步数据
1、同步静态主机表文件
# 执行“推”复制同步(centos5 是可解析的远程主机名) [[email protected] ~]# rsync /etc/hosts centos5:/etc/hosts # 执行“拉”复制同步(soho 是可解析的远程主机名) [[email protected] ~]# rsync soho:/etc/hosts /etc/hosts
2、同步用户的环境文件
# 执行“推”复制同步 [[email protected] ~]$ rsync ~/.bash* centos5: # 执行“拉”复制同步 [[email protected] ~]$ rsync soho:~/.bash* .
3、同步站点根目录
# 执行“推”复制同步 [[email protected] ~]$ rsync -avz --delete /var/www [email protected]:/var/www # 执行“拉”复制同步 [[email protected] ~]$ rsync -avz --delete [email protected]:/var/www /var/www
- 使用基于 ssh 的 rsync 同步数据可以使用 -essh 参数,当前的 CentOS 默认指定使用 ssh 作为远程 Shell。若您在其他系统上执行 rsync 命令,为确保使用 ssh 作为远程 Shell,请添加 -essh 参数。
- 通常 rsync 命令在后台以 cron 任务形式执行,为了避免从终端上输入口令需要设置 ssh。ssh 的设置方法请参考安全登录守护进程。
使用--exclude/--include选项
可以使用--exclude 选项排除源目录中要传输的文件;同样地,也可以使用--include 选项指定要传输的文件。
例如:下面的 rsync 命令将 192.168.0.101 主机上的 /www 目录(不包含 /www/logs 和 /www/conf 子目录)复制到本地的/back up/www/ 。
# rsync -vzrtopg --delete --exclude "logs/" --exclude "conf/" --progress [email protected]:/www/ /backup/www/
又如:下面的rsync命令仅复制目录结构而忽略掉目录中的文件。
# rsync -av --include ‘*/‘ --exclude ‘*‘ [email protected]:/www/ /backup/www-tree/
选项--include 和--exclude 都不能使用间隔符。例如:
--exclude "logs/" --exclude "conf/"
不能写成
--exclude "logs/ conf/"