于是我出了我以前出过的一个大法,把 src 和 dst 目录都 smbmount 到一个 linux 机器上,在 linux 机器上 rsync src dst。奇迹发生了,rsync 了一个晚上数据就全过去了。这个问题自然不一定要用这么诡异的方法解决,我只是很奇怪为啥这么多 Windows 下的软件都会不及一个外来妹 rsync……
今天某人一个 avi 死活放不了,我后来建议她试一试 VLC,居然就能放。 晕啊,难道我们进入共产主义了,要钱的软件做不过免费/开源的软件了.
-------------------------------------------------------
rsync服务器架设
我们在使用服务器发布我们的网站的时候,通常要考虑到文件的备份,而文件的备份比较高效的备份是增加备份,rsync软件就是这样的一个工具。为了实现多个服务器负载均衡,我们需要这几个服务器之间进行数据同步,而rsync软件也能胜任,下面我们来介绍如何架设rsync服务器来达到文件增量备份和数据同步的功能。
什么是rsync
rsync 是一个快速增量文件传输工具,它可以用于在同一主机备份内部的备分,我们还可以把它作为不同主机网络备份工具之用。本文主要讲述的是如何自架rsync服务器,以实现文件传输、备份和镜像。相对tar和wget来说,rsync 也有其自身的优点,比如速度快、安全、高效。
rsync的安装
在CentOS服务器,我们可以执行以下命令安装
yum install rsync
对于debian、ubuntu服务器,则是以下命令
sudo apt-get install rsync
rsync服务器的配置文件rsyncd.conf
下面我们将涉及到三个文件 rsyncd.conf,rsyncd.secrets 和rsyncd.motd。
rsyncd.conf 是rsync服务器主要配置文件。
rsyncd.secrets是登录rsync服务器的密码文件。
rsyncd.motd是定义rysnc 服务器信息的,也就是用户登录信息。
下面我们分别建立这三个文件。
mkdir /etc/rsyncd
注:在/etc目录下创建一个rsyncd的目录,我们用来存放rsyncd.conf 和rsyncd.secrets文件;
touch /etc/rsyncd/rsyncd.conf
注:创建rsyncd.conf ,这是rsync服务器的配置文件;
touch /etc/rsyncd/rsyncd.secrets
注:创建rsyncd.secrets ,这是用户密码文件;
chmod 600 /etc/rsyncd/rsyncd.secrets
注:为了密码的安全性,我们把权限设为600;
touch /etc/rsyncd/rsyncd.motd
注:创建rsyncd.motd文件,这是定义服务器信息的文件。
下一就是我们修改 rsyncd.conf 和rsyncd.secrets 和rsyncd.motd 文件的时候了。
rsyncd.conf文件内容:
# Minimal configuration file for rsync daemon
# See rsync(1) and rsyncd.conf(5) man pages for help
# This line is required by the /etc/init.d/rsyncd script
pid file = /var/run/rsyncd.pid
port = 873
address = 192.168.1.171
#uid = nobody
#gid = nobody
uid = root
gid = root
use chroot = yes
read only = yes
#limit access to private LANs
hosts allow=192.168.1.0/255.255.255.0 10.0.1.0/255.255.255.0
hosts deny=*
max connections = 5
motd file = /etc/rsyncd/rsyncd.motd
#This will give you a separate log file
#log file = /var/log/rsync.log
#This will log every file transferred - up to 85,000+ per user, per sync
#transfer logging = yes
log format = %t %a %m %f %b
syslog facility = local3
timeout = 300
[linuxsirhome]
path = /home
list=yes
ignore errors
auth users = linuxsir
secrets file = /etc/rsyncd/rsyncd.secrets
comment = linuxsir home
exclude = beinan/ samba/
[beinan]
path = /opt
list=no
ignore errors
comment = optdir
auth users = beinan
secrets file = /etc/rsyncd/rsyncd.secrets
密码文件:/etc/rsyncd/rsyncd.secrets的内容格式;
用户名:密码
linuxsir:222222
beinan:333333
注: 这里的密码值得注意,为了安全,你不能把系统用户的密码写在这里。比如你的系统用户 linuxsir 密码是 abcdefg ,为了安全,你可以让rsync 中的linuxsir 为 222222 。这和samba的用户认证的密码原理是差不多的;
rsyncd.motd 文件;
它是定义rysnc 服务器信息的,也就是用户登录信息。比如让用户知道这个服务器是谁提供的等;类似ftp服务器登录时,我们所看到的 linuxsir.org ftp ……。 当然这在全局定义变量时,并不是必须的,你可以用#号注掉,或删除;我在这里写了一个 rsyncd.motd的内容为:
+++++++++++++++++++++++++++
+ linuxsir.org rsync 2002-2007 +
+++++++++++++++++++++++++++
rsyncd.conf文件代码说明
pid file = /var/run/rsyncd.pid
注:告诉进程写到 /var/run/rsyncd.pid 文件中;
port = 873
注:指定运行端口,默认是873,您可以自己指定;
address = 192.168.1.171
注:指定服务器IP地址;
uid = nobody
gid = nobdoy
注:服务器端传输文件时,要发哪个用户和用户组来执行,默认是nobody。 如果用nobody 用户和用户组,可能遇到权限问题,有些文件从服务器上拉不下来。所以我就偷懒,为了方便,用了root 。不过您可以在定义要同步的目录时定义的模块中指定用户来解决权限的问题。
use chroot = yes
用chroot,在传输文件之前,服务器守护程序在将chroot 到文件系统中的目录中,这样做的好处是可能保护系统被安装漏洞侵袭的可能。缺点是需要超级用户权限。另外对符号链接文件,将会排除在外。也就是说,你在rsync服务器上,如果有符号链接,你在备份服务器上运行客户端的同步数据时,只会把符号链接名同步下来,并不会同步符号链接的内容;这个需要自己来尝试;
read only = yes
注:read only 是只读选择,也就是说,不让客户端上传文件到服务器上。还有一个 write only选项,自己尝试是做什么用的吧;
#limit access to private LANs
hosts allow=192.168.1.0/255.255.255.0 10.0.1.0/255.255.255.0
注:在您可以指定单个IP,也可以指定整个网段,能提高安全性。格式是ip 与ip 之间、ip和网段之间、网段和网段之间要用空格隔开;
max connections = 5
注:客户端最多连接数;
motd file = /etc/rsyncd/rsyncd.motd
注:motd file 是定义服务器信息的,要自己写 rsyncd.motd 文件内容。当用户登录时会看到这个信息。
log file = /var/log/rsync.log
注:rsync 服务器的日志;
transfer logging = yes
注:这是传输文件的日志;
[linuxsirhome]
注:模块,它为我们提供了一个链接的名字,链接到哪呢,在本模块中,链接到了/home目录;要用[name] 形式;
path = /home
注:指定文件目录所在位置,这是必须指定的;
auth users = linuxsir
注:认证用户是linuxsir ,是必须在 服务器上存在的用户;
list=yes
注:list 意思是把rsync 服务器上提供同步数据的目录在服务器上模块是否显示列出来。默认是yes 。如果你不想列出来,就no ;如果是no是比较安全的,至少别人不知道你的服务器上提供了哪些目录。你自己知道就行了;
ignore errors
注:忽略IO错误,详细的请查文档;
secrets file = /etc/rsyncd/rsyncd.secrets
注:密码存在哪个文件;
comment = linuxsir home data
注:注释可以自己定义,写什么都行,写点相关的内容就行;
exclude = beinan/ samba/
注:exclude 是排除的意思,也就是说,要把/home目录下的beinan和samba 排除在外; beinan/和samba/目录之间有空格分开 ;
启动rsync 服务器及防火墙的设置
启动rsync服务器
启动rsync 服务器相当简单,–daemon 是让rsync 以服务器模式运行;
/usr/bin/rsync --daemon --config=/etc/rsyncd/rsyncd.conf
rsync服务器和防火墙
Linux 防火墙是用iptables,所以我们至少在服务器端要让你所定义的rsync 服务器端口通过,客户端上也应该让通过。
iptables -A INPUT -p tcp -m state --state NEW -m tcp --dport 873 -j ACCEPT
查看一下防火墙是不是打开了 873端口;
iptables -L
通过rsync客户端来同步数据
rsync -avzP linuxsir@linuxsir.org::linuxsirhome linuxsirhome
Password: 这里要输入linuxsir的密码,是服务器端提供的,在前面的例子中,我们用的是 222222,输入的密码并不显示出来;输好后就回车;
注: 这个命令的意思就是说,用linuxsir 用户登录到服务器上,把linuxsirhome数据,同步到本地目录linuxsirhome上。当然本地的目录是可以你自己定义的,比如 linuxsir也是可以的;当你在客户端上,当前操作的目录下没有linuxsirhome这个目录时,系统会自动为你创建一个;当存在linuxsirhome这个目录中,你要注意它的写权限。
说明:
-a 参数,相当于-rlptgoD,-r 是递归 -l 是链接文件,意思是拷贝链接文件;-p 表示保持文件原有权限;-t 保持文件原有时间;-g 保持文件原有用户组;-o 保持文件原有属主;-D 相当于块设备文件;
-z 传输时压缩;
-P 传输进度;
-v 传输时的进度等信息,和-P有点关系,自己试试。可以看文档;
rsync -avzP --delete linuxsir@linuxsir.org::linuxsirhome linuxsirhome
这回我们引入一个 –delete 选项,表示客户端上的数据要与服务器端完全一致,如果 linuxsirhome目录中有服务器上不存在的文件,则删除。最终目的是让linuxsirhome目录上的数据完全与服务器上保持一致;用的时候要小心点,最好不要把已经有重要数所据的目录,当做本地更新目录,否则会把你的数据全部删除;
rsync -avzP --delete --password-file=rsync.password linuxsir@linuxsir.org::linuxsirhome linuxsirhome
这次我们加了一个选项 –password-file=rsync.password ,这是当我们以linuxsir用户登录rsync服务器同步数据时,密码将读取 rsync.password 这个文件。这个文件内容只是linuxsir用户的密码。我们要如下做;
touch rsync.password
chmod 600 rsync.password
echo "222222"> rsync.password
rsync -avzP --delete --password-file=rsync.password linuxsir@linuxsir.org::linuxsirhome linuxsirhome
注: 这样就不需要密码了;其实这是比较重要的,因为服务器通过crond 计划任务还是有必要的;
让rsync 客户端自动与服务器同步数据
编辑crontab
crontab -e
加入如下代码:
10 0 * * * rsync -avzP --delete --password-file=rsync.password linuxsir@linuxsir.org::linuxsirhome linuxsirhome
表示每天0点10分执行后面的命令。
--------------------------------------------
sersync,基于rsync+inotify实现数据实时同步
前言
提到数据同步就必然会谈到rsync
,一般简单的服务器数据传输会使用ftp/sftp
等方式,但是这样的方式效率不高,不支持差异化增量同步也不支持实时传输。针对数据实时同步需求大多数人会选择rsync+inotify-tools
的解决方案,但是这样的方案也存在一些缺陷(文章中会具体指出),sersync
是国人基于前两者开发的工具,不仅保留了优点同时还强化了实时监控,文件过滤,简化配置等功能,帮助用户提高运行效率,节省时间和网络资源。可靠高效的数据实时同步方式
扩展阅读
基于rsync+sersync的服务器文件同步实战 - http://www.markdream.com/technologies/server/syncfile-by-rsync.shtml
通过 rsync sersync 实现高效的数据实时同步架构 - https://www.cnhzz.com/rsync_sersync/
Rsync+sersync实现数据实时同步 - http://www.cnblogs.com/wjoyxt/p/4581410.html
rsync - https://rsync.samba.org/
inotify-tools - https://github.com/rvoicilas/inotify-tools
sersync - http://code.google.com/p/sersync/
原理
Synchronize files and folders between servers -using inotiy and rsync with c++ 服务器实时同步文件,服务器镜像解决方案
sersync
主要用于服务器同步,web镜像等功能。基于boost1.43.0,inotify api,rsync command.开发。目前使用的比较多的同步解决方案是inotify-tools+rsync
,另外一个是google开源项目Openduckbill
(依赖于inotify- tools),这两个都是基于脚本语言编写的。相比较上面两个项目,本项目优点是:
- sersync是使用c++编写,而且对linux系统文件系统产生的临时文件和重复的文件操作进行过滤(详细见附录,这个过滤脚本程序没有实现),所以在结合rsync同步的时候,节省了运行时耗和网络资源。因此更快。
- 相比较上面两个项目,sersync配置起来很简单,其中bin目录下已经有基本上静态编译的2进制文件,配合bin目录下的xml配置文件直接使用即可。
- 另外本项目相比较其他脚本开源项目,使用多线程进行同步,尤其在同步较大文件时,能够保证多个服务器实时保持同步状态。
- 本项目有出错处理机制,通过失败队列对出错的文件重新同步,如果仍旧失败,则按设定时长对同步失败的文件重新同步。
- 本项目自带crontab功能,只需在xml配置文件中开启,即可按您的要求,隔一段时间整体同步一次。无需再额外配置crontab功能。
- 本项目socket与http插件扩展,满足您二次开发的需要。
针对上图的设计架构,这里做几点说明,来帮助大家阅读和理解该图
1 ) 线程组线程
是等待线程队列的守护线程,当事件队列中有事件产生的时候,线程组守护线程就会逐个唤醒同步线程。当队列中 Inotify 事件较多的时候,同步线程就会被全部唤醒一起工作。这样设计的目的是为了能够同时处理多个 Inotify 事件,从而提升服务器的并发同步能力。同步线程的最佳数量=核数 x 2 + 2。
2 ) 那么之所以称之为线程组线程
,是因为每个线程在工作的时候,会根据服务器上新写入文件的数量去建立子线程,子线程可以保证所有的文件与各个服务器同时同步。当要同步的文件较大的时候,这样的设计可以保证每个远程服务器都可以同时获得需要同步的文件。
3 ) 服务线程的作用有三个:
- 处理同步失败的文件,将这些文件再次同步,对于再次同步失败的文件会生成 rsync_fail_log.sh 脚本,记录失败的事件。
- 每隔10个小时执行 rsync_fail_log.sh 脚本一次,同时清空脚本。
- crontab功能,可以每隔一定时间,将所有路径整体同步一次。
4 ) 过滤队列
的建立是为了过滤短时间内产生的重复的inotify信息,例如在删除文件夹的时候,inotify就会同时产生删除文件夹里的文件与删除文件夹的事件,通过过滤队列,当删除文件夹事件产生的时候,会将之前加入队列的删除文件的事件全部过滤掉,这样只产生一条删除文件夹的事件,从而减轻了同步的负担。同时对于修改文件的操作的时候,会产生临时文件的重复操作。
角色
注意主从配置的区别,记得调整SELinux和防火墙
iptables配置实践 - https://wsgzao.github.io/post/iptables/
LTMP手动编译安装以及全自动化部署实践 - https://wsgzao.github.io/post/ltmp/
- 服务器A(主服务器)
- 服务器B(从服务器/备份服务器)
- rsync默认TCP端口为873
服务器B
1 | #在服务器B上安装rsync |
服务器A
1 | #安装rsync |
1 |
|
1 | #运行sersync |
GitHub源码仓库
1 | file://E:\sersync (0 folders, 3 files, 1.88 MB, 1.88 MB in total.) |
sersync - https://github.com/wsgzao/sersync
from https://wsgzao.github.io/post/sersync/
rsync的使用
rsync
是一个文件同步工具,rsync
在同步的时候,只同步发生变化的文件或者目录(每次发生变化的数据相对整个同步目录数据来说是很小的,rsync在遍历查找比对文件时,速度很快),因此,效率很高。rsync
有两种工作模式,客户端和服务器端,即rsync的客户端和服务器端是同一个程序,名字都叫rsync
,你用它启动了服务作为守护进程,它就是一个服务器端,你没启动服务,而是直接调用它的命令,那么它就是客户端。方案讨论
rsync
的工作模式分为客户端从服务器端下载文件(pull操作),或者客户端把文件推送到服务器端(push操作),所以我们要讨论一个问题,A、B谁做客户端,谁做服务器端?假设A做服务器端,B做客户端,那么B要从A中同步文件,就要启动定时任务,每隔一段时间执行一次同步命令,该命令会把A中的变化数据同步过来(实际上是做rsync客户端做pull操作)。
假设A做客户端,B做服务器端,A定时运行同步命令,把变化文件推送到B(rsync客户端做push操作)
假设我们还有C、D两台服务器也要从A同步文件,也就是B、C和D都从A同步文件,假设用方案一,那么B、C和D都要设置一个定时任务,定时从A中拉取文件进行同步,但这有一个问题,无法实时同步,因为B、C和D都不知道A什么时候更新了文件,只能定时去同步。
rsync
守护进程),而客户端只有一个,就是A。假如我们在A中添加定时任务,定时执行同步命令,把A中的文件推送到B、C和D,那感觉和方案一没什么区别,也是无法实时同步文件。sersync
来检测哪些文件更新了,然后用sersync
调用rsync
的同步命令,把更新变化的文件推送到B、C、D服务器。另外,还可以用git hooks,svn hooks,即所谓的钩子,即把A作为发布机,git/svn在上面更新文件后,可以“顺便”调用一下
rsync
同步命令,这样就能做到每次发布的时候“顺便”把文件也同步到B、C和D了。配置rsync服务器端
rsync
服务器端,,由于是开虚拟机做实验,为了方便,我们把D去掉,只配置三台,因为B、C、D的配置是一样的,我们假设三台服务器分别为:A:10.37.129.5(rsync客户端)
B:10.37.129.6(rsync服务器端)
C:10.37.129.7(rsync服务器端)
man rsync
查看还有什么选项可用。use chroot = no
如果为yes, rsync会首先进行chroot设置,将根映射在path参数路径下,对客户端而言,系统的根就是path参数指定的路径。但这样做需要root权限,并且在同步符号连接资料时只会同步名称,不会同步内容,所以我们一般设置为no。.secrets
结束还是.password
结束都无所谓,你不写后缀,或者你以abc
结束都没问题,只要引用的时候用相同的名字引用就行,只是我们写成.secrets
和.password
方便自己知道这是个什么文件。600
:600
:曾经被坑过,C机(同步目标机)的
/etc/rsyncd.secrets
的所有者和所属组不是root:root
结果导致A机的lsyncd启动不了,因为无法连接B机,不要以为你在C机是用root启动rsyncd就没事,权限还是会有问题。centos7默认防火墙:
rsync客户端
- 该命令意思是把
/data/wwwroot
目录的数据,同步到10.37.129.6
服务器的wwwroot
模块下(至于该模块是对应哪个目录,rsyncd.config里有指定)。 xiebruce
是认证用户名(对应服务器的auth users指定的用户名的其中一个用户名即可)--partial
是指不要删除那些“由于各种原因只传了一部分(即没传完)的文件”,以便后面重新开始传输时,继续传输剩下未传的部分,其实也就是我们所说的“断点续传”,所以--partial
选项必须要加上,如果有单个文件上百M,你也不希望传了80多M后断了,然后重新传吧?--delete
表示删除只存在于rsync服务器端(这里指B服务器)的文件(也就是客户端没有而服务端有的文件,不想删除就不要指定该选项)。--password-file
指定密码文件,否则需要手动输入。-avz
这是多个选项-a
指archive,意为归档,打包(注意打包是打包,并不是压缩,打包只是把多个文件打包成一个文件)。-v
指verbose,在各种linux命令中都是很常见选项,指输出详情。-z
指compress,即压缩后再传输(这才是压缩,前面的-a
是打包)
1. 无法实时同步,必须等10分钟,对于紧急修复bug的更新也无法及时同步。
2. 每次同步rsync都需要扫描整个目录有哪些文件变化了(因为变化的文件才会同步),如果文件数量多达上百万文件的话(对于一些框架,这个文件数量并不奇怪,比如node_modules目录),但有时候文件可能只有一个文件变化了而已,所以这样无意义的扫描只是在做无用功,增加服务器的负担。
sersync
可以帮我们解决rsync扫描文件过多的问题。sersync的使用
sersync
是国人写的一个软件,可以记录下被监听目录中发生变化的(包括增加、删除、修改)具体某一个文件或某一个目录的名字。github:https://github.com/wsgzao/sersync
官方博客,因为是个人写的,所以也就是一个个人博客,并没什么详细的说明:https://wsgzao.github.io/post/sersync/
Inotify
是一个Linux内核特性,它监控文件系统,并且及时向专门的应用程序发出相关的事件警告,比如删除、读、写和卸载操作等。您还可以跟踪活动的源头和目标等细节,sersync
正是通过Inotify
这个Linux系统特性来工作的。sersync
之前,有一个叫Inotify-tools
的工具,也是基于系统的inotify的,但是Inotify-tools
只能监控指定的目录是否发生变化,进而自动执行事先编写好的rsync同步命令,至于要同步哪些文件,Inotify-tools
没有告诉rsync,rsync只能自己去扫描,所以这跟定时同步其实没有太大区别,只是比定时同步更加实时而已,但还是无法解决rsync扫描文件做无用功的问题,因为我前面也说了,有可能只是一个文件发生了变化而已,有可能只是加了个英文句点而已,如果说加一个句点导致rsync去扫描100万个文件就是为了找出哪个文件增加了一个句点,那这也太浪费资源了,做的都是无用功。使用sersync
sersync
,当文件变化时,sersync变会自动拼接一个rsync命令并执行,从而完成文件同步。sersync减少rsync扫描的原理,是用rsync的--include
参数直接告诉rysnc要同步哪些文件,从而rsync只会扫描这些指定的文件,而不会扫描整个同步目录。GNU-Linux-x86
|-- confxml.xml
`-- sersync2
GNU-Linux-x86
目录下的两个文件(不包括目录本身)移动到/usr/local/sersync
目录中,目录结构如下:sersync
服务:.log
,而叫.sh
呢?/tmp/rsync_fail_log.sh
文件的内容。/tmp/rsync_fail_log.sh
文件中,并且每隔timeToExecute
分钟执行一次(注意这个单位是min)。-v
那你就加上-v
)。df -Th
来查看文件系统是什么格式,通常来说linux有两种文件系统,一种是以前用的ext4
,一种是新的xfs。
1.查看帮助:
-r
参数运行sersync,将本地与远程整体同步一次。如果设置了过滤器,即在xml文件中,filter为true,则暂时不能使用-r
参数进行整体同步。-r
参数将会无效。confxml.xml
文件:./sersync -n 5
指定线程总数为5,如果不指定,默认启动线程池数量是10,如果cpu使用过高,可以通过这个参数调低,如果机器配置较高,也可以适当把该参数调高:1. https://www.cnblogs.com/regit/p/8074221.html
2. http://blog.51cto.com/liubao0312/1677586
3. http://www.codesky.net/article/201207/171024.html
部署lsyncd+rsync实现服务器文件实时同步
简述如何同步
A:安装lsyncd+rsync,并运行lsyncd服务;
B:只需要安装rsync,并运行rsyncd服务;
Lsyncd是什么?
官方文档:Lsyncd – Live Syncing (Mirror) Daemon
rsync.
Lsyncd的三种同步模式
- default.rsync
- default.rsyncssh
- default.direct
首先,你需要知道rsync的基本用法,以下的rsync命令就可以把文件从本地的“/data/wwwroot”目录推送到远程的“xiebruce@10.37.129.6::wwwroot/”目录中,运行在“rsync同步模式”的lsyncd正是通过组装类似这样的命令来同步文件的:
1. 实时同步。
2. 减少rsync扫描文件带来的延时和性能损耗。
--include-from=FILE
之类的选项来指定要同步哪些文件,这样可以达到“减少rsync扫描文件带来的延时和性能损耗”。.
,如果没有lsyncd告诉rsync改变的是这个文件,那rsync就要去扫描100万个文件来找出这个仅仅多了一个.
的文件,虽然rsync的查找效率很高,但这个查找是非常没有必要的,这就是为什么lsyncd能“减少rsync扫描文件带来的延时和性能损耗”。明白了rsync同步模式,就不难明白rsyncssh模式,因为rsync本身就是有ssh模式的,lsyncd同样是负责监听哪些文件变化了,然后组装rsync同步命令进行同步。
├── dir1
│ ├── aa.txt
│ ├── bb.txt
│ └── cc.txt
└── dir2
└── dd.txt
├── dir1
│ └── aa.txt
└── dir2
├── bb.txt
├── cc.txt
└── dd.txt
mv
命令直接移动到dir2目录,A机没有向B机传任何数据,效率显而易见(特别是移动的数据特别多的时候更明显)。这个模式用于本地的两个目录之间同步,不用于远程服务器同步。lsyncd同样是监听文件变化事件,然后把变化的文件从源目录同步到目标目录,同步的命令,就是linux系统本身的命令,比如
cp
、rm
、mv
,增加了文件用cp拷过去,删除了文件,那边也用rm删除,移动了文件,那边也用mv移动。安装lsyncd
apt-get
,Mac用brew install
等等:/etc/lsyncd.conf
,另外还有些配置的例子在/usr/share/doc/lsyncd-2.2.2/examples
下:├── lalarm.lua
├── lbash.lua
├── lecho.lua
├── lftp.lua
├── lgforce.lua
├── limagemagic.lua
├── lpostcmd.lua
├── lrsync.lua
├── lrsyncssh.lua
└── lsayirc.lua
/etc/lsyncd.conf
也可以写成/etc/lsyncd.lua
,因为它本身就是用lua(一种脚本语言)写配置的,所以,在配置里写注释的时候,要使用lua语言的注释符号,即两个横杠--
。Lsyncd配置文件详解
--
。- settings:lsyncd本身的一些设置,比如日志文件路径,同步进程数,是否后台运行等等。
- sync:同步相关的设置,比如从哪同步到哪,要忽略哪些文件,多久同步一次等等
- rsync:这部分是在
sync
里面的,它主要配置rsync本身的一些选项。
- 配置Settings:The Configuration File
- 配置sync和rsync:Config Layer 4: Default Config
/etc/lsyncd.conf
中的默认内容没什么价值,可以全部删除,下边我们来讲解配置文件要怎么写。- target = “xiebruce@10.37.129.6::wwwroot”,为什么这么写?因为这是rsync的同步地址格式,10.37.129.6是rsync服务器端的ip,xiebruce是服务器端配置的用户名,wwwroot是服务器端的模块名,具体请查看:rsync的使用。
- password_file = “/etc/rsyncd.password”,rsyncd.password中的内容到底是什么?其实非常简单,就是一个字符串(比如:123456,你也不用写password=123456,就直接写123456即可),是服务器端的密码(rsync服务器端可以配置账号和密码),文件名不是说非得
.password
结尾,因为这就是文本文件,有后缀,没后缀,后缀名是什么都无所谓,整个文件名是什么也无所谓,只要你在配置文件里使用的时候,把绝对路径放进去即可。
exclude
再可以用excludeFrom
来代替,这样就可以在外部文件单独写要排除同步的文件:/etc/lsyncd_exclude.lst
的写法:.svn
Runtime/*
Uploads/*
/bin/foo/bar
匹配规则foo
。– 如果规则以
/
开始,那么只匹配路径的开始如果规则以
/
结束,那么只匹配路径的结束–
?
匹配任何不是/
的字符–
*
匹配0或多次非/
字符–
**
匹配任何字符0或多次。rsync服务器端配置
开放端口
启动lsync服务
-log Exec
表示记录所有进程的日志(因为如果maxProcesses
大于1就会有多个同步进程)21:46:54 Normal: --- Startup, daemonizing ---
root 5238 7.7 0.6 13348 3340 ? Ss 21:46 0:15 lsyncd /etc/lsyncd.conf
systemctl
命令来启动:相比rsync,主要修改的有以下几点:
- settings中的maxProcesses必须为1,否则无法启动,并报以下错误:
Error: error preparing /etc/lsyncd.conf: /etc/lsyncd.conf:69: default.rsyncssh must have maxProcesses set to 1.
- rsync中的
password_file
去掉(或注释掉),因为ssh已经不需要用rsync的password来验证了。 - sync添加一个host,格式就是ssh登录的格式(即:username@12.34.56.78这样的格式)
- 把target改成targetdir,值的格式就是目标服务器的绝对地址,比如:
/data/wwwroot/
(最后一个斜杠可要可不要,最好要,因为这样一看就知道是目录)。 - host指定的ssh登录用户需要具有targetdir指定的目录的权限,如果启动不了请尝试用root,并且设置该用户免密登录:Linux-使用ssh免密码登录,不配置免密码登录将会无法启动。
- 免密码登录需要注意:假设你A机使用root启动lsyncd(其实基本上都得用root),而你host=zhangsan@12.34.56.78(B机),那么你必须保证A机能在root用户下
ssh zhangsan@12.34.56.78
能无密码登录,因为很可能你A机有个用户叫lisi
,并且你在“lisi”用户下能免密登录“ssh zhangsan@12.34.56.78”,而在root用户下不能免密登录“ssh zhangsan@12.34.56.78”,那么你一样无法启动,原因是你是在root用户下启动的,你就必须让root能免密登录B机。 - host指定ssh用户,必须与目标文件夹需要的用户相同,比如很多时候,wwwroot网站目录我们都使用
www:www
这样的用户和组,所以你就必须用这个用户来同步,否则同步后创建出来的文件并不是这个权限,权限不对则网站可能会出问题。
ssh zhangsan@10.37.129.6
,最多再加个-p
指定一下端口,但其实ssh还有很多选项,比如ssh -l xiebruce root@10.37.129.6
就表示,我虽然是用root去登录,但用-l
(login的缩写)指定了登录的用户,所以最终会以xiebruce
用户进行登录,而-i
(identify的缩写)则表示指定私钥(身份认证文件),通常是为了免密码登录服务器,原因很简单,这个同步不可能每次让你输入密码,所以需要免密码登录。-o
(option的缩写)表示选项,ssh有很多选项,可以用man ssh
查到,而每个选项是什么意思需要用man ssh_config
来查看,“StrictHostKeyChecking”表示严格检查主机的key fingerprint(指纹密钥),当你首次登录一台服务器的时候,它总会有这个提示:The authenticity of host '10.37.129.7 (10.37.129.7)' can't be established.
ECDSA key fingerprint is SHA256:xcDUp3zNlJvhY4fwfwDH1pgOyc5p8Vsr2OjopanEQBw.
Are you sure you want to continue connecting (yes/no)?
known_hosts
文件中,这个文件的位置,对于Mac/Linux电脑,是在~/.ssh/known_hosts
,Windows的话则是在C:\Users\用户名\
目录下。