标签 rsync 下的文章

scp 用户的 rsync 迁移指南

Chasinglogic 发布于 2020-09-03
另请参阅: 技术,rsync, scp
2 条评论

在 SSH 8.0 预发布公告中，OpenSSH 项目表示，他们认为 scp 协议已经过时，不灵活，而且不容易修复，然后他们继而推荐使用 sftp 或 rsync 来进行文件传输。

然而，很多用户都是从小用着 scp 命令长大的，所以对 rsync 并不熟悉。此外，rsync 可以做的事情也远不止复制文件，这可能会给菜鸟们留下复杂和难以掌握的印象。尤其是，scp 命令的标志大体上可以直接对应到 cp 命令的标志，而 rsync 命令的标志却和它大相径庭。

本文将为熟悉 scp 的人提供一个介绍和过渡的指南。让我们跳进最常见的场景：复制文件和复制目录。

复制文件

对于复制单个文件而言，scp 和 rsync 命令实际上是等价的。比方说，你需要把 foo.txt 传到你在名为 server 的服务器上的主目录下：

$ scp foo.txt me@server:/home/me/

相应的 rsync 命令只需要输入 rsync 取代 scp：

$ rsync foo.txt me@server:/home/me/

复制目录

对于复制目录，就有了很大的分歧，这也解释了为什么 rsync 会被认为比 scp 更复杂。如果你想把 bar 目录复制到 server 服务器上，除了指定 ssh 信息外，相应的 scp 命令和 cp 命令一模一样。

$ scp -r bar/ me@server:/home/me/

对于 rsync，考虑的因素比较多，因为它是一个比较强大的工具。首先，我们来看一下最简单的形式：

$ rsync -r bar/ me@server:/home/me/

看起来很简单吧？对于只包含目录和普通文件的简单情况，这就可以了。然而，rsync 更在意发送与主机系统中一模一样的文件。让我们来创建一个稍微复杂一些，但并不罕见的例子：

# 创建多级目录结构
$ mkdir -p bar/baz
# 在其根目录下创建文件
$ touch bar/foo.txt
# 现在创建一个符号链接指回到该文件
$ cd bar/baz
$ ln -s ../foo.txt link.txt
# 返回原位置
$ cd -

现在我们有了一个如下的目录树：

bar
├── baz
│   └── link.txt -> ../foo.txt
└── foo.txt

1 directory, 2 files

如果我们尝试上面的命令来复制 bar，我们会注意到非常不同的（并令人惊讶的）结果。首先，我们来试试 scp：

$ scp -r bar/ me@server:/home/me/

如果你 ssh 进入你的服务器，看看 bar 的目录树，你会发现它和你的主机系统有一个重要而微妙的区别：

bar
├── baz
│   └── link.txt
└── foo.txt

1 directory, 2 files

请注意，link.txt 不再是一个符号链接，它现在是一个 foo.txt 的完整副本。如果你习惯于使用 cp，这可能会是令人惊讶的行为。如果你尝试使用 cp -r 复制 bar 目录，你会得到一个新的目录，里面的符号链接和 bar 的一样。现在如果我们尝试使用之前的 rsync 命令，我们会得到一个警告：

$ rsync -r bar/ me@server:/home/me/
skipping non-regular file "bar/baz/link.txt"

rsync 警告我们它发现了一个非常规文件，并正在跳过它。因为你没有告诉它可以复制符号链接，所以它忽略了它们。rsync 在手册中有一节“符号链接”，解释了所有可能的行为选项。在我们的例子中，我们需要添加 -links 标志：

$ rsync -r --links bar/ me@server:/home/me/

在远程服务器上，我们看到这个符号链接是作为一个符号链接复制过来的。请注意，这与 scp 复制符号链接的方式不同。

bar/
├── baz
│   └── link.txt -> ../foo.txt
└── foo.txt

1 directory, 2 files

为了省去一些打字工作，并利用更多的文件保护选项，在复制目录时可以使用归档标志 -archive（简称 -a）。该归档标志将做大多数人所期望的事情，因为它可以实现递归复制、符号链接复制和许多其他选项。

$ rsync -a bar/ me@server:/home/me/

如果你感兴趣的话，rsync 手册页有关于存档标志的深入解释。

注意事项

不过，使用 rsync 有一个注意事项。使用 scp 比使用 rsync 更容易指定一个非标准的 ssh 端口。例如，如果 server 使用 8022 端口的 SSH 连接，那么这些命令就会像这样：

$ scp -P 8022 foo.txt me@server:/home/me/

而在使用 rsync 时，你必须指定要使用的“远程 shell”命令，默认是 ssh。你可以使用 -e 标志来指定。

$ rsync -e 'ssh -p 8022' foo.txt me@server:/home/me/

rsync 会使用你的 ssh 配置；但是，如果你经常连接到这个服务器，你可以在你的 ~/.ssh/config 文件中添加以下代码。这样你就不需要再为 rsync 或 ssh 命令指定端口了！

Host server
    Port 8022

另外，如果你连接的每一台服务器都在同一个非标准端口上运行，你还可以配置 RSYNC_RSH 环境变量。

为什么你还是应该切换到 rsync？

现在我们已经介绍了从 scp 切换到 rsync 的日常使用案例和注意事项，让我们花一些时间来探讨一下为什么你可能想要使用 rsync 的优点。很多人在很久以前就已经开始使用 rsync 了，就是因为这些优点。

即时压缩

如果你和服务器之间的网络连接速度较慢或有限，rsync 可以花费更多的 CPU 处理能力来节省网络带宽。它通过在发送数据之前对数据进行即时压缩来实现。压缩可以用 -z 标志来启用。

差量传输

rsync 也只在目标文件与源文件不同的情况下复制文件。这可以在目录中递归地工作。例如，如果你拿我们上面的最后一个 bar 的例子，并多次重新运行那个 rsync 命令，那么在最初的传输之后就不会有任何传输。如果你知道你会重复使用这些命令，例如备份到 U 盘，那么使用 rsync 即使是进行本地复制也是值得的，因为这个功能可以节省处理大型数据集的大量的时间。

同步

顾名思义，rsync 可以做的不仅仅是复制数据。到目前为止，我们只演示了如何使用 rsync 复制文件。如果你想让 rsync 把目标目录变成源目录的样子，你可以在 rsync 中添加删除标志 -delete。这个删除标志使得 rsync 将从源目录中复制不存在于目标目录中的文件，然后它将删除目标目录中不存在于源目录中的文件。结果就是目标目录和源目录完全一样。相比之下，scp 只会在目标目录下添加文件。

结论

对于简单的使用情况，rsync 并不比老牌的 scp 工具复杂多少。唯一显著的区别是在递归复制目录时使用 -a 而不是 -r。然而，正如我们看到的，rsync 的 -a 标志比 scp 的 -r 标志更像 cp 的 -r 标志。

希望通过这些新命令，你可以加快你的文件传输工作流程。

via: https://fedoramagazine.org/scp-users-migration-guide-to-rsync/

作者：chasinglogic 选题：lujun9972 译者：wxy 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

使用 rsync 复制大文件的一些误解

Daniel Leite De Abreu 发布于 2019-10-02
另请参阅: 技术,rsync
1 条评论

有一种观点认为，在 IT 行业工作的许多人经常从网络帖子里复制和粘贴。我们都干过，复制粘贴本身不是问题。问题是当我们在不理解它们的情况下这样干。

几年前，一个曾经在我团队中工作的朋友需要将虚拟机模板从站点 A 复制到站点 B。他们无法理解为什么复制的文件在站点 A 上为 10GB，但是在站点 B 上却变为 100GB。

这位朋友认为 rsync 是一个神奇的工具，应该仅“同步”文件本身。但是，我们大多数人所忘记的是了解 rsync 的真正含义、用法，以及我认为最重要的是它原本是用来做什么的。本文提供了有关 rsync 的更多信息，并解释了那件事中发生了什么。

关于 rsync

rsync 是由 Andrew Tridgell 和 Paul Mackerras 创建的工具，其动机是以下问题：

假设你有两个文件，file_A 和 file_B。你希望将 file_B 更新为与 file_A 相同。显而易见的方法是将 file_A 复制到 file_B。

现在，假设这两个文件位于通过慢速通信链接（例如，拨号 IP 链接）连接的两个不同的服务器上。如果file_A 大，将其复制到 file_B 将会很慢，有时甚至是不可能完成的。为了提高效率，你可以在发送前压缩 file_A，但这通常只会获得 2 到 4 倍的效率提升。

现在假设 file_A 和 file_B 非常相似，并且为了加快处理速度，你可以利用这种相似性。一种常见的方法是仅通过链接发送 file_A 和 file_B 之间的差异，然后使用这个差异列表在远程端重建文件。

问题在于，用于在两个文件之间创建一组差异的常规方法依赖于能够读取两个文件。因此，它们要求链接的一端预先提供两个文件。如果它们在同一台计算机上不是同时可用的，则无法使用这些算法。（一旦将文件复制过来，就不需要做对比差异了）。而这是 rsync 解决的问题。

rsync 算法有效地计算源文件的哪些部分与现有目标文件的部分匹配。这样，匹配的部分就不需要通过链接发送了；所需要的只是对目标文件部分的引用。只有源文件中不匹配的部分才需要发送。

然后，接收者可以使用对现有目标文件各个部分的引用和原始素材来构造源文件的副本。

另外，可以使用一系列常用压缩算法中的任何一种来压缩发送到接收器的数据，以进一步提高速度。

我们都知道，rsync 算法以一种漂亮的方式解决了这个问题。

在 rsync 的介绍之后，回到那件事！

问题 1：自动精简配置

有两件事可以帮助那个朋友了解正在发生的事情。

该文件在其他地方的大小变得越来越大的问题是由源系统上启用了自动精简配置 Thin Provisioning （TP）引起的，这是一种优化存储区域网络（SAN）或网络连接存储（NAS）中可用空间效率的方法。

由于启用了 TP，源文件只有 10GB，并且在不使用任何其他配置的情况下使用 rsync 进行传输时，目标位置将接收到全部 100GB 的大小。rsync 无法自动完成该（TP）操作，必须对其进行配置。

进行此工作的选项是 -S（或 –sparse），它告诉 rsync 有效地处理稀疏文件。它会按照它说的做！它只会发送该稀疏数据，因此源和目标将有一个 10GB 的文件。

问题 2：更新文件

当发送一个更新的文件时会出现第二个问题。现在目标仅接收 10GB 了，但始终传输的是整个文件（包含虚拟磁盘），即使只是在该虚拟磁盘上更改了一个配置文件。换句话说，只是该文件的一小部分发生了更改。

用于此传输的命令是：

rsync -avS vmdk_file syncuser@host1:/destination

同样，了解 rsync 的工作方式也将有助于解决此问题。

上面是关于 rsync 的最大误解。我们许多人认为 rsync 只会发送文件的增量更新，并且只会自动更新需要更新的内容。但这不是 rsync 的默认行为。

如手册页所述，rsync 的默认行为是在目标位置创建文件的新副本，并在传输完成后将其移动到正确的位置。

要更改 rsync 的默认行为，你必须设置以下标志，然后 rsync 将仅发送增量：

--inplace               原地更新目标文件
--partial               保留部分传输的文件
--append                附加数据到更短的文件
--progress              在传输时显示进度条

因此，可以确切地执行我那个朋友想要的功能的完整命令是：

rsync -av --partial --inplace --append --progress vmdk_file syncuser@host1:/destination

注意，出于两个原因，这里必须删除稀疏选项 -S。首先是通过网络发送文件时，不能同时使用 –sparse 和 –inplace。其次，当你以前使用过 –sparse 发送文件时，就无法再使用 –inplace 进行更新。请注意，低于 3.1.3 的 rsync 版本将拒绝 –sparse 和 –inplace 的组合。

因此，即使那个朋友最终通过网络复制了 100GB，那也只需发生一次。以下所有更新仅复制差异，从而使复制非常高效。

via: https://fedoramagazine.org/copying-large-files-with-rsync-and-some-misconceptions/

作者：Daniel Leite de Abreu 选题：lujun9972 译者：wxy 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

如何使用 rsync 的高级用法进行大型备份

Alan Formy-duval 发布于 2019-05-17
另请参阅: 技术,备份, rsync
1 条评论

基础的 rsync 命令通常足够来管理你的 Linux 备份，但是额外的选项使大型备份集更快、更强大。

title=

很明显，备份一直是 Linux 世界的热门话题。回到 2017，David Both 为 Opensource.com 的读者在使用 rsync 备份 Linux 系统方面提了一些建议，在这年的更早时候，他发起了一项问卷调查询问大家，在 Linux 中你的 /home 目录的主要备份策略是什么，在今年的另一个问卷调查中，Don Watkins 问到，你使用哪种开源备份解决方案。

我的回复是 rsync。我真的非常喜欢 rsync！市场上有大量大而复杂的工具，对于管理磁带机或者存储库设备，这些可能是必要的，但是可能你需要的只是一个简单的开源命令行工具。

rsync 基础

我为一个大概拥有 35,000 开发者并有着几十 TB 文件的全球性机构管理二进制仓库。我经常一次移动或者归档上百 GB 的数据。使用的是 rsync。这种经历使我对这个简单的工具充满信心。（所以，是的，我在家使用它来备份我的 Linux 系统）

基础的 rsync 命令很简单。

rsync -av 源目录 目的地目录

实际上，在各种指南中教的 rsync 命令在大多数通用情况下都运行的很好。然而，假设我们需要备份大量的数据。例如包含 2,000 个子目录的目录，每个包含 50GB 到 700GB 的数据。在这个目录运行 rsync 可能需要大量时间，尤其是当你使用校验选项时（我倾向使用）。

当我们试图同步大量数据或者通过慢的网络连接时，可能遇到性能问题。让我给你展示一些我使用的方法来确保好的性能和可靠性。

rsync 高级用法

rsync 运行时出现的第一行是：“正在发送增量文件列表。” 如果你在网上搜索这一行，你将看到很多类似的问题：为什么它一直运行，或者为什么它似乎挂起了。

这里是一个基于这个场景的例子。假设我们有一个 /storage 的目录，我们想要备份到一个外部 USB 磁盘，我们可以使用下面的命令：

rsync -cav /storage /media/WDPassport

-c 选项告诉 rsync 使用文件校验和而不是时间戳来决定改变的文件，这通常消耗的时间更久。为了分解 /storage 目录，我通过子目录同步，使用 find 命令。这是一个例子：

find /storage -type d -exec rsync -cav {} /media/WDPassport \;

这看起来可以，但是如果 /storage 目录有任何文件，它们将被跳过。因此，我们如何同步 /storage 目录中的文件呢？同样有一个细微的差别是这些选项将造成 rsync 会同步 . 目录，该目录是源目录自身；这意味着它会同步子目录两次，这并不是我们想要的。

长话短说，我的解决方案是一个 “双-递增”脚本。这允许我分解一个目录，例如，当你的家目录有多个大的目录，例如音乐或者家庭照片时，分解 /home 目录为单个的用户家目录。

这是我的脚本的一个例子：

HOMES="alan"
DRIVE="/media/WDPassport"

for HOME in $HOMES; do
cd /home/$HOME
rsync -cdlptgov --delete . /$DRIVE/$HOME
find . -maxdepth 1 -type d -not -name "." -exec rsync -crlptgov --delete {} /$DRIVE/$HOME \;
done

第一个 rsync 命令拷贝它在源目录中发现的文件和目录。然而，它将目录留着不处理，因此我们能够通过 find 命令迭代它们。这通过传递 -d 参数来完成，它告诉 rsync 不要递归目录。

-d, --dirs 传输目录而不递归

然后 find 命令传递每个目录来单独运行 rsync。之后 rsync 拷贝目录的内容。这通过传递 -r 参数来完成，它告诉 rsync 要递归目录。

-r, --recursive 递归进入目录

这使得 rsync 使用的增量文件保持在一个合理的大小。

大多数 rsync 指南为了简便使用 -a （或者 archive）参数。这实际是一个复合参数。

-a, --archive 归档模式；等价于 -rlptgoD（没有 -H,-A,-X）

我传递的其他参数包含在 a 中；这些是 -l、-p、-t、-g和 -o。

-l, --links 复制符号链接作为符号链接
-p, --perms 保留权限
-t, --times 保留修改时间
-g, --group 保留组
-o, --owner 保留拥有者（只适用于超级管理员）

--delete 选项告诉 rsync 删除目的地目录中所有在源目录不存在的任意文件。这种方式，运行的结果仅仅是复制。你同样可以排除 .Trash 目录或者 MacOS 创建的 .DS_Store 文件。

-not -name ".Trash*" -not -name ".DS_Store"

注意

最后一条建议： rsync 可以是破坏性的命令。幸运的是，它的睿智的创造者提供了 “空运行” 的能力。如果我们加入 n 选项，rsync 会显示预期的输出但不写任何数据。

`rsync -cdlptgovn --delete . /$DRIVE/$HOME`

这个脚本适用于非常大的存储规模和高延迟或者慢链接的情况。一如既往，我确信仍有提升的空间。如果你有任何建议，请在下方评论中分享。

via: https://opensource.com/article/19/5/advanced-rsync

作者：Alan Formy-Duval 选题：lujun9972 译者：warmfrog 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

如何使用 rsync 通过 SSH 恢复部分传输的文件

SK 发布于 2018-05-03
另请参阅: 技术,rsync, scp
评论

由于诸如电源故障、网络故障或用户干预等各种原因，使用 scp 命令通过 SSH 复制的大型文件可能会中断、取消或损坏。有一天，我将 Ubuntu 16.04 ISO 文件复制到我的远程系统。不幸的是断电了，网络连接立即断了。结果么？复制过程终止！这只是一个简单的例子。Ubuntu ISO 并不是那么大，一旦电源恢复，我就可以重新启动复制过程。但在生产环境中，当你在传输大型文件时，你可能并不希望这样做。

而且，你不能继续使用 scp 命令恢复被中止的进度。因为，如果你这样做，它只会覆盖现有的文件。这时你会怎么做？别担心！这是 rsync 派上用场的地方！rsync 可以帮助你恢复中断的复制或下载过程。对于那些好奇的人，rsync 是一个快速、多功能的文件复制程序，可用于复制和传输远程和本地系统中的文件或文件夹。

它提供了大量控制其各种行为的选项，并允许非常灵活地指定要复制的一组文件。它以增量传输算法而闻名，它通过仅发送源文件和目标中现有文件之间的差异来减少通过网络发送的数据量。 rsync 广泛用于备份和镜像，以及日常使用中改进的复制命令。

就像 scp 一样，rsync 也会通过 SSH 复制文件。如果你想通过 SSH 下载或传输大文件和文件夹，我建议您使用 rsync。请注意，应该在两边（远程和本地系统）都安装 rsync 来恢复部分传输的文件。

使用 rsync 恢复部分传输的文件

好吧，让我给你看一个例子。我将使用命令将 Ubuntu 16.04 ISO 从本地系统复制到远程系统：

$ scp Soft_Backup/OS\ Images/Linux/ubuntu-16.04-desktop-amd64.iso sk@192.168.43.2:/home/sk/

这里，

sk是我的远程系统的用户名
192.168.43.2 是远程机器的 IP 地址。

现在，我按下 CTRL+C 结束它。

示例输出：

sk@192.168.43.2's password: 
ubuntu-16.04-desktop-amd64.iso 26% 372MB 26.2MB/s 00:39 ETA^c

正如你在上面的输出中看到的，当它达到 26％时，我终止了复制过程。

如果我重新运行上面的命令，它只会覆盖现有的文件。换句话说，复制过程不会在我断开的地方恢复。

为了恢复复制过程，我们可以使用 rsync 命令，如下所示。

$ rsync -P -rsh=ssh Soft_Backup/OS\ Images/Linux/ubuntu-16.04-desktop-amd64.iso sk@192.168.43.2:/home/sk/

示例输出：

sk@192.168.1.103's password:
sending incremental file list
ubuntu-16.04-desktop-amd64.iso
                   380.56M 26% 41.05MB/s 0:00:25

看见了吗？现在，复制过程在我们之前断开的地方恢复了。你也可以像下面那样使用 -partial 而不是 -P 参数。

$ rsync --partial -rsh=ssh Soft_Backup/OS\ Images/Linux/ubuntu-16.04-desktop-amd64.iso sk@192.168.43.2:/home/sk/

这里，参数 -partial 或 -P 告诉 rsync 命令保留部分下载的文件并恢复进度。

或者，我们也可以使用以下命令通过 SSH 恢复部分传输的文件。

$ rsync -avP Soft_Backup/OS\ Images/Linux/ubuntu-16.04-desktop-amd64.iso sk@192.168.43.2:/home/sk/

或者，

rsync -av --partial Soft_Backup/OS\ Images/Linux/ubuntu-16.04-desktop-amd64.iso sk@192.168.43.2:/home/sk/

就是这样了。你现在知道如何使用 rsync 命令恢复取消、中断和部分下载的文件。正如你所看到的，它也不是那么难。如果两个系统都安装了 rsync，我们可以轻松地通过上面描述的那样恢复复制的进度。

如果你觉得本教程有帮助，请在你的社交、专业网络上分享，并支持我们。还有更多的好东西。敬请关注！

干杯!

via: https://www.ostechnix.com/how-to-resume-partially-downloaded-or-transferred-files-using-rsync/

作者：SK 译者：geekpi 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

如何在使用 scp 命令时递归地排除文件

Vivek Gite 发布于 2018-01-30
另请参阅: 技术,rsync, scp
评论

Q：我需要将所有包含 *.c 文件的文件夹从名为 hostA 的本地笔记本复制到 hostB。我使用的是下面的 scp 命令，但不知道如何排除特定的文件（如 *.out）：

$ scp -r ~/projects/ user@hostB:/home/delta/projects/

如何告诉 scp 命令在 Linux/Unix 命令行中排除特定的文件或目录？

人们可以使用 scp 命令在网络主机之间安全地复制文件。它使用 ssh 进行数据传输和身份验证。典型的语法是：

scp file1 user@host:/path/to/dest/
scp -r /path/to/source/ user@host:/path/to/dest/

scp 排除文件

我不认为你可以在使用 scp 命令时过滤或排除文件。但是，有一个很好的解决方法来排除文件并使用 ssh 安全地复制它。本页面说明如何在使用 scp 递归复制目录时过滤或排除文件。

如何使用 rsync 命令排除文件

语法是：

rsync av -e ssh --exclude='*.out' /path/to/source/ user@hostB:/path/to/dest/

这里：

-a ：递归到目录，即复制所有文件和子目录。另外，打开归档模式和所有其他选项（相当于 -rlptgoD）
-v ：详细输出
-e ssh ：使用 ssh 作为远程 shell，这样所有的东西都被加密
--exclude='*.out' ：排除匹配模式的文件，例如 *.out 或 *.c 等。

rsync 命令的例子

在这个例子中，从 ~/virt/ 目录递归地复制所有文件，但排除所有 *.new 文件：

$ rsync -av -e ssh --exclude='*.new' ~/virt/ root@centos7:/tmp

示例输出：

如果远程服务器上找不到 rsync，那么 rsync 命令将失败。在这种情况下，请尝试使用以下 scp 命令，该命令在当前目录中使用 bash shell 模式匹配（它不能与 -r 选项一起使用）：

$ ls

示例输出：

centos71.log centos71.qcow2 centos71.qcow2.new centos71.v2.qcow2.new meta-data user-data

复制除 .new 之外的当前目录中的所有内容：

$ shopt -s extglob
$ scp !(*.new) root@centos7:/tmp/

示例输出：

centos71.log 100 % 4262 1.3MB/s 00:00
centos71.qcow2 100 % 836MB 32.7MB/s 00: 25 
meta-data 100 % 47 18.5KB/s 00:00
user-data 100 % 1543 569.7KB/s 00:00

有关更多信息，请参阅以下手册页：

$ man rsync
$ man bash
$ man scp

via: https://www.cyberciti.biz/faq/scp-exclude-files-when-using-command-recursively-on-unix-linux/

作者：Vivek Gite 译者：geekpi 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

rdiff-backup：一个 Linux 中的远程增量备份工具

Aaron Kili 发布于 2017-05-10
另请参阅: 系统运维,备份, rsync
评论

rdiff-backup 是一个用于本地/远程增量备份的强大而易用的 Python 脚本，它适用于任何 POSIX 操作系统，如Linux、Mac OS X 或 Cygwin。它集合了镜像和增量备份的显著特性。

值得注意的是，它保留了子目录、dev 文件、硬链接，以及关键的文件属性，如权限、uid/gid 所有权、修改时间、扩展属性、acl 以及 resource fork。它可以通过管道以高效带宽的模式工作，这与流行的 rsync 备份工具类似。

rdiff-backup 通过使用 SSH 将单个目录备份到另一个目录，这意味着数据传输被加密并且是安全的。目标目录（在远程系统上）最终会得到源目录的完整副本，但是此外的反向差异会存储在目标目录的特殊子目录中，从而可以恢复前一段时间丢失的文件。

依赖

要在 Linux 中使用 rdiff-backup，你需要在系统上安装以下软件包：

Python v2.2 或更高版本
librsync v0.9.7 或更高版本
pylibacl 和 pyxattr Python 模块是可选的，但它们分别是 POSIX 访问控制列表（ACL）和扩展属性支持必需的。
rdiff-backup-statistics 需要 Python v2.4 或更高版本。

如何在 Linux 中安装 rdiff-backup

重要：如果你通过网络运行它，则必须在两个系统中都安装 rdiff-backup，两者最好是相同版本。

该脚本已经存在于主流 Linux 发行版的官方仓库中，只需运行以下命令来安装 rdiff-backup 及其依赖关系：

在 Debian/Ubuntu 中

$ sudo apt-get update
$ sudo apt-get install librsync-dev rdiff-backup

在 CentOS/RHEL 7 中

# wget http://dl.fedoraproject.org/pub/epel/7/x86_64/e/epel-release-7-9.noarch.rpm
# rpm -ivh epel-release-7-9.noarch.rpm
# yum install librsync rdiff-backup

在 CentOS/RHEL 6 中

# wget http://download.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-8.noarch.rpm
# rpm -ivh epel-release-6-8.noarch.rpm
# yum install librsync rdiff-backup

在 Fedora 中

# yum install librsync rdiff-backup
# dnf install librsync rdiff-backup [Fedora 22+]

如何在 Linux 中使用 rdiff-backup

如前所述，rdiff-backup 使用 SSH 连接到网络上的远程计算机，SSH 的默认身份验证方式是用户名/密码，这通常需要人工交互。

但是，要自动执行诸如脚本等自动备份之类的任务，那么你需要配置使用 SSH 密钥无密码登录 SSH，因为 SSH 密钥增加了两台 Linux服务器之间的信任来简化文件同步或传输。

在你设置了 SSH 无密码登录后，你可以使用下面的例子开始使用该脚本。

备份文件到不同分区

下面的例子会备份 /etc 文件夹到另外一个分区的 Backup 文件夹内：

$ sudo rdiff-backup /etc /media/aaronkilik/Data/Backup/mint_etc.backup

Backup Files to Different Partition

备份文件到不同分区

要排除一个特定文件夹和它的子目录，你可以如下使用 --exclude 选项：

$ sudo rdiff-backup --exclude /etc/cockpit --exclude /etc/bluetooth /media/aaronkilik/Data/Backup/mint_etc.backup

我们可以如下使用 --include-special-files 包含所有的设备文件、fifo 文件、socket 文件和链接文件：

$ sudo rdiff-backup --include-special-files --exclude /etc/cockpit /media/aaronkilik/Data/Backup/mint_etc.backup

还有另外两个重要标志来用于选择文件，--max-file-size 用来排除大于给定字节大小的文件，--min-file-size 用于排除小于给定字节大小的文件：

$ sudo rdiff-backup --max-file-size 5M --include-special-files --exclude /etc/cockpit /media/aaronkilik/Data/Backup/mint_etc.backup

在本地 Linux 服务器上备份远程文件

要这么做，我们使用：

Remote Server (tecmint)         : 192.168.56.102 
Local Backup Server (backup)    : 192.168.56.10

如前所述，你必须在两台机器上安装相同版本的 rdiff-backup，如下所示，请尝试在两台机器上检查版本：

$ rdiff-backup -V

Check rdiff Version on Servers

检查服务器中 rdiff 版本

在备份服务器中，像这样创建一个存储备份文件的目录：

# mkdir -p /backups

现在在备份服务器中，运行下面的命令来将远程 Linux 服务器 192.168.56.102 中的 /var/log/ 和 /root 备份到 /backups 中：

# rdiff-backup root@192.168.56.102::/var/log/ /backups/192.168.56.102_logs.backup
# rdiff-backup root@192.168.56.102::/root/ /backups/192.168.56.102_rootfiles.backup

下面的截图展示了远程服务器 192.168.56.102 中的 root 文件夹以及 192.168.56.10 备份服务器中的已备份文件：

Backup Remote Directory on Local Server

在本地服务器备份远程目录

注意截图中 “backup” 目录中创建的 rdiff-backup-data 文件夹，它包含了备份过程和增量文件的重要数据。

rdiff-backup - Backup Process Files

rdiff-backup – 备份过程文件

现在，在 192.168.56.102 服务器中，如下所示 root 目录已经添加了额外的文件：

Verify Backup Directory

验证备份目录

让我们再次运行备份命令以获取更改的数据，我们可以使用 -v[0-9]（其中数字指定详细程度级别，默认值为 3，这是静默模式）选项设置详细功能：

# rdiff-backup -v4 root@192.168.56.102::/root/ /backups/192.168.56.102_rootfiles.backup

Incremental Backup with Summary

带有摘要的增量备份

要列出 /backups/192.168.56.102_rootfiles.backup 目录中包含的部分增量备份的数量和日期，我们可以运行：

# rdiff-backup -l /backups/192.168.56.102_rootfiles.backup/

使用 cron 自动进行 rdiff-back 备份

使用 --print-statistics 成功备份后，我们可以打印摘要统计信息。但是，如果我们不设置此选项，我们可以仍从会话统计中获得。在手册页的 “STATISTICS” 部分中阅读有关此选项的更多信息。

-remote-schema 选项使我们能够指定使用替代方法连接到远程计算机。

现在，我们开始在备份服务器 192.168.56.10 上创建一个 backup.sh 脚本，如下所示：

# cd ~/bin
# vi backup.sh

添加下面的行到脚本中。

#!/bin/bash
#This is a rdiff-backup utility backup script
#Backup command
rdiff-backup --print-statistics --remote-schema 'ssh -C %s "sudo /usr/bin/rdiff-backup --server --restrict-read-only  /"'  root@192.168.56.102::/var/logs  /backups/192.168.56.102_logs.back
#Checking rdiff-backup command success/error
status=$?
if [ $status != 0 ]; then
#append error message in ~/backup.log file
echo "rdiff-backup exit Code: $status - Command Unsuccessful" >>~/backup.log;
exit 1;
fi
#Remove incremental backup files older than one month
rdiff-backup --force --remove-older-than 1M /backups/192.168.56.102_logs.back

保存文件并退出，接着运行下面的命令在服务器 192.168.56.10 上的 crontab 中添加此脚本：

# crontab -e

添加此行在每天午夜运行你的备份脚本：

0   0  *  *  * /root/bin/backup.sh > /dev/null 2>&1

保存 crontab 并退出，现在我们已经成功自动化了备份过程。确保一切如希望那样工作。

阅读 rdiff-backup 的手册页获取更多信息、详尽的使用选项以及示例：

# man rdiff-backup

rdiff-backup 主页： http://www.nongnu.org/rdiff-backup/

就是这样了！在本教程中，我们向你展示了如何安装并基础地使用 rdiff-backup 这个易于使用的 Python 脚本，用于 Linux 中的本地/远程增量备份。请通过下面的反馈栏与我们分享你的想法。

（题图：Pixabay，CC0）

作者简介：

Aaron Kili 是 Linux 和 F.O.S.S 爱好者，将来的 Linux SysAdmin 和 web 开发人员，目前是 TecMint 的内容创建者，他喜欢用电脑工作，并坚信分享知识。

via: http://www.tecmint.com/rdiff-backup-remote-incremental-backup-for-linux/

作者：Aaron Kili 译者：geekpi 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出