.net 目录实时同步_目录级别的冗余存储:SnapRAID

论坛 期权论坛 脚本     
已经匿名di用户   2022-5-29 19:22   4015   0

一、SnapRAID简介

SnapRAID介绍:是磁盘整列的备份程序,可存储磁盘的奇偶校验信息,在两个磁盘损坏时也能恢复数据。

SnapRAID定位:家庭媒体中心,特别适合于文件较大较多且较少改变的系统。

SnapRAID特点:

  1. 所有数据都有完整性校验,避免数据悄然损坏;
  2. 如果磁盘损坏的过多影响恢复,那么你损坏的也不是全部数据,未损害硬盘的数据不受影响,可以单独读取;
  3. 如果你不小心删掉了一些数据,你仍然可以恢复它们;
  4. 对于已有数据的磁盘,你无需格式化硬盘便可以加入整列,磁盘中的已有数据不受影响;
  5. 整列的磁盘可以容量不同;
  6. 随时添加磁盘;
  7. 每个磁盘数据相互独立,每个磁盘读写也独立,也就是说可以单盘读写,其余磁盘休眠,节能环保延长磁盘寿命;
  8. 基于上一点特性,你不会因为SnapRAID而提高整个整列的读写性能;
  9. 它不会锁定数据,可以随时停止使用SnapRAID而不需要移除数据或者格式化硬盘,各个磁盘中的数据不受影响,可以单独读写。

二、各种RAID特性比较

除标准RAID磁盘部署解决方案外,还有众多解决方案。根据奇偶校验的实时性可以把各种冗余分为两大类:

  1. 一类是实时(realtime)奇偶校验的冗余方案,这类方案的冗余不需要人为干预,实时更新,像RAID;
  2. 一类是快照(snapshot)奇偶校验的冗余方案,这类方案的冗余是在接收到人为指令后更新,像Backup。

主要解决方案有:

  1. unRAID-商业和开源GPL2的解决方案,修改版可实现Linux下ReiserFS文件系统实时冗余,不支持任何完整性校验。
  2. FlexRAID-Windows下商业和专有C ++ / Java应用,可有限支持linux。它同时支持快照冗余和实施冗余,支持完整性校验。
  3. disParity-Windows下专有的. NET应用,支持快照冗余和完整性校验。
  4. ZFS-开源文件系统(但与GPL不兼容),支持实时冗余和完整性校验。
  5. Btrfs-开源GPL2授权的文件系统,支持实时冗余,Linux内核3.9以上开始支持RAID 5 / 6冗余和完整性校验。
  6. Storage Spaces-最后是来自微软的方案,改方案已经集成到Win8了,支持专有的实时冗余,不支持完整性校验,但是在ReFS文件系统开始提供一些有限的支持。

这些方案各有优缺点,综合各特性针对于家庭媒体中心的解决方案SnapRAID应运而生:

e5e881661443a58d92fb8a1b441549e1.png

二、备份与冗余存储

在数据存储领域,「备份」和「冗余」是两种常见的数据保护策略。两种策略各有不同的使用场景,对于重要数据,两者一起使用自然是最好了。本文介绍使用 SnapRAID 实现灵活的数据冗余存储。虽说「备份」和「冗余」两大数据保护策略有各自的使用场景,冗余并不能取代备份,但如果要将这两者进行比较的话,冗余相比备份最大的优点,是可以相对节省存储空间。回顾上一节里提到的 7 + 1 块磁盘的场景,假设每块磁盘是 1 TB,则有效存储空间是 7 TB,剩下 1 TB 是校验数据。在磁盘使用过程中,任意一块磁盘坏掉,你都可以重新买一块新的替换磁盘,然后把坏掉磁盘的内容完整地推算出来,相当于你用 1 TB 的空间,换取了 7 TB 数据的「相对安全」(仅就对抗硬件故障而言),比完整备份 7 TB 数据省了很多空间。

然而,实际生产生活中,7 + 1 这样的组合风险比较高,因为同时开始使用的磁盘,很可能一起坏掉,一旦有两块磁盘同时坏掉,就会有数据无法被修复了。悲剧往往是这样发生的:一组磁盘里坏了一块,然后换了块新的上去,开始根据旧磁盘的数据推算出坏掉磁盘里原有的数据并写入新磁盘,由于这个推算过程需要将所有旧磁盘里的数据全部读一遍(视磁盘大小,这个过程可能会持续一两天),大量的读取操作成了最后一根稻草,还没等新磁盘填满,又一块旧磁盘挂了。

根据存储及备份提供商 BackBlaze 公开的信息,他们使用的是 13 + 2 的组合,即 15 块磁盘一组,最多能同时坏 2 块磁盘而不丢数据。

三、RAID 与 ZFS

在数据中心里,冗余存储最常见实现是 RAID。使用带冗余的 RAID 级别,如 RAID 5 和 RAID 6,可以在空间利用率和容错性之间达到一个平衡。存储服务器一般会安装硬件 RAID 卡,实现对操作系统透明的 RAID(操作系统看到的就是一个已经带冗余存储的磁盘,并不用关心下面是几块磁盘、怎么实现的)。在 GNU/Linux 中也可以使用 mdadm 工具实现软件 RAID,无需专门的硬件即可实现冗余存储。

在《使用 mergerfs 合并多块硬盘的剩余空间》一文的「读者来信」一节,有读者推荐了 ZFS。这套来自 Sun 的存储方案也可以实现类似 RAID 的功能,包括冗余存储。

然而,使用 RAID 和 ZFS 进行冗余存储都存在一个问题:data lock-in。即,要在已有数据的磁盘上使用 RAID / ZFS,需要把数据先导出,将磁盘清空,然后重新导入数据,并且你想要将某块磁盘脱离 RAID / ZFS 单独读写里面的数据也非常麻烦(如果不是不可能)。

这在数据中心看来也许不是什么问题,但是我希望能有一个更加灵活、自由的冗余存储方案。

四、似 RAID 而非 RAID 的 SnapRAID

SnapRAID 是一个目录级别的冗余存储方案,它与 RAID 的原理有相似的地方,但它并不是 RAID。SnapRAID 与 RAID 的主要区别有:

  • SnapRAID 不会对数据进行条带化存储。RAID 通常会使用数据条带化,一个文件可能会被分散存储到多块磁盘上,这样的优点是读取的时候可以加速(多块磁盘同时读取),但条带化也是上节所说的 data lock-in 的根源——你不能拆出一块盘单独读写。
  • SnapRAID 是工作于文件系统之上的。RAID 工作于文件系统之下,直接对磁盘区块进行操作,用磁盘区块上的比特计算校验数据,而 SnapRAID 是通过读取文件系统里的文件之后再进行计算的。
  • SnapRAID 是非实时的。RAID 每时每刻都在工作,磁盘区块上的数据一旦发生变更就会重新计算校验数据,而 SnapRAID 可以在用户选择的时间进行重新计算。

SnapRAID 相比 RAID 的优点主要有:

  • 数据独立。不需要对磁盘做特殊处理,可以直接将已有数据的磁盘(甚至可以是不同文件系统的)加入 SnapRAID,SnapRAID 也不会改变这些已有的数据;一个文件不会被分散到多个磁盘,随时可以拆下来一块磁盘正常读写里面的数据;当磁盘阵列收到文件读写请求时,也只需要一块磁盘响应,而不是所有的磁盘全部从待机状态启动,开始寻道。
  • 抗灾能力。当磁盘列阵中同时损坏的磁盘数量超出预期而无法修复数据时,SnapRAID 的抗灾能力更强。例如:在 3 + 1 的 RAID 场景下,坏一块没事,如果同时坏了两块,所有的磁盘上的数据都将无法读取(因为条带化);但如果是 3 + 1 的 SnapRAID,就算同时坏两块,剩下两块里的数据依然可以正常读取。
  • 配置灵活。标准的 RAID 等级中,RAID 5 最多承受 1 块磁盘同时损坏,RAID 6 最多承受 2 块磁盘同时损坏;而 SnapRAID 可以配置 1 到 6 块校验盘,最多承载 6 块磁盘同时损坏,因此可以组建更大的磁盘阵列而不提升风险(维持数据盘与校验盘的比例不变)。更重要的是,无论是增加还是减少磁盘,SnapRAID 都可以无痛完成,无需清空磁盘数据。
  • 恢复误删文件。由于 RAID 是实时计算校验数据的,当文件被删除时,这一改动立刻就会被同步到校验数据里;而 SnapRAID 在用户请求的时候才进行同步,因此用户可以用 SnapRAID 从校验数据重新构建被误删除的文件。当然了,更可靠、更持久的的误删除防护还是应该用增量备份来完成。
  • 空间利用率高。在磁盘阵列中,校验盘的大小应大于等于数据盘中最大的那块。使用 SnapRAID 时,你可以「超售」。比如数据盘是 6 TB 的但是只装了一半(3 TB),你把 4 TB 的磁盘作为校验盘也是可以的(因为此时校验数据最多只有 3 TB),只要在校验文件膨胀到接近 4 TB 的时候将校验文件挪到更大的磁盘里即可。同样的,校验盘里未被校验文件填满的剩余空间也可以用来存储一些「丢了也无所谓」的不重要数据。此外,由于 SnapRAID 工作于文件系统之上,你可以选择性地排除掉一些不想做冗余的目录和文件,以节省空间。

五、SnapRAID 的配置与使用

SnapRAID 提供了 Windows 版本的二进制文件下载;GNU/Linux、macOS,以及各种 Unix-like 可以从源码编译或从软件仓库中安装。SnapRAID 的配置文件简洁且注释详尽,读注释就能明白怎么配了。

目前我的 Gen8 里有三块 SATA 磁盘,容量分别是 2 TB, 4 TB, 4 TB。前两块服役多年,几乎满了,第三块是新买的,还是空的,我想把第三块磁盘作为校验盘。我的相关配置是这样的:

# 校验文件的位置# 显然,校验文件不能放在数据盘上,否则就没有意义了parity /media/disk3/snapraid.parity# 如需添加更多的校验文件则继续添加# 最多是 6 份校验,承受磁盘磁盘阵列中最多同时坏掉 6 块盘的情况#2-parity /media/disk4/snapraid.2-parity#3-parity /media/disk5/snapraid.3-parity# 重要的索引文件,建议保存多份(内容是一样的)# 我在系统盘(SSD)上存了一份,然后在三块磁盘上都各存一份# 系统盘上的这份同时又会被 BorgBackup 异地备份content /home/snapraid/snapraid.contentcontent /media/disk1/snapraid.contentcontent /media/disk2/snapraid.contentcontent /media/disk3/snapraid.content# 指定数据盘及其挂载点# 这里不一定要写确切的挂载点,可以是这块盘上的任意目录# 目录以外的内容会被完全忽略data d1 /media/disk1/data d2 /media/disk2/# 忽略所有隐藏文件和目录(不做冗余)# 在 Unix-like 里就是 . 开头的文件和目录# 在 Windows 里就是带隐藏属性的文件和目录nohidden# 排除列表与包含列表,注意顺序!下文详解exclude *.unrecoverableexclude *.nobackupexclude *.nobackup/exclude /tmp/exclude /lost+found/#include /foo#include /bar/# 生成校验数据时,每处理 10 GiB 数据自动保存一次,方便断点继续autosave 10

写好配置文件之后,使用 snapraid sync 进行首次同步,也就是根据数据盘的内容生成校验盘的内容。我的第一次同步花了 24 小时:

Scanning disk d1...Scanning disk d2...Using 221 MiB of memory for the FileSystem.Initializing...Resizing...Saving state to /home/snapraid/snapraid.content...Saving state to /media/disk1/snapraid.content...Saving state to /media/disk2/snapraid.content...Saving state to /media/disk3/snapraid.content...Verifying /home/snapraid/snapraid.content...Verifying /media/disk1/snapraid.content...Verifying /media/disk2/snapraid.content...Verifying /media/disk3/snapraid.content...Syncing...Using 24 MiB of memory for 32 blocks of IO cache.0%, 959 MB, 40 MB/s, CPU 1%, 24:08 ETA

常用的 SnapRAID 命令:

  • snapraid sync:根据数据盘生成校验盘;
  • snapraid diff:查看有哪些数据需要 sync;
  • snapraid status:查看磁盘阵列的状态;
  • snapraid scrub:进行数据擦洗,提早发现磁盘阵列中的错误。

SnapRAID 首次同步完成之后,可以将 snapraid sync 和 snapraid scrub 加入 cron / systemd timer,定时运行。后者默认配置下每次运行擦洗全部数据的 8%,并且会挑选最近 10 天内没有被擦洗过的数据进行擦洗。如果每天运行一次 snapraid scrub 的话,每 12.5 天所有数据都会被擦洗一遍,形成一个健康的循环。

当擦洗发现有数据损坏,或是更糟糕地,某天整块磁盘挂了(不转了),就需要修复数据了。这时候应该做的是停掉所有的定时任务,然后换上新的磁盘,然后用 snapraid fix -d name_of_disk 命令,根据健在磁盘的内容,在新磁盘里重建坏掉磁盘里的内容。只要坏掉的磁盘数量小于等于校验盘的数量,SnapRAID 都能完整地修复数据。

由于 snapraid sync 是定期执行的,这意味着在下次同步之前,磁盘阵列是有机会恢复到上次同步的状态的,因此 snapraid fix 除了可以重建整个磁盘,也可以重建单个文件,也就是反删除。如果你误删除了文件,可以用 snapraid fix -f path/to/file 来恢复文件到上次同步时的状态。

六、SnapRAID 最佳实践

事实上我也就昨天才开始用 SnapRAID,所以这所谓的「最佳实践」,其实也只是我在阅读文档和配置使用中觉得需要注意的地方。

排除列表与包含列表

因为 SnapRAID 是工作在文件系统之上、基于目录的冗余存储方案,因此可以很方便选择哪些目录和文件需要做冗余,哪些不需要。在配置文件中 include 和 exclude 的规则如下:

  • 可以使用 * ? [1-3] 这样的简单通配符;
  • 以 / 开头的路径匹配的是数据盘的根目录,而不是系统的根目录;
  • 以 / 结尾的路径只会匹配目录;
  • 不以 / 结尾的路径只会匹配文件;
  • 如果最后一条规则是包含(include),则所有未匹配的路径都会被排除
  • 如果最后一条规则是排除(exclude),则所有未匹配的路径都会被包含

适合使用 SnapRAID 的文件

因为 SnapRAID 是定期运行的,在两次 snapraid sync 之间新增的数据是有一段时间没有冗余的,这时候如果磁盘挂了,那这些数据就丢失了。因此,SnapRAID 并不适合用来对频繁变动的文件(如:系统盘)做冗余

SnapRAID 比较适用的场景是体积巨大、但是很少更改的文件。比如对摄影爱好者来说,磁盘中可能会有好几个 TiB 的 RAW 照片或是未剪辑的 4K 视频文件。这些原始文件因为体积巨大,很难通过互联网做异地备份,而它们本身几乎不会再发生变化,因此非常适合用 SnapRAID 做冗余。由于 SnapRAID 的灵活配置,用户可以方便地选择对哪些文件做冗余,也可以随时将单个磁盘从阵列中临时脱离出来,直接插到图形工作站上进行高速读写。

与 mergerfs 配合

SnapRAID 提供了类似 RAID 的冗余功能,但是 RAID 还能将磁盘阵列里的磁盘合并成一个大磁盘。SnapRAID 本身并不提供合并磁盘的功能,但是 mergerfs 可以达成这个目的:《使用 mergerfs 合并多块硬盘的剩余空间》。

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

来时无迹去无踪,去与来时事一同。何须更问浮生事?只此浮生是梦中。

积分:81
帖子:4969
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP