RAID磁盘阵列是什么(一看就懂)

论坛 期权论坛 爱问     
jai4x   2022-5-24 06:18   10056   19
在单机时代,采用单块磁盘进行数据存储和读写的方式,由于寻址和读写的时间消耗,导致I/O性能非常低,且存储容量还会受到限制。另外,单块磁盘极其容易出现物理故障,经常导致数据的丢失。因此大家就在想,有没有一种办法将多块独立的磁盘结合在一起组成一个技术方案,来提高数据的可靠性和I/O性能呢。

在这种情况下,RAID技术就应运而生了。
一、RAID 是什么?

RAID ( Redundant Array of Independent Disks )即独立磁盘冗余阵列,简称为「磁盘阵列」,其实就是用多个独立的磁盘组成在一起形成一个大的磁盘系统,从而实现比单块磁盘更好的存储性能和更高的可靠性。
二、RAID 有哪些?

RAID方案常见的可以分为:

  • RAID0
  • RAID1
  • RAID5
  • RAID6
  • RAID10
下面来分别介绍一下。

  • RAID0
RAID0 是一种非常简单的的方式,它将多块磁盘组合在一起形成一个大容量的存储。当我们要写数据的时候,会将数据分为N份,以独立的方式实现N块磁盘的读写,那么这N份数据会同时并发的写到磁盘中,因此执行性能非常的高。


RAID0 的读写性能理论上是单块磁盘的N倍(仅限理论,因为实际中磁盘的寻址时间也是性能占用的大头)
但RAID0的问题是,它并不提供数据校验或冗余备份,因此一旦某块磁盘损坏了,数据就直接丢失,无法恢复了。因此RAID0就不可能用于高要求的业务中,但可以用在对可靠性要求不高,对读写性能要求高的场景中。
那有没有可以让存储可靠性变高的方案呢?
有的,下面的RAID1就是。

  • RAID1



如图,
RAID1 是磁盘阵列中单位成本最高的一种方式。因为它的原理是在往磁盘写数据的时候,将同一份数据无差别的写两份到磁盘,分别写到工作磁盘和镜像磁盘,那么它的实际空间使用率只有50%了,两块磁盘当做一块用,这是一种比较昂贵的方案。
RAID1其实与RAID0效果刚好相反。RAID1 这种写双份的做法,就给数据做了一个冗余备份。这样的话,任何一块磁盘损坏了,都可以再基于另外一块磁盘去恢复数据,数据的可靠性非常强,但性能就没那么好了。
了解了RAID0和RAID1之后,我们发现这两个方案都不完美啊。
这时候就该 性能又好、可靠性也高 的方案 RAID5 登场了。

  • RAID5
这是目前用的最多的一种方式。
因为 RAID5 是一种将 存储性能、数据安全、存储成本 兼顾的一种方案。
在了解RAID5之前,我们可以先简单看一下RAID3,虽然RAID3用的很少,但弄清楚了RAID3就很容易明白RAID5的思路。
RAID3的方式是:将数据按照RAID0的形式,分成多份同时写入多块磁盘,但是还会另外再留出一块磁盘用于写「奇偶校验码」。例如总共有N块磁盘,那么就会让其中额度N-1块用来并发的写数据,第N块磁盘用记录校验码数据。一旦某一块磁盘坏掉了,就可以利用其它的N-1块磁盘去恢复数据。
但是由于第N块磁盘是校验码磁盘,因此有任何数据的写入都会要去更新这块磁盘,导致这块磁盘的读写是最频繁的,也就非常的容易损坏。
RAID5的方式可以说是对RAID3进行了改进。
RAID5模式中,不再需要用单独的磁盘写校验码了。它把校验码信息分布到各个磁盘上。例如,总共有N块磁盘,那么会将要写入的数据分成N份,并发的写入到N块磁盘中,同时还将数据的校验码信息也写入到这N块磁盘中(数据与对应的校验码信息必须得分开存储在不同的磁盘上)。一旦某一块磁盘损坏了,就可以用剩下的数据和对应的奇偶校验码信息去恢复损坏的数据。


RAID5校验位算法原理:P = D1 xor D2 xor D3 … xor Dn (D1,D2,D3 … Dn为数据块,P为校验,xor为异或运算)
RAID5的方式,最少需要三块磁盘来组建磁盘阵列,允许最多同时坏一块磁盘。如果有两块磁盘同时损坏了,那数据就无法恢复了。

  • RAID6
为了进一步提高存储的高可用,聪明的人们又提出了RAID6方案,可以在有两块磁盘同时损坏的情况下,也能保障数据可恢复。
为什么RAID6这么牛呢,因为RAID6在RAID5的基础上再次改进,引入了双重校验的概念。
RAID6除了每块磁盘上都有同级数据XOR校验区以外,还有针对每个数据块的XOR校验区,这样的话,相当于每个数据块有两个校验保护措施,因此数据的冗余性更高了。
但是RAID6的这种设计也带来了很高的复杂度,虽然数据冗余性好,读取的效率也比较高,但是写数据的性能就很差。因此RAID6在实际环境中应用的比较少。

  • RAID10
RAID10其实就是RAID1与RAID0的一个合体。
我们看图就明白了:



RAID10兼备了RAID1和RAID0的有优点。首先基于RAID1模式将磁盘分为2份,当要写入数据的时候,将所有的数据在两份磁盘上同时写入,相当于写了双份数据,起到了数据保障的作用。且在每一份磁盘上又会基于RAID0技术讲数据分为N份并发的读写,这样也保障了数据的效率。
但也可以看出RAID10模式是有一半的磁盘空间用于存储冗余数据的,浪费的很严重,因此用的也不是很多。
整体对比一下 RAID0、RAID1、RAID5、RAID6、RAID10 的几个特征:




作者:不止思考_奎哥
链接:http://www.imooc.com/article/264962
来源:慕课网
本文原创发布于慕课网 ,转载请注明出处,谢谢合作
推荐阅读:
接手别人的代码,死的心有吗?
普通的程序员和大神级的程序员有什么区别?
网上黑程序员的现实依据是什么?程序员真的那么悲惨吗?
有哪些视频堪称有毒?
暴露真实IP真的没关系吗?
有哪些程序员特有的习惯?
月薪3万的程序员都避开了哪些坑?
和程序猿谈恋爱是一种怎样的体验?
分享到 :
0 人收藏

19 个回复

倒序浏览
2#
gq5lug  1级新秀 | 2022-5-24 06:18:24 发帖IP地址来自 中国
奇偶校验码是没办法知道哪一位出错的,怎么能根据奇偶校验码恢复数据呢?
3#
昆帝  6级职业 | 2022-5-24 06:19:14 发帖IP地址来自 北京
不是哪一位错。是算出丢的那一位是什么。。。前提是没有数据错误,只是坏了一块硬盘,相当于知道在某一个确定的位不知道原来是0还是1了,根据校验算回来。。。
4#
079sb  1级新秀 | 2022-5-24 06:19:29 发帖IP地址来自 北京
这个写的最清楚!
5#
tmqws2  1级新秀 | 2022-5-24 06:19:46 发帖IP地址来自 北京邮电大学
写的很好,学习了
6#
cuqd2  1级新秀 | 2022-5-24 06:20:33 发帖IP地址来自 中国
请问一下影视工作室适合使用哪一种呢?
7#
yynx  1级新秀 | 2022-5-24 06:20:43 发帖IP地址来自 北京
用的最多的RAID5也不好使,一旦出问题恢复很麻烦,万一恢复过程中再坏一块就完了,其实不差那一点钱的话RAID10最好。
8#
bzs9p  1级新秀 | 2022-5-24 06:20:50 发帖IP地址来自 北京
请问如何查看服务器是否安装了磁盘阵列,做的raid几呢?
9#
天上的马刀  1级新秀 | 2022-5-24 06:21:05 发帖IP地址来自 中国
建议直接上RAID10086
10#
bcwms  1级新秀 | 2022-5-24 06:21:45 发帖IP地址来自 山西晋中
牛逼啊,我竟然看懂了,多谢!
11#
mm3rf  1级新秀 | 2022-5-24 06:22:18 发帖IP地址来自 北京
raid3中 有n-1块磁盘用来写数据,但写的内容都不一样吗?如果这样的话,那任意一块坏了,数据不就丢了吗?
12#
l_fvv  1级新秀 | 2022-5-24 06:22:46 发帖IP地址来自 北京
奇偶校验码,不用占存储空间吗?怎么就比双份数据更高效了?是利用率50%跟1/(n+1)的差距吗?转移风险?
13#
caba  1级新秀 | 2022-5-24 06:23:11 发帖IP地址来自 中国
就是说查出来谁叛变或是出轨了[握手]
14#
ioje4u  1级新秀 | 2022-5-24 06:23:43 发帖IP地址来自 中国
有个疑问,在最后RAID10介绍时图片和文字说明好像对应不上。按照图片,应该先是按RAID0把数据分成N份进行并发读写,然后再按RAID1把每份数据写入2个磁盘。
15#
andyxk3  2级吧友 | 2022-5-24 06:24:28 发帖IP地址来自 北京邮电大学
所以叫做校验码而不是校错码
16#
fpn2z  1级新秀 | 2022-5-24 06:24:52 发帖IP地址来自 中国
50% 和 n/(n+1) 的比较啊,n越大利用率越高啊
17#
jo7fo  1级新秀 | 2022-5-24 06:25:04 发帖IP地址来自 中国
做RAID5+1,配一块热备盘。
18#
wuf_e  1级新秀 | 2022-5-24 06:25:49 发帖IP地址来自 北京
第n块磁盘是专门用来存储前面所有n-1块磁盘的校验码的,只要前面n-1块磁盘中任意一块磁盘损坏,都可以通过第n块磁盘来恢复出来,前提是第n块不能坏
19#
jb40  1级新秀 | 2022-5-24 06:26:30 发帖IP地址来自 北京
意思是校验码不是摘要,而是可以通过逆运算计算出原始内容的意思吗?
20#
bw3123  1级新秀 | 2022-5-24 06:26:43 发帖IP地址来自 北京
是这个意思
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:
精华:
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP