第一章 什么是磁盘阵列(raid)

1.1  磁盘阵列(raid)

磁盘阵列(Redundant Arrays of Inexpensive Disks,简称RAID,下同),有“多余的磁盘阵列”之意。原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列是由很多便宜、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。同时利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将数据经计算后重新置入新硬盘中(既数据恢复)。

1.2 常用的磁盘阵列(raid)分成如下几种模式:

RAID0称为条带化(Striping)存储,将数据分段存储于各个磁盘中,读写均可以并行处理。因此其读写速率为单个磁盘的N倍(N为组成RAID0的磁盘个数),但是却没有数据冗余,单个磁盘的损坏会导致数据的不可修复。RAID 0相当于将N块硬盘加起来变成一块硬盘使用。

RAID1镜像存储(mirroring),没有数据校验。数据被同等地写入两个或多个磁盘中,可想而知,写入速度会比较慢,但读取速度会比较快。读取速度可以接近所有磁盘吞吐量的总和,写入速度受限于最慢的磁盘。RAID1也是磁盘利用率最低的一个。如果用两个不同大小的磁盘建立RAID1,可以用空间较小的那一个,较大的磁盘多出来的部分可以作他用,不会浪费。RAID 1相当于将一半磁盘数据做完整备份。

RAID5奇偶校验(XOR),数据以先分块之后再段条带化存储。校验信息交叉地存储在所有的数据盘上。把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上,其中任意N-1块磁盘上都存储完整的数据,也就是说有相当于一块磁盘容量的空间用于存储奇偶校验信息。因此当RAID5的一个磁盘发生损坏后,不会影响数据的完整性,从而保证了数据安全。当损坏的磁盘被替换后,RAID还会自动利用剩下奇偶校验信息去重建此磁盘上的数据,来保持RAID5的高可靠性。RAID 5可以理解为是RAID 0和RAID 1的折衷方案。RAID 5可以为系统提供数据安全保障,但保障程度要比镜像低而磁盘空间利用率要比镜像高。RAID 5具有和RAID 0均以相近似的数据读取速度,只是因为多了一个奇偶校验信息,写入数据的速度相对单独写入一块硬盘的速度略慢。RAID 5相当于用一块盘做数据校验。只能充许在某一时间坏一块磁盘,否则数据无法恢复。

RAID6类似RAID5,但是增加了第二个独立的奇偶校验信息块,两个独立的奇偶系统使用不同的算法, 数据的可靠性非常高,即使两块磁盘同时失效也不会影响数据的使用。但RAID 6需要分配给奇偶校验信息更大的磁盘空间,相对于RAID 5有更大的“写损失”,因此“写性能”非常差。RAID 6充许在某一时间最多同时坏二块磁盘,否则数据也无法恢复。

1.3 几种磁盘阵列(raid)优略势对比:

磁盘阵列(raid)的每种模式从高安全、高并发和使用容量、使用场景几个方面进行分析,如下表格:

DAID模式

RAID 0

RAID 1

RAID 5

DAID 6

支持故障

不支持

支持

支持

支持

冗余类型

副本

校验

校验

硬盘数量

2块以上

2块以上(偶数)

3块以上

4块以上

可用容量

无损失

丢失一半

损失一块磁盘

损失两块磁盘

性能

中间

安全性

最差

最好

较好

应用场景

与其他raid1

5,6组合使用

基本没有单独使用

做操作系统存储使用,对数据要求极高的场景使用

与其他raid 0组合使用,大多数场景使用

与其他raid 0组合使用,对数据要求较高的场景使用

磁盘阵列(raid)的每种模式从磁盘使用空间进行分析,如下表格:

RAID模式

磁盘1

磁盘2

磁盘3

磁盘4

可用容量

RAID 0

1TB

1TB

1TB

1TB

4TB

RAID 1

1TB

1TB

1TB

1TB

2TB

RAID 5

1TB

1TB

1TB

1TB

3TB

RIAD 6

1TB

1TB

1TB

1TB

2TB

第二章 什么是分布式存储系统

2.1 分布式存储系统(Distributed File System)

分布式存储系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。分布式存储系统的设计基于客户机/服务器模式。一个典型的网络可能包括众多不同物理地点(即物理分散)的供多类用户访问的存储服务器。另外,对等特性允许一些系统扮演客户机和服务器的双重角色。通过一个网络环境将多家不同的存储产品或者多台服务器上的磁盘集合在了一起,使得它像一个物理分散但逻辑集中的存储池。

所谓存储池,就是把多个存储介质模块(如硬盘、RAID)通过一定的手段集中管理起来,所有的存储模块在一个逻辑集中的存储池(Storage Pool)中得到统一管理,从主机和工作站的角度,看到就不是多个硬盘,而是一个分区或者卷,就好象是一个超大容量(如1PB=1024TB以上)的硬盘。这种可以将多种、多个存储设备统一管理起来,为使用者提供大容量、高数据传输性能的存储系统,就称之为存储池。

2.2 分布式存储系统的主要功能:

2.2.1 全局文件系统命名

采用文件系统全局命名空间管理技术(既对物理分散不同地点服务器,实现用存储池技术统一管理的全部磁盘),统一文件系统视图(视图是一种虚拟的表,具有物理存储映象作用)通过数据的全局共享,实现同一应用不同服务器之间的高效协作可以在系统中任一节点上实现对所有数据进行管理和备份。

2.2.2 快速数据恢复

利用分布式并行技术让系统重构速度相对传统Raid更快,系统采用高效的自动数据恢复技术,整个存储集群同时并发进行数据恢复,无需人工干预恢复过程不间断相应业务的运行,可保证业务的连续性。

2.2.3 节点级冗余保护数据安全

存储节点级的安全机制,比传统硬盘RAID级别更高,数据更安全,某存储节点(一个服务器)中的一块或多块硬盘出现故障,可以直接更换,自动恢复数据不会影响业务,数据在存储系统中可实现一份以上的备份,任意存储节点坏掉都不会出现数据丢失。可以对文件进行自动复制,如镜像或多次复制,从而确保数据总是可以访问,甚至是在硬件故障的情况下也能正常访问。自我修复功能能够把数据恢复到正确的状态,而且修复是以增量的方式在后台执行,几乎不会产生性能负载。

1备1:2个存储节点以上,空间利用率50%

1备3:4个存储节点以上,空间利用率67%

1备5:6个存储节点以上,空间利用率80%

2.2.4 自由扩展

分布式存储系统中的横向扩展性:随存储容量增加自由扩展存储节点,海量数据存储类似一座“框架式结构”的大厦,有了基础架构,用户可以根据需要自由扩展存储空间。因可以任意扩容,不用预留超大存储空间,节省开支,降低成本,确保更新设备的先进性,避免因过早投入导致的设备老旧。

2.2.5 聚合带宽、线性增长

并行聚合增加I/O带宽,完全分布式并行化数据访问,可以满足大数据流高并发读取,海量数据瞬间呈现,存储容量支持ZB级(1ZB=1024PB,1PB=1024TB),存储节点与存储I/O性能线性增长,满足业务发展产生的容量和性能需求,保持业务的连续性。

2.2.6 低成本,易管理

传统的购买存储设备或软件定制方式下,企业根据信息化管理的需求,一次性投入大量资金购置硬件设备、搭建平台。软件开发则经过漫长的可行性分析、需求调研、软件设计、编码、测试这一过程。往往在软件开发完成以后,业务需求发生变化,不得不对软件进行返工,不仅影响质量,提高成本,更是延误了企业信息化进程,同时造成了企业之间的低水平重复投资以及企业内部周期性、高成本的技术升级。在云存储方式下,企业除了配置必要的终端设备接收存储服务外,不需要投入额外的资金来搭建平台。降低了使用成本,而且对于选定的服务可以立即投入使用,既方便又快捷。

2.2.7 安全可控分布式存储系统

根据党中央与国务院确定的国家发展战略,我国信息技术发展趋势是实现安全可控。其特征是基于国产CPU、国产操作系统、国产中间件装机服务器与客户端环境,整合与升级各类应用。

分布式存储也应尽快适应这一要求。目前,国家档案局自主可控项目研发的分布式存储已率先研发出基于国产CPU、国产操作系统装机服务器环境的、完全自主知识产权的分布式存储系统。

2.3 分布式存储系统对比

分布式存储系统从使用节点数,空间,性能,安全进行分析如下表格:

第三章 磁盘阵列(raid)与 分布式存储系统的区别

3.1 架构分析

这两种存储架构并没有绝对的优劣之分。一方面,磁盘阵列(RAID)以可靠性高、稳定性好,功能丰富而著称,并在以往应用实践中得到了广泛认可,通过RAID可以保证应用服务器不受单块磁盘损坏而丢失数据或中断业务。但与此同时,传统存储阵列也暴露出了横向扩展性差、价格昂贵、弹性缺乏、数据连通困难等不足,容易形成数据孤岛。

3.2 对比优势

磁盘阵列(raid)与分布式存储系统的对比主要从高安全、高并发、易扩展、易整合、易管理和成本方面进行分析如下表格:

特性

磁盘阵列(raid)

分布式存储系统

共享性

FC、SAN设备本身不支持共享,需要共享文件系统支持。集中式存储架构,性能存在局限性,支持客户端数量有限,硬件上,一个存储池被共享访问后性能会急剧下降

基于高效的并行存储技术,系统聚合贷款随着存储节点和规模横向扩大而近线性增长,单个数据对象可以被多个客户端访问而性能不变

扩展性

部分高端磁盘阵列支持在线扩展,容量越大,性能越低

动态无缝的扩展,扩展之后性能得到提高,容量越大,性能越高

可靠性

硬件HA冗余设计,RAID数据保护,RAID组内多块硬盘损坏,会导致单台存储设备失效,会造成数据丢失

硬件系统集群化,数据冗余度可调,可以支持多块磁盘同时损坏,甚至单台存储设备失效也不会影响数据的完整性

故障恢复时间

系统重构需要中断业务,时间很长,硬盘越大,重构时间越长

在线系统快速重构和数据恢复,速度是RAID的5倍,不影响前段业务

完整性

磁盘阵列本身只提供基本的存储空间。共享,镜像,安全等模块都需要另购买第三方软件,要实现一个完成存储方案,需要一个系统集成的过程

系统提供存储、共享、自修复、负责均衡、安全、镜像等完整的功能,无需另购软件

维护升级

厂商私有光纤协议,需要专业工程上门维护,一次升级维护需要2~3天和中断前段业务

基于通用的TCP/IP协议,任何网络维护人员都能承担维护任务,系统自恢复,可以进行在线升级维护

第四章 发展趋势

4.1数据背景

前传统应用的规模不断扩大,大数据、虚拟化、云计算的蓬勃兴起,致使非结构化数据急速膨胀,如下问题困扰着当今很多的企业级用户:预算这么紧张,明年准备扩容,现在的设备还能不能用?业务部分要求系统性能太高,存储IO性能达不到要求?设备规模越来越大,一旦出现故障数据丢失怎么办?项目预算审批不下来,如何让管理者清楚了解到投资价值?企业用户的数据存储和存储设备选都面临着巨大的挑战。与传统的存储设备相比,云存储不仅仅是一个硬件,而是一个网络设备、存储设备、服务器、应用软件、公用访问接口、接入网、和客户端程序等多个部分组成的复杂系统。各部分以存储设备为核心,通过应用软件来对外提供数据存储和业务访问服务。可以说,云存储除在数据存储方面比较有竞争力外,还更加强调它本身的服务特性。

4.2 分布式存储系统的对比分析:

分布式存储系统的对比:

分类

无元数据架构

厂商

初志分布式存储

宏衫

华为

浪潮

是否需要安客户端

存储架构

无独立元数据服务器

无独立元数据服务器

无独立元数据服务器

无独立元数据服务器

文件系统容量

ZB级

128PB

40PB

288PB

存储节点

4096

512

288

300

支持客户端数量

无限制

无限制

无限制

128

在线扩容

支持

支持

支持

支持

数据自动分层

支持

支持

支持

不支持

支持节点间冗余

纠删码+副本

副本

纠删码

纠删码

数据类型

非结构化数据

非结构化数据

非结构化数据

非结构化数据

事件通知

Email、日志

E-mail

E-mail

支持Email,SNMP

客户端兼容性

Windows、Linux;Solaris;AIX;UX;MAC;Vmware;Hyper-v;Xen

Windows、Linux、Mac OS、VMWare ESX、ESXi、XEN、Hyper-V、KVM

Windows、Linux、Unix

Windows、Linux

支持国产CPU/OS装机环境

支持

不支持

不支持

不支持

管理方式

GUI、Web

GUI

GUI

GUI

状态监控

支持

性能监控

支持

系统运行状态,资源状态,性能状态监控

其它功能

全流程追溯

热点数据缓冲、AmazonS3协议

空间配额

基于目录配额

数据接口

10GE/IB

GE/10GE

GE/10GE/IB

10GE/IB

名词解释:

1、容量单位换算公式:1ZB= 1024PB;1PB = 1024GB;1GB = 1024MB;1MB=1024KB;

2、纠删码:纠删码(Erasure Code)作为一种前向错误纠正技术主要应用在网络传输中避免包的丢失,存储系统利用它来提高存储可靠性

3、副本:镜像存储(mirroring),没有数据校验。数据被同等地写入两个或多个磁盘中

4、快照:快照(Snapshot)的定义是:关于指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像

5、GUI:图形用户界面(Graphical User Interface,简称 GUI,又称图形用户接口)

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐