• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

华为云计算IE面试笔记-fusionstorage相对于传统集式存储的优势

武飞扬头像
魔仙堡的仙女
帮助5

fusionstorage是华为研发的一款分布式存储软件,可以将X86架构的服务器组成一个存储池,向上提供统一的存储能力。

传统存储:一般是指SAN存储、NAS存储、对象存储,是一种硬件存储,硬件和软件是强耦合的。

1. 数据保护方式:FusionStorage是副本机制,传统存储是RAID

2. 成本:FS价格比较低廉,性价比较高,传统存储价格比较昂贵

3. 组网:传统存储的组网成本高,但是组网逻辑简单;Fusionstorage组网成本低(由于都是通用设备),但是组网逻辑复杂(区分开管理网络和存储网络)。

4. 部署方面:传统存储部署简单;Fusionstorage部署过程较为复杂

5. 性能:Fusionstorage大场景使用性能比较好,因为采用分布式架构,数据分散存放,多个控制进程的存在,处理并发IO;传统存储小场景使用性能比较好,传统存储数据处理上并发IO容易产生瓶颈,多种不同业务使用相同控制器会导致控制器压力过大造成性能下降(控制器瓶颈)。

6. 维护/扩展:传统存储,在多厂商异构的时候,维护工具太多,维护平台和维护的方法由于厂家的不同,会不一样;受控制器的限制,扩展比较困难,通常是2—16控(控制器最大达到16控,中端8控,高端16控),高端存储可以实现32甚至到64控的。存在元数据瓶颈。

Fusionstorage,由于Fusionstorage可以由不同厂家的服务器来组成的存储池,在组成存储池时已经去差异化了。管理界面统一,易于维护;采用分布式控制器(分布式软件机头VBS),可线性扩展到4096个节点。

7. 场景:对业务稳定性可靠性要求比较高的场景用传统存储。 

FusionStorage由于是服务器组成的存储池,受制于X86架构服务器本身的稳定性,适合追求高性能的应用。由于Fusionstorage对虚拟化的支持较好,可以和虚拟化环境合布,充分利用服务器本地的资源。所以说虚拟化场景选择Fusionstorage相对来说多一点。适合大规模存储场景(虚拟化数据中心或者私有云场景等)

8. 数据重建:fs 数据重建时间短  传统存储数据重建时间较长

9. cache:fs通常为TB级,分布式cache(每个服务器上加一个SSD盘做分布式Cache,众多的SSD盘做Cache空间);传统存储cache由内存提供通常为GB级,可以达到TB,但是成本高

10. 掉电保护:FusionStorage使用保电介质来保存元数据和缓存数据,程序运行过程中会把元数据和缓存数据写入保电介质中,以防掉电而丢失

10. 管理 专用的存储管理(bcmanager)

学新通

*FusionStorage对比传统存储有哪些缺点、劣势?(考到)

1. FusionStorage至少三点节起步,并且在节点数据量/节点数达到一定规模后性能才能赶上传统存储

2. 小规模场景, FusionStorage 的实施比传统存储复杂许多

3. 资源要求过高:存储要求、计算要求(CPU、内存)

4. FusionStorage并不支持数据容灾,在应用FusionStorage的场景,只能通过上层完成

5. FusionStorage由于采用分布式架构,延迟较大些,不适用于对时延敏感的业务(如OLTP)传统存储可使用FusionCompute链路,延时较低,利用率高

6. FusionStorage采用两副本或三副本的机制,存储利用率较低

7. FusionStorage目前不像某些传统存储(例如华为的统一存储)同时提供文件存储、对象存储服务(不支持同时提供)

小规模场景:至少三台服务器,共 12 盘,服务器级安全

大规模场景:至少 12 台服务器,至少三个机柜,机柜级安全

*传统存储的优点:

1. 读写连续,适用于高IO密度的读写。

2. 专业存储设备,设备可靠性较高。

*Server SAN 是什么?有哪些特征?

FS是Server SAN的一种。

概念:由多个独立服务器自带的存储组成一个存储资源池,同时融合了计算和存储资源

特征:1、专有设备(传统存储)变通用设备(x86部署fs)  

2、计算与存储线性扩展  

3、简单管理、低TCO

*FusionStorage对比传统存储有什么优势? 

目前,部分传统存储进行IB组网,但并非标配。

V3存储使用smartcache特性,将SSD盘作为介质提供读缓存,使读缓存也能够达到TB级别。

教材中介绍,传统存储数据重建慢,指的是T系列存储的盘级虚拟化技术,以整块盘为单位,重构到热备盘,数据重构的时候无法实现并发性重构。而V3存储底层使用的是raid 2.0 技术,同样可以实现并发性的重构,重构速度较快。

学新通

 学新通

*为什么用 VBS 就可以扩展到 4096 个节点?

VBS等于传统存储的控制器 可以扩展到4096节点 因为他是分布式 无状态的 

首先,4096 个节点是指 FusionStorage 产品规格上支持分布式无状态软件控制器节点的数量;其次,元数据服务是由 VBS 负责,而元数据服务是由控制器提供。

*何为线性扩展?(考到)

1. 在增加节点的同时,即能扩展存储系统的性能也能扩展存储系统的容量。(扩展计算和存储)

2. 在增加 VBS 节点数量时性能线性增长。

*元数据服务集中于机头,易出现性能瓶项?

传统存储,针对于某个LUN而言,它的元数据集中于某个控制器,当过多的主机使用同一个LUN的时候,都要经过机头访问它的元数据,所以这种情况下,元数据就会出现瓶颈。

而FusionStorage是分布的无状态的,当访问同一个LUN的时候,或者去操作元数据的时候,都是通过VBS来操作的,且通过DHT算法算出来的。

*FusionStorage 扩展到4096 个节点,会带来什么问题?

1. 节点多,VBS占用存储多,浪费磁盘空间多;

2. 不够绿色节能;

3. 系统启动会变慢;主VBS性能瓶颈

4. 数据庞大,无法进行容灾;

*FusionStorage 如何保障数据的可靠性

副本机制:数据存储时被分片打散到多个节点上,这些分片数据支持分布在不同的存储节点、不同的机柜之间,同时数据存储时采用多副本技术、支持两副本或三副本(副本数量可在初次配置时进行设置,运行后不可更改),数据会自动保存多份,每一个分片的不同副本也被分散保存到不同的存储节点上。 

快速数据重建:在硬件发生故障导致数据不一致时,FusionStorage通过内部的自检机制,通过比较不同节点上的副本分片,自动发现数据故障。发现故障后启动数据修复机制,在后台修复数据。由于数据被分散到多个不同的存储节点上保存,数据修复时,在不同的节点上同时启动修复,每个节点上只需修复一小部分数据,多个节点并行工作,有效避免单个节点修复大量数据所产生的性能瓶颈,对上层业务的影响做到最小化。 

掉电保护:系统运行过程中可能会出现服务器突然掉电的情况,FusionStorage使用保电介质来保存元数据和缓存数据,以防掉电而丢失。FusionStorage支持的保电介质为NVDIMM内存条或SSD。程序运行过程中会把元数据和缓存数据写入保电介质中,节点异常掉电并重启后,系统自动恢复保电介质中的元数据和缓存数据。 

*怎么看待以后存储的方向

1. 偏向于分布式的架构,比如 FusionStorage 这种分布式块存储软件

2. 机头,io,网络没有瓶颈 

3. 管理方便,中低端存储可能被 server SAN 替代,高端领域仍然是高端存储的天下;

*FusionStorage存储池要求:

1. 磁盘类型一致

2. 磁盘大小一致(按照最小的来算)

3. 最小12块盘(OSD)

4. 非SSD场景下,要有一块SSD作为缓存盘

5. 2两副本 228块盘,3副本 2048块盘

学新通

*FusionStorage资源池具有什么特点?

1. 系统自动保证多个数据副本分布在不同的服务器上。

2. 系统自动保证多个数据副本之间的数据强一致性。

3. 用户数据以Key-Value的方式存储在硬盘上。

4. 对上层应用提供卷设备(Volume),使用简单。

5. 系统自动保证每个硬盘上的数据量均衡,避免出现集中的热点。

6. 资源池内所有硬盘都可用作资源池的热备盘,在 2副本场景下,单个资源池最大支持96块硬盘。在3副本场景下,单个资源池最大支持 2048块硬盘。

*FusionCompute 所支持的虚拟磁盘文件格式有哪些?

1、普通硬盘: raw   2、普通延迟置零、精简: vhd

*FusionStorage是不是虚拟化数据存储?

不是,虚拟化数据存储特指由CNA自身实现的虚拟化特性,例如快照、精简磁盘等,即对应存储虚拟化为主机存储虚拟化 文件系统。FusionStorage支持虚拟化特性,是通过 FusionStorage存储系统自身机制实现的,CNA并未参与。

*传统存储和 FusionStorage 可靠性方面如何考虑?

传统块存储:是通过一些机制保障了可靠性;(阵列和算法);有 BBU 掉电保护(掉电后BBU 供电将缓存的数据存放在内置的保险盘中)

FusionStorage:是通过副本机制保证;数据重建,掉电保护

*推荐客户用 FusionStorage 有什么难处?(fs的劣势)

1. 客户对分布式存储认识比较少,推广得不够;

2. 因为国内案例比较少,客户担心一个稳定性问题;

3. 不支持 FusionCompute 网络,担心性能问题;

4. 无法备份数据,客户担心数据的安全性;

5. 不支持数据容灾,需要通过上层完成

6. 传统存储有专业的运维人员;分布式存储没有形成专门的维护团队;

7. 小规模场景部署 FusionStorage 比较复杂

*针对部分业务,为什么客户会偏向使用传统存储?

1. 传统存储具有部署简单,上线快等优点;

2. 传统存储安装调试简单;

3. 一些核心关键业务需要传统存储,保证最低延迟,高IOPS

4. 传统存储支持许多高级特性

5. FusionStorage 初始投资高

*FusionStorage是如何实现分布式的?

FusionStorage Block存储软件的采用全分布式的架构:分布式管理集群,分布式哈希数据路由算法,分布式无状态机头、分布式智能Cache等,这种架构使得整个存储系统没有单点故障。

*什么情况下应该选择传统存储?

1. 小规模场景;

2. 需要高级特性场景;

3. 对延迟有一定要求的场景;

*IOPS 较高数据库场景为什么选择传统存储?

1. 传统存储支持 FusionCompute 组网,FusionCompute 具备更好的网络访问性能;FusionStorage 不支持;

2. 数据库对延迟要求比较小;

3. 因为高性能的数据库对文件系统有依赖

*传统存储是否可以统一管理?

可以。需要单独引入存储统一管理软件,它利用南向对接不同厂商、系列的存储设备,北向提供统一的界面,达到统一管理的目的。但这相对于FusionStorage统一管理而言,它并非天生就具备的,而是引入外物实现,且体验度有待探究

*适合使用FusionStorage的应用场景有哪些?

FusionStorage 的主要应用场景分为两大类:

1. 一类是在大规模云计算数据中心中,将通用X86存储服务器池化,建立大规模块存储资源池,提供标准的块存储数据访问接口(SCSI和iSCSI等)。支持各种虚拟化Hypervisor 平 台和各种业务应用(如SQL、Web、行业应用等等);可以和各种云平台集成,如华为 FusionSphere、VMware、开源Openstack 等,按需分配存储资源。

2. 适用于数据成本、价值低的场景,比如说爱奇艺、腾讯视频等视频存放。

*SmartCache特性

SmartCache特性是一种采用SSD盘作为介质提供读缓存的特性,与普通缓存资源 RAM Cache 配合实现了对热点数据的读加速,提高整个存储系统的性能。

SmartCache特性在对SSD盘资源进行管理上,分为智能缓存池和SmartCache 分区两部分。 开启SmartCache功能前,数据不区分冷热程度,都存放在机械硬盘中。由于机械硬盘需要占用一定的寻道时间,所以读取数据所需的时间较长,数据的读性能不高。

开启SmartCache功能后,存储系统将热点数据拷贝至 SSD盘组成的智能缓存池中。由于SSD 盘与机械硬盘相比,没有寻道时间,所以利用SSD盘的优势可以大大减少热点数据的读取时间,提高热点数据的读性能。

*FusionStorage的容灾特性

FusionStorage 双活特性中的两个数据中心互为备份,且都处于运行状态。当一个数据中心发生设备故障,甚至数据中心整体故障时,业务自动切换到另一个数据中心,解决了传统灾备中心不能承载业务和业务无法自动切换的问题。提供给用户高级别的数据可靠性以及业务连续性的同时,提高存储系统的资源利用率。

FusionStorage 远程复制特性通过对主从两端的数据进行周期性同步,实现系统容灾,从而最大限度减少由于数据远程传输的时延而造成的业务性能下降。

补充:

双活:FusionStorage V100R006C20版本及其后续版本。

远程复制:FusionStorage V100R006C30 版本及其后续版本。

目前6.3.1 LAB考试配套版本为FusionStorage Block V100R006C20SPC200

分布式存储软件系统通常具备怎样的特点?

第一,高性能:分布式哈希数据路由,数据分散存放,实现全局负载均衡,不存在集中的数据热点,大容量分布式缓存;

第二,高可靠:采用集群管理方式,不存在单点故障,灵活配置多数据副本,不同数据副本存放在不同的机架、服务器和硬盘上,单个物理设备故障不影响业务的使用,系统检测到设备故障后可以自动重建数据副本;

第三,高扩展:没有集中式机头,支持平滑扩容,容量几乎不受限制;

第四,易管理:存储软件直接部署在服务器上,没有单独的存储专用硬件设备,通过 Web UI的方式进行软件管理,配置简单。

数据存储的有哪些? 

1、虚拟化数据存储: 虚拟化本地硬盘、虚拟化SAN存储、NAS存储、FusionStorage存储池 

2、RDM (Raw Device Mapping)是VMware服务器虚拟化环境中,用以允许一个虚拟机直接访问SAN(Storage Area Networking)中的一个存储LUN(Logical Unit Number)。从VMware ESX 2.5开始,RDM(Raw Device Mapping)允许VMFusionStorage文件卷中一个特殊的文件当作一个Raw Device (裸设备)的代理。RDM也可以叫做裸设备映射,虚拟机直接使用存储中的LUN,而不经过虚拟化层。

数据存储是虚拟化或非虚拟化的本质差别。

1、当数据存储的虚拟化特性是由主机侧去实现时,其根本就是将存储设备格式化为文件系统。本地存储格式成 ext4,共享存储格式成 vims。 

2、非虚拟数据存储,就是一个块设备。

FusionStorage容灾特性的部署方式

容灾功能既可以部署在独立的节点上,也可以部署在存储节点上。即复制节点既可以独立存在,也可以与存储节点合一。容灾服务包括复制控制和复制业务。

    复制业务:用于pair、一致性组的管理和数据搬移操作。

    复制控制:用于管理集群节点和集群元数据,支持3个或5个或7个节点,其中复制控制集群的ZK和CCDB 进程需要本地存储用于记录元数据信息。

融合部署:容灾服务与存储服务融合部署方式是指将容灾服务安装在存储节点上,没有单独的复制节点,由存储节点提供容灾服务。

学新通

独立部署方式是指将容灾服务安装在独立的复制节点上。

学新通

考试追问:

传统存储的SSD缓存与FS存储的SSD缓存有什么区别?

传统存储的SSD缓存是集中的,

FS的SSD是分布式的,动态线性增长。

两个缓存的写缓存有什么区别?

副本机制怎么实现?

归属MDC负责partition划分,更新partition view给OSD,决定OSD主备也就是副本关系,VBS根据DHT算法找到partition和OSD对应关系,OSD主与备通过RSM同步数据,OSD切块。

传统存储怎么实现数据重建?

可能通过RAID或RAID2.0 来进行数据重建。

EC机制怎么实现的,EC机制只有FS有吗?

EC:纠删码机制,相当于传统存储的RAID,类似于用软件实现的RAID。在保护数据的时候通过数据盘 校验盘的方式来做,然后4D 1P(4块数据盘 1块校验盘)一共5块盘,坏了一块盘无影响,可以被恢复。

EC机制不是只有FS有。

机头瓶颈中VBS是什么?为什么是4096个,他是部署在每个服务器上吗?

VBS是分布式无状态机头。

VBS之间要形成集群关系,fs规格最大支持4096个,若更多会对性能产生更大影响。

是部署在每个服务器上的。

MDC故障怎么处理?

主MDC故障,ZK会进行MDC的重新选主。

其他MDC故障,会上报告警。

VBS故障怎么处理?

主VBS故障,其他VBS会向主MDC注册,进行重新选主。

其它VBS故障,会上报告警。

传统存储与FS的数据可靠性谁有优势?容灾呢?

数据可靠性和容灾都是传统存储更有优势。

FS和集中式存储应用场景

集中式存储(传统存储)适用于业务要求高并发、低延迟场景,FS适用于海量存储、多业务应用场景。

数据库适合什么存储?

传统存储

fs和传统存储哪个性能好

小规模传统好

大规模 fs好,FS有时延问题

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhfhebek
系列文章
更多 icon
同类精品
更多 icon
继续加载