1.华为分布式存储fusionstorage介绍

article/2025/10/5 12:19:16

引论:
行业分布式解决方案:
1.Ceph 应用最多的开源分布式解决方案
2.Glusterfs
3.VMware VSAN
4.fusionStorage 华为

一、传统企业级别存储和Fsuion storage 对比

1.传统企业级存储控制器扩展有瓶颈,存储例如18000V6扩展到32控制器,5300V6可扩展到16个控制器,而FS可扩展到4096个控制节点
2.都可以提供SCSI和ISCSI接口
3.传统企业级存储的网络瓶颈是10GE,16GFC,而FS网络可以是100G的IB组网
4.传统企业级存储高级特性非常多,快照,双活,远程复制,克隆,而FStorage的高级特性少
5.传统企业级存储软件和硬件具有强绑定关系,买华为的存储,那么你拍快照,那么也得买快照的license,而FS本身就是一套软件,这套如软件理论可以安装在任何厂商的服务器上,只要是X86服务器都可以安装
6.传统企业级存储兼容性不好,稳定性好,而FS兼容性好,但是稳定性一般
7.传统存储资源缺乏共享:传统存储设备和资源往往由不同厂家提供,之间无法进行资源共享,数据中心看到的是一个个孤立的存储资源。
7.传统企业存储容量缓存瓶颈通常为GB,Fusion Storage可以缓存扩展到TB级在这里插入图片描述

二、Fsuion storage的优点

  • 数据中心级资源共享:一个数据中心内可以构建一个很大的存储资源池,满足数据中心内各类应用对存储容量,性能和可靠性的需求;实现资源共享和统一管理。
  • 云数据中心的新存储投资选择。
  • FusionStorage采用的DHT算法具有以下特点:
  • 均衡性:数据能够尽可能分布到所有的节点中,这样可以使得所有节点负载均衡。
  • 单调性:当有新节点加入系统中,系统会重新进行数据分配,将现有节点上的少量数据迁移到新节点上,现有节点中的数据不需要做很大调整
  • FusionStorage通过创新的架构把分散的、低速的SATA/SAS机械硬盘组织成一个高效的类SAN存储池设备,提供比SAN设备更高的IO,把性能发挥到了极致;性能提升1-3倍。
  • FusionStorage采用无状态的分布式软件机头,机头部署在各个服务器上,无集中式机头的性能瓶颈。单个服务器上软件机头只占用较少的CPU资源,提供比集中式机头更高的IOPS和吞吐量。
  • 例如:假设系统中有20台服务器需要访问FusionStorage提供的存储资源,每台服务器提供给存储平面的带宽为210Gb,我们在每台服务器中部署1个VBS模块(相当于在每台服务器中部署1个存储控制器),20台服务器意味着可部署20个存储机头,所能获取到的总吞吐量最高可202*10Gb=400Gb,随着集群规模的不断扩大,可以线性增加的存储机头,突破了传统的双控或者多控存储系统集中式机头的性能瓶颈。

(VBS,OSD等会在后面介绍)

fusionStorage能够提供三个版本

  • fusionStorage Block 块存储:课程中学的 fusionStorage Object 对象存储
    fusionStorage file 文件存储

三、分布式存储快速增长

未来10年全球企业分布式存储市场快速增长,预计2027将占存储市场的70%份额。
在这里插入图片描述

四,Fsuion Storage 两大主要应用场景

在这里插入图片描述

  • 开发兼容:兼容主流数据库,兼容主流虚拟化平台,兼容主流服务器。
  • 融合部署:支持虚拟化平台和数据库资源池融合部署,即共用同一个数据中心FusionStorage存储资源池。
  • FusionStorage支持使用SSD替代HDD作为高速存储设备,支持使用Infiniband网络替代GE/10GE网络提供更高的带宽,为对性能要求极高的大数据量实时处理场景提供完美的支持千万级IOPS。

五、FusinStorgae解决方案选择参考

在这里插入图片描述
FsuionStorage 推荐部署在,数据库,云资源池场景下
OLAP:联机事物分析数据库,用于做大数据未来预测的数据库
OLTP:联机事物处理数据库,针对个人的数据预测

六、FusionStorage销售版本

在这里插入图片描述
自愈:其实就是数据恢复,使用DHT环副本进行恢复
IB组网:需要IB组网需要购买高级版本
SSD:如果是全SSD,那么需要购买高级版
以TB为销售单位,容量越大,价格越贵
在这里插入图片描述

七、fusion storage block版本对服务器CPU要求

  • 服务器架构X86,ARM架构

部署方式:

  • 融合部署,CPU要求>八个线程
  • 分离部署,计算节点>四个线程
    存储节点>6个超线程

内存要求:
占用容量=FSA操作系统占用内存+fusionstorage

  • MDC进程占用5G内存
  • VBS进程占用8G内存,如果是IB网卡,VBS占用10G内存
  • OSD进程:

当使用SSD作为主存时,占用内存为=M主存SSD个数【单个SSD设备容量/切分容量默认600GB】
如果有四块1.2T SSD硬盘
那么计算公式是 M41.2T/600G=M8=3.58=28G内存
当切分容量小于<2T时M等于3.5,当切分容量>2T,切分容量每增加2T,M的取值增加1,例如
2T<切分容量<=4T时,那么M=4.5;4T<切分容量<6T时,M=5.5
如果切分单位不为整数那么就四舍五入
固态硬盘容量越大,那么需要的内存越大

当使用机械磁盘做主存时,占用内存(N*该服务器硬盘个数)
其中N根据网络和磁盘类型的不同取值如下:

使用IB组网时:

  • 单个磁盘容量<=2T;N=2.4
  • 单个磁盘容量>2T,容量每增加2T,N的取值增加1
  • 例如:2T<容量<4T,N=3.4 ;4T<容量<=6T,N=4.4

使用10GE组网时

  • 单个磁盘容量<=2T,N=2
  • 单个磁盘容量>2T,每增加2T,N的取值增加1
  • 例如:2T<容量<=4T,N=3 ;4T<容量<=6T,N=4

举例:如果使用10GE组网,四个机械盘,那么N=2的情况下
MDC+VBS+OSD(4块)=5G+8G+(2Gx4)=21G
21G+FSA操作系统占用8g=29G,如果物理机有128G内存,那么99G可以给虚拟机使用

八、fusion storage block版本对服务器磁盘要求

操作系统磁盘需要两个硬盘做RAID1 冗余
主存盘要求:
两副本时,3台服务器起配,每台服务器最少配置4块硬盘,一个存储池最大支持288块盘。
三副本时,3台服务器起配(推荐4台服务器起配),每台服务器最少配置4块硬盘,一个存储池最多配置256台服务器,最大支持2048块盘。

缓存盘要求:
每个服务器上提供给每个存储池使用的缓存数量为0个~4个
同一个存储池中的存储节点上缓存的数量、类型、大小必须一致
当存储池主存类型为SATA盘或者SAS盘时,存储池必须使用缓存。

每个存储池中硬盘数量不能少于12个

  • 同一个资源池中存储节点的硬盘数量差距不能大于2块,不能大于硬盘数量最多服务器的硬盘数的百分之30
  • 此处所指的是服务器上加入存储池的硬盘,并不是服务器上所有的硬盘总数
  • 同一个资源池中的类型必须一致,一个节点是SAS那么其他节点也得是SAS
  • 建议硬盘大小一致,如果硬盘大小不一致,系统会按照最小盘的容量使用
  • 同一个存储池的服务器,建议加入存储池中的槽位尽可能一致,如果不一致,差异槽位磁盘不能加入存储池
  • 如果RAID卡支持直通模式,直接开启直通即可,JBOD
  • 如果RAID卡不支持直通模式,则加入存储池的每一块硬盘必须做RAID
  • 如果只有三个节点,则每个节点需要4个存储盘,1个缓存盘,1个ZK盘,两个系统盘做RAID
  • 如果硬盘类型是SSD则不需要缓存,如果是机械硬盘那么必须使用缓存盘**

九、fusion storage block版本对服务器网络要求

IB交换机,使用IB链路,提供高速的网络速度

三个平面:

  • 管理网络:FSM管理FSA网络
  • 存储网络:各个存储节点之间互联的网络
  • 业务网络:给计算节点对接的网络 iscsi
    在这里插入图片描述

十、技术规格参数

在这里插入图片描述
fusionstage 部署至少需要三个节点,12块硬盘才能组成存储池
单集群支持的计算节点数量:最多可以给10240个计算机节点使用

十一、fusionstorage的部署模式

1. 融合部署:VBS和OSD装在一个服务器中,服务器即用来计算,也用于存储
这种做的好处是,CNA1,也可以使用CNA2上的存储资源,资源共享性高 不改变原有网络拓扑的情况就可以搭建分布式存储

在这里插入图片描述

ps:缓存盘叫cache,用于暂时存储数据,然后写入到数据盘中

2. 分离部署:fusionstorage专门用于存储,不用于计算,计算使用专门的计算节点,高性能数据库应用则推荐采用分离部署的方式VBS和OSD不装在一起分开部署
VBS(用于访问集群内资源所以要部署在计算节点,

在这里插入图片描述

十二、fusionStorage逻辑架构

在这里插入图片描述
fusionStorage 由fusionStorage Manager和fusionStorage Agent 组成

  • FSM(FusionStorage
    Manager):FusionStorage管理模块,提供告警、监控、日志、配置等操作维护功能。一般情况下FSM主备节点部署
  • FSA(FusionStorage
    Agent):代理进程,部署在各节点上,实现各节点与FSM通信。FSA包含MDC、VBS和OSD三种不同的组件。根据系统不同配置要求,分别在不同的节点上启用不同的组件组合来完成特定的功能
    在这里插入图片描述
  • MDC:管理组件,至少需要三个,元数据控制,实现对分布式集群的状态控制,以及控制数据分布式规则、数据重建规则等。
    MDC默认部署在3个节点的ZK(Zookeeper)盘上,形成MDC集群,用来存放mate
    和数据的对应关系,头部数据和实际数据位置的映射表,数据存放在那个机柜那个硬盘中,就是MDC负责的,还负责监控各个节点的状态
  • OSD:存储组件,至少需要12个,提供对象存储设备服务,执行具体的I/O操作。在每个服务器上部署多个OSD进程,一块磁盘默认对应部署一个OSD进程。在SSD卡作主存时,为了充分发挥SSD卡的性能,可以在1张SSD卡上部署多个OSD进程进行管理,例如2.4TB的SSD卡可以部署6个OSD进程,每个OSD进程负责管理400GB
  • VBS:计算组件,虚拟块存储管理组件,负责卷元数据的管理,提供分布式集群接入点服务,使计算资源能够通过VBS访问分布式存储资源。每个节点上默认部署一个VBS进程,形成VBS集群。节点上也可以通过部署多个VBS来提升IO性能,加入FSA节点,不装VBS服务器那么他只能用本地磁盘,装了VBS就可以用Fsuion
    storage 集群内的空间了(集中式部署情况),VBS负责切分业务数据,将文件切分为1m大小,然后交给OSD处理,最终存放到硬盘上
  • Zk:防止集群脑裂,一个系统需要部署3,5,7基数个ZK,为MDC集群提供仲裁,ZK至少三个,必须保证大于总数一半的ZK处在活跃才可以访问,
  • 什么情况会造成脑裂?
    例如fs有6个节点,其中有两个FSM,6个FSA,当FSA1到3之间只能和FSM2通信,但是不能和FSM1通信,FSM1,2
    之间也不能通信时,就会造成脑裂将形成两个集群,集群一中有3个FSA,集群二中也有三个FSA,但是集群1中有3个ZK活动,而集群二中只有2个zk活动,那么这个时候集群二就会选择自杀,集群一处于活跃状态,可以提供访问

解释:MDC相当于管理组件,至少部署三个,OSD相当于硬盘管理组件,每个硬盘至少部署一个,VBS相当于计算组件,如果FSA上不装VBS,那么他只能使用本地的硬盘,该情况直针对部署模式

十三、FsuionStorage备份容灾方案

在这里插入图片描述
虚拟机可以使用ebackup方案进行备份,数据库可以使用Oracle自带的NBU

在这里插入图片描述
VRG由华为容灾软件UltraVR配套提供。
虚拟机通过VRG来进行数据中心备份
数据库可以使用Oracle自带的DataGuard进行容灾


http://chatgpt.dhexx.cn/article/AtYJ9o1u.shtml

相关文章

使用ceph搭建分布式存储系统

实验目的&#xff1a; 掌握ceph的配置和使用方法掌握分布式存储系统架构规划和设计方法理解块存储&#xff0c;文件存储&#xff0c;对象存储的实现方法 实验步骤&#xff1a; 1.规划设计 准备四台虚拟机&#xff08;有条件部署三台服务器&#xff0c;一台计算机更好&#…

RAID和分布式存储的对比

传统的存储&#xff0c;一般是指用商用硬盘构建稳固的存储系统&#xff0c;通常会用到RAID技术&#xff0c;这是一种被研究的很透彻的存储技术&#xff0c;有大量的相关软硬件&#xff0c;成本已降低到可接受的程度。 分布式存储&#xff0c;一般是指用大量廉价的磁盘&#xf…

软硬件结合,分布式数据库存储架构优化实践

本文将介绍分布式数据库--KaiwuDB 的存储架构&#xff0c;以及 KaiwuDB 技术团队在其 KV 存储引擎基础上所做的优化实践。 KaiwuDB 整体存储架构 KaiwuDB 采用分层架构&#xff0c;分为计算层与存储层&#xff0c;其总体架构如下图所示&#xff1a; 在 OLTP 场景下&#xff0…

分布式存储系统HDFS

3.1 HDFS简介 Hadoop平台解决两大核心问题&#xff1a; 分布式存储分布式处理 HDFS就是解决海量数据分布式存储 背景&#xff1a;大数据时代&#xff0c;对于海量的数据&#xff0c;单个计算机无法处理&#xff0c;只能借助整个集群来处理海量数据。 文件系统结构&#xff0…

分布式MySQL架构

分布式数据库一般是以下的这种结构&#xff0c;计算层获取元数据层信息进行路由。下面说下各个层级的目的&#xff1a; &#xff08;1&#xff09;计算层就是单机时的SQL层&#xff0c;用来对数据访问进行权限检查、路由访问&#xff0c;以及对计算结果等操作。 &#xff08;2…

搭建分布式存储服务minio详细过程

最近项目的存储量比较大&#xff0c;考虑项目后期存储需要拓展&#xff0c;决定使用分布式存储&#xff0c;综合考察后&#xff0c;最终选定使用minio作为存储服务。以下是使用步骤&#xff0c;MARK一下&#xff01; 1、服务器 192.168.40.124 192.168.40.1282、创建目录 本集…

分布式存储概述

一、数据分类及存储分类 数据分为元数据和数据 分布式数据存储的实现&#xff1a; 元数据即是文件的属性信息(文件名、权限(属主、属组)、大小、更新时间等)&#xff0c;元数据就是有一种路由机制&#xff0c;即当客户端或者应用程序产生的客户端数据被写入到分布式存储系统的…

分布式存储 HDFS原理

思维导图&#xff1a; 分布式存储 一、NameNode 1接收客户端的请求 管理元数据&#xff08;文件上传时间、文件权限、文件属主、大文件的block数及blockId号&#xff09; 管理集群 二、SecondaryNameNode 持久化内存中的元数据。 因为内存不稳定&#xff0c;可以将数据持…

分布式存储系统Minio简介

Minio 是一个基于Go语言的对象存储服务。它实现了大部分亚马逊S3云存储服务接口&#xff0c;可以看做是是S3的开源版本&#xff0c;非常适合于存储大容量非结构化的数据&#xff0c;例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等&#xff0c;而一个对象文件可以是任意…

分布式存储技术的对比分析与应用

主流分布式存储技术的对比分析与应用 随着数字化转型的深入&#xff0c;海量数据对存储提出了新的要求。传统存储虽然有技术成熟、性能良好、可用性高等优点&#xff0c;但面对海量数据&#xff0c;其缺点也越来越明显&#xff1a;如扩展性差、成本高等。为了克服上述缺点&…

分布式存储架构一-分布式存储概念

分布式存储系统是由大量廉价普通PC服务器通过Internet互联&#xff0c;对外作为一个整体提供服务的系统。它的规模大且成本低。 分布式存储系统的特性&#xff1a; 可扩展&#xff1a;分布式存储系统能扩展几百到几千台的规模&#xff0c;随着集群数量的提升&#xff0c;它的…

分布式系列之开源分布式存储技术分析

分布式存储在云计算及容器技术中将广泛使用&#xff0c;本文仅简单介绍了下几个主流的开源分布式技术&#xff0c;整个分布式存储系列相当复杂&#xff0c;文中介绍略微粗浅且当引子。 1、集中式存储和分布式存储 1.1 存储类型 常见的存储类型有三种&#xff1a;块存储、文件…

浅谈分布式存储架构: IPFS和HDFS

分布式存储架构是一个复杂的系统工程&#xff0c;针对特定应用的数据存储有不同的系统架构解决方案。不同的存储方法会影响存储性能、存储成本、冗余度、工程复杂性等。 分布式存储的历史 分布式存储最早是由谷歌提出的&#xff0c;其目的是通过廉价的服务器来解决大规模&…

开源分布式存储架构概览

关注「开源Linux」&#xff0c;选择“设为星标” 回复「学习」&#xff0c;有我为您特别筛选的学习资料~ 材料提纲包括三部分内容&#xff1a; 1、基本思想和关注的问题 2、四种开源分布式存储系统概览&#xff08;HDFS 、GlusterFS 、OpenStack Swift、Ceph&#xff09; 3、以…

FISCO BCOS 2.0原理解析: 分布式存储架构设计

FISCO BCOS 2.0新增对分布式数据存储的支持&#xff0c;克服了本地化数据存储的诸多限制。 在FISCO BCOS 1.0中&#xff0c;节点采用MPT数据结构&#xff0c;通过LevelDB将数据存储于本地&#xff0c;这种模式受限于本地磁盘大小&#xff0c;当业务量增大时数据会急剧膨胀&…

杉岩PACS影像系统分布式存储架构

该医院创建于1999年&#xff0c;是深圳市政府投资建成的集医疗、教学、科研和预防为一体的现代化三级综合性医院。2017年通过三级甲等医院复审。2018年&#xff0c;医院年门急诊总量约292万人次&#xff0c;年出院病人近7.4万人次&#xff0c;年手术量4.9万台次。 该院在深圳有…

Ceph分布式存储 原理+架构图详解

分布式存储Ceph ceph介绍 ceph是一个统一的、分布式的存储系统&#xff0c;设计初衷式提供较好的性能(io)、可靠性(没有单点故障)和可扩展性(未来可以理论上无限扩展集群规模)&#xff0c;这三点也是集群架构所追求的。 统一性 : 意味着我们可以仅凭ceph这一套存储系统&…

几种分布式存储组网架构参考

作 者&#xff1a; NGDCN 原文链接&#xff1a;几种分布式存储组网架构参考 - NGDCN 版 权&#xff1a; 本文由 NGDCN 于2022-11-12原创发布在 NGDCN&#xff0c;未经许可&#xff0c;禁止转载。 1、名词解释 ◼ VBS&#xff1a;云硬盘备份&#xff08;Volume …

谈谈Java内存模型

谈谈Java内存模型 什么是JMM为什么需要这种规范呢&#xff1f;三大特性在Java中是怎么满足的呢&#xff1f; 什么是JMM Java Memory Model &#xff0c;Java内存模型&#xff0c;是一种共享内存系统中多线程程序读写操作行为的规范&#xff0c;它是一种屏蔽了各种硬件和操作系…

Java内存模型及管理

1. 概述 多任务和高并发是衡量一台计算机处理器的能力重要指标之一。一般衡量一个服务器性能的高低好坏&#xff0c;使用每秒事务处理数&#xff08;Transactions Per Second&#xff0c;TPS&#xff09;这个指标比较能说明问题&#xff0c;它代表着一秒内服务器平均能响应的请…