powerha_IBM PowerHA集群中的自动存储库磁盘替换(ARR)

article/2025/9/17 0:37:33

IBM PowerHA SystemMirror 7.2版引入了一项称为自动存储库磁盘替换(ARR)的新功能。

配置此功能后,当活动集群存储库磁盘发生故障或无法访问时,可以防止集群进入受限模式 。 当检测到存储库磁盘故障,集群感知AIX(CAA),PowerHA的子系统时,会将集群存储库更新为备份列表中的任何其他可用备份存储库,并且集群将处于工作模式。

存储库磁盘的定义和受限模式

存储库磁盘是在群集的所有节点之间共享的磁盘,并充当配置和群集管理操作的中央存储库。

在PowerHA的早期版本中,如果存储库磁盘发生故障,则集群将进入受限模式。 当群集处于受限模式时,仅允许进行关键的群集配置操作,例如将资源组从活动节点移动到备用节点。大多数与拓扑相关的操作,例如将节点添加到群集或进行同步不允许群集。 为了使群集脱离受限模式,管理员需要手动干预,在该操作中,必须手动配置备用存储库磁盘。

如何使用ARR防止群集进入受限模式?

在PowerHA 7.2版或更高版本中,管理员最多可以配置六个备份磁盘,这些备份磁盘可用作存储库磁盘。 当存储库磁盘发生故障时,PowerHA的CAA子系统将自动使用备用的预定义备份存储库替换并重建发生故障的存储库。 此交换将在syslog.caa文件中记录通知和信息。

如果您有一个链接集群,其中有两个站点及其各自的CAA集群和关联的存储库磁盘,则可以为每个站点配置六个备份存储库磁盘。 由于标准群集和扩展群集只有一个CAA群集,因此可以配置六个备份存储库磁盘。

支持的软件版本和前提条件

ARR功能需要以下版本的PowerHA和AIX软件:

  • PowerHA SystemMirror版本7.2或更高版本。
  • 以下是IBMAIX®操作系统的以下版本之一:
    • AIX 7.1.4或更高版本
    • AIX版本7.2.0或更高版本
  • 相应的可靠可伸缩集群技术(RSCT)版本以及AIX版本。

ARR的PowerHA集群配置

图1:具有相同集群存储库和备份磁盘的扩展集群

在本文中,我们将考虑一个具有两个站点的扩展集群,其中每个站点由一个节点组成。 SiteA是生产站点,SiteB是辅助站点。 Node1与SiteA关联,Node2与SiteB关联。

以下是具有一个网络和一个资源组的群集配置。

(0) root @ Node1: /
# cltopinfo
Cluster Name:    Node1_cluster
Cluster Type:    Stretched
Heartbeat Type:  Multicast
Repository Disk: hdisk1 (00f601736b563ee7)
Cluster IP Address: 228.40.1.43
Cluster Nodes:Site 1 (SiteA):Node1Site 2 (SiteB):Node2There are 2 node(s) and 1 network(s) definedNODE Node1:Network net_ether_01Node1   10.40.1.43NODE Node2:Network net_ether_01Node2   10.40.1.44Resource Group RG1Startup Policy   Online On Home Node OnlyFallover Policy  Fallover To Next Priority Node In The ListFallback Policy  Fallback To Higher Priority Node In The ListParticipating Nodes      Node1 Node2

在此群集配置中, hdisk1(00f601736b563ee7)具有caavg ,它是Node1和Node2的群集存储库,并且所有与群集相关的操作均从Node1执行。 从Node1完成同步后,对群集的所有更改都将传播到整个群集节点。

(0) root @ Node1: /
# lspv
hdisk0          00f60173354ccb32                    rootvg          active
hdisk1          00f601736b563ee7                    caavg_private   active(0) root @ Node2: /
# lspv
hdisk0          00f60173354cc8d9                    rootvg          active
hdisk1          00f601736b563ee7                    caavg_private   active

也可以在PowerHA clmgr实用程序命令的帮助下进行查看。

(0) root @ Node1: /usr/es/sbin/cluster/utilities
# clmgr query repository
hdisk1 (00f601736b563ee7)(0) root @ Node2: /usr/es/sbin/cluster/utilities
# clmgr query repository
hdisk1 (00f601736b563ee7)

对于PowerHA 7.2版和更高版本,运行集群的查询命令可指定是否使ARR可用。

(0) root @ Node1: /
# clmgr query cluster
CLUSTER_NAME="Node1_cluster"
CLUSTER_ID="1496423755"
STATE="OFFLINE"
TYPE="NSC"
HEARTBEAT_TYPE="MULTICAST"
CLUSTER_IP="228.40.1.43"
REPOSITORIES="hdisk1 (00f601736b563ee7)"
VERSION="7.2.0.1"
VERSION_NUMBER="16"
EDITION="ENTERPRISE"
AGREE_TO_COD_COSTS="false"
ONOFF_DAYS="30"
LPM_POLICY=""
HEARTBEAT_FREQUENCY_DURING_LPM="0"
NETWORK_FAILURE_DETECTION_TIME="20"
AUTOMATIC_REPOSITORY_REPLACEMENT="available"

图2显示了配置ARR之前, HACMPsircol对象数据管理器(ODM)在群集节点之一上的对象的输出。 如您backup_repositorybackup_repository字段为空。 HACMPsircol是ODM中与PowerHA相关的对象之一。 该对象将集群信息与存储库磁盘信息一起存储。

图2:添加备份存储库磁盘之前的HACMPsircol输出

您可以使用系统管理界面工具(SMIT)菜单或PowerHA clmgr实用程序命令行界面为ARR添加备份存储库。 在本文中,我们将看到如何使用SMIT添加备份存储库磁盘。 请参考以下命令,以使用clmgr实用程序添加备份存储库磁盘。

(0) root @ Node1: /
# clmgr add repository -?clmgr add repository <disk>[,<backup_disk#2>,...] \[ SITE=<site_label> ] \[ NODE=<reference_node> ] \[ DISABLE_VALIDATION={false|true} ]add => create, make, mkrepository => rp

在命令提示符下使用smit hacmp命令打开SMIT界面,然后选择以下选项以添加备份存储库磁盘(如图3所示)。

Smit hacmp→群集节点和网络→管理存储库磁盘→添加存储库磁盘。

此操作在Node1上执行。 此后,您需要验证并同步整个集群中的更改。

图3:添加备份存储库磁盘

接下来,您需要从可用磁盘列表中选择备份存储库。 在这种情况下,将选择四个备份磁盘,如图4所示。ARR最多允许六个磁盘。

图4:从可用共享磁盘中选择一个备份台

添加磁盘后,如果磁盘成功添加到集群,则会显示命令状态消息(如图5所示)。

图5:添加备份磁盘后的命令状态

下一步是同步集群,以使配置反映在集群的所有节点上。 可以使用PowerHA提供的验证和同步选项来完成此操作。

集群同步后,配置更改会反映在集群的所有节点上。 在每个节点上使用clmgr view report repository命令验证此信息。 这使您能够识别添加为备份磁盘的磁盘,以及当前群集处于活动状态的磁盘。

站点A上的Node1

(0) root @ Node1: /
# clmgr view report repository
Node1_cluster :00f601736b563ee7 hdisk1(Node2)   active00f601736b563dad hdisk2(Node2)   backup00f601736b563cba hdisk3(Node2)   backup00f601736b563b84 hdisk4(Node2)   backup00f601736b563aa4 hdisk5(Node2)   backup

站点B上的Node2

(0) root @ Node2: /
# clmgr view report repository
Node1_cluster :00f601736b563ee7 hdisk1(Node2)   active00f601736b563dad hdisk2(Node2)   backup00f601736b563cba hdisk3(Node2)   backup00f601736b563b84 hdisk4(Node2)   backup00f601736b563aa4 hdisk5(Node2)   backup

在此,hdisk2,hdisk3,hdisk4和hdisk5是备份存储库磁盘。

现在,每个群集节点上的HACMPsircol ODM对象都包含存储库磁盘的物理卷ID(PVID)。 图6显示了输出以及存储库磁盘和备份磁盘列表。

图6:添加备份磁盘后的HACMPsircol输出

设置备份磁盘后,启动群集服务并等待群集稳定。

磁盘故障演示ARR

如图6所示,PVID为"00f601736b563ee7" (hdisk1)的磁盘"00f601736b563ee7" (hdisk1)是集群存储库处于活动状态的磁盘。 出于演示目的,我们将使hdisk1上的I / O失败,如果该磁盘是虚拟小型计算机系统接口(VSCSI),则可以通过从虚拟I / O服务器(VIOS)删除磁盘来完成此操作,否则可以将其取消映射如果相应的活动集群存储库磁盘是N_Port ID虚拟化(NPIV),则从存储中进行存储。 如果磁盘来自后端存储,则可以使用光纤通道交换机中的portdisable命令来完成磁盘故障。

一旦启动群集服务,群集状态将处于活动状态。

(0) root @ Node1: /home/f/Tools
# clcmd lssrc -ls clstrmgrES| grep state
Current state: ST_STABLE
Current state: ST_STABLE

为了在本文中演示ARR,使用内核扩展应用程序完成了hdisk1上失败的I / O操作。

(0) root @ Node1: /home/Tools
# lke fail_io_kexta0256000(0) root @ Node1: /home/Tools/
# fail_io -e /dev/hdisk1   ----------------------- failed I/O enabled
I/O fail ON(0) root @ Node1: /home/Tools/
# dd if=/dev/hdisk1 of=/dev/null count=10
dd: 0511-051 The read failed.
: There is an input or output error. ---------------- disk is inaccessible
0+0 records in.
0+0 records out.

磁盘失败事件记录在来自CAA的syslog.caa中。 ARR的大部分工作是由CAA完成的,但是SystemMirror需要连接到CAA,以便配置更改可以从SystemMirror传播到CAA,或从CAA传播到SystemMirror。 图7和图8显示了syslog.caa的日志。 图7显示了当hdisk1发生故障时,启用了ARR,而图8显示了将活动集群存储库磁盘替换为备份列表中的下一个磁盘(即hdisk2)时发生的事件。

图7:启用了ARR的syslog.caa日志
图8:将活动磁盘替换为备份磁盘时的syslog.caa日志

活动群集存储库磁盘发生故障后,活动磁盘将替换为备份存储库列表中的磁盘。 甚至可以使用lspv命令来验证。 图9显示,在hdisk1发生故障后,caavg将被替换并在hdisk2上处于活动状态,CAA会自动更新它,也可以通过检查HACMPsircol ODM值来进行验证。 与图6相比,hdisk1(00f601736b563ee7)存储库处于活动状态,而自动更新存储库后,hdisk2(00f601736b563dad)更改为活动存储库,并将hdisk1(00f601736b563ee7)添加到备份列表中,如图10所示。

图9:替换存储库磁盘后的lspv输出
图10:自动替换存储库后的HACMPsircol输出

也可以使用CAA命令, lscluster -dclmgr view report repository命令来验证。 lscluster -d命令显示磁盘列表,其中hdisk2是活动存储库磁盘,其他磁盘是备份磁盘。

(0) root @ Node1: /
# lscluster -d
Storage Interface QueryCluster Name: Node1_cluster
Cluster UUID: 8d6a2434-ccdd-11e5-8077-9a9da6c0850c
Number of nodes reporting = 2
Number of nodes expected = 2Node Node1.ausprv.stglabs.ibm.com
Node UUID = 8d5cb556-ccdd-11e5-8077-9a9da6c0850c
Number of disks discovered = 5hdisk2:State : UPuDid : 200B75TL7711A0207210790003IBMfcpuUid : ba63c805-b68d-6157-91bb-b065d22c8c0bSite uUid : 51735173-5173-5173-5173-517351735173Type : REPDISKhdisk3:State : UPuDid : 200B75TL7711A0307210790003IBMfcpuUid : 58633a20-cedf-ea49-0495-56d72a198b55Site uUid : 51735173-5173-5173-5173-517351735173Type : BACKUP_DISKhdisk4:State : UPuDid : 200B75TL7711A0407210790003IBMfcpuUid : 90728701-4766-c3bf-b14c-7406ba8eabe0Site uUid : 51735173-5173-5173-5173-517351735173Type : BACKUP_DISKhdisk5:State : UPuDid : 200B75TL7711A0507210790003IBMfcpuUid : 45405d44-d4da-7e18-181b-c2543f826382Site uUid : 51735173-5173-5173-5173-517351735173Type : BACKUP_DISKhdisk1:State : UPuDid : 200B75TL7711A0107210790003IBMfcpuUid : f98bc1f1-7220-f3b1-b6ec-aad108357fbbSite uUid : 51735173-5173-5173-5173-517351735173Type : BACKUP_DISKNode Node2.ausprv.stglabs.ibm.com
Node UUID = 8d4eb15e-ccdd-11e5-8077-9a9da6c0850c
Number of disks discovered = 5hdisk2:State : UPuDid : 200B75TL7711A0207210790003IBMfcpuUid : ba63c805-b68d-6157-91bb-b065d22c8c0bSite uUid : 51735173-5173-5173-5173-517351735173Type : REPDISKhdisk3:State : UPuDid : 200B75TL7711A0307210790003IBMfcpuUid : 58633a20-cedf-ea49-0495-56d72a198b55Site uUid : 51735173-5173-5173-5173-517351735173Type : BACKUP_DISKhdisk4:State : UPuDid : 200B75TL7711A0407210790003IBMfcpuUid : 90728701-4766-c3bf-b14c-7406ba8eabe0Site uUid : 51735173-5173-5173-5173-517351735173Type : BACKUP_DISKhdisk5:State : UPuDid : 200B75TL7711A0507210790003IBMfcpuUid : 45405d44-d4da-7e18-181b-c2543f826382Site uUid : 51735173-5173-5173-5173-517351735173Type : BACKUP_DISKhdisk1:State : UPuDid : 200B75TL7711A0107210790003IBMfcpuUid : f98bc1f1-7220-f3b1-b6ec-aad108357fbbSite uUid : 51735173-5173-5173-5173-517351735173Type : BACKUP_DISK(0) root @ Node1: /mnt/fvsysmirror/Tools
# clmgr view report repository
Node1_cluster :
00f601736b563dad hdisk2(Node2)   active
00f601736b563cba hdisk3(Node2)   backup
00f601736b563b84 hdisk4(Node2)   backup
00f601736b563aa4 hdisk5(Node2)   backup
00f601736b563ee7 hdisk1(Node2)   backup

如果无法访问备份存储库,则CAA将替换并重建列表中可用的任何备份磁盘,作为活动存储库。

结论

您可以使用IBM PowerHA SystemMirror的ARR功能来防止集群在活动集群存储库磁盘发生故障或不可访问时进入受限模式 ,从而确保集群始终保持稳定状态。

翻译自: https://www.ibm.com/developerworks/aix/library/au-arr-in-ibm-powerha-cluster/index.html


http://chatgpt.dhexx.cn/article/Rwt6fUbL.shtml

相关文章

orecol与mysql_MDPI News | Entropy期刊被PubMed数据库收录

原标题&#xff1a;MDPI News | Entropy期刊被PubMed数据库收录 Entropy 2020年12月&#xff0c;MDPI期刊Entropy (ISSN 1099-4300, IF 2.494) 被PubMed数据库收录。在本期刊上发表的论文现已被编入索引&#xff0c;目前可以在PubMed检索到自第20卷开始的全部文章&#xff0c;这…

python常见的特异点

编码问题 Python中默认的编码格式是 ASCII 格式&#xff0c;在没修改编码格式时无法正确打印汉字&#xff0c;所以在读取中文时会报错。解决方法为只要在文件开头加入 # -*- coding: UTF-8 -*- 或者 #codingutf-8 就行了。 注意&#xff1a;Python3.X 源码文件默认使用utf-8编码…

mysql的cell_这篇发生Cell的数据库到底特殊在哪里?

原标题&#xff1a;这篇发生Cell的数据库到底特殊在哪里&#xff1f; 一个表面上“很水”实际上“很牛逼”的数据库 各位小伙伴们大家早上好~欢迎大家继续来听我碎碎念circRNA。我们承接上文&#xff0c;继续来说说circRNA与疾病之间的关系。今天介绍的主角是MiOncoCirc数据库&…

php mysql数据库驱动程序_PHP数据库驱动扩展概述与不同方式连接数据库总结

作者&#xff1a;极客小俊 一个专注于web技术的80后 我不用拼过聪明人&#xff0c;我只需要拼过那些懒人 我就一定会超越大部分人! CSDN极客小俊&#xff0c;原创文章, B站技术分享 个人博客: cnblogs.com 前端htmlcssjavascript技术讨论交流群: 281499395 后端phpmysqlLinux技…

linux openldap mysql_linux ldap openldapadmin

LINUX下安装openldap,并用phpldapadmin进行管理 BDB&#xff1a;Berkeley DB&#xff0c;openldap需要使用的数据库(貌似还有别的数据库可用&#xff0c;但这次我要用到它) phpldapadmin&#xff1a;openldap的网页管理软件&#xff0c;需要php支持&#xff0c;所以会有apachep…

mysql +cobar_数据库中间件Cobar功能探究

一、Cobar项目介绍 一)、Cobar背景概述 Cobar是提供分布式数据库服务的中间件&#xff0c;由阿里巴巴中间件团队开发&#xff0c;是阿里巴巴B2B前台应用访问数据库的统一入口&#xff0c;目前已在github上开源。 Cobar的分布式方案是分库和分表&#xff0c;可以按照业务需求将数…

mysql 的基本表的应用_mysql数据库应用(五)----表的基本操作(创建,删除,显示)...

------------------------------表的基本概念------------------------------------------ 表是包含数据库中所有数据的数据库对象 表中的数据库对象包括列&#xff0c;索引&#xff0c;触发器 列&#xff1a;在具体创建表时&#xff0c;必须指定列的名字和数据类型 索引&#…

RC电路的频率响应、选频网络特性测试的分析与仿真

目录 7.1 目的 7.2 分析原理 7.3 仿真分析 7.4 注意事项 7.5 总结与思考 7.1 目的 1. 掌握系统频率特性曲线的测试方法。 2. 了解常用线性系统的选频特性和相移特性。 7.2 分析原理 1&#xff0e;系统的频率响应特性 从理论课程的学习中可知&#xff0c;系统…

RC电路时间常数的定义及计算

转自电子发烧友&#xff1a;http://www.elecfans.com/dianzichangshi/20171101573662.html 时间常数表示过渡反应的时间过程的常数。指该物理量从最大值衰减到最大值的1/e所需要的时间。对于某一按指数规律衰变的量&#xff0c;其幅值衰变为1/e倍时所需的时间称为时间常数。 …

实验报告:RC电路的充放电过程仿真实验

实验人员&#xff1a;田少军 韦其优 实验目的&#xff1a; 掌握Multisim软件对RC电路充放电过程的仿真方法&#xff0c;理解RC电路的充放电过程的特性和规律&#xff0c;加深对电容器和电阻器的使用和理解。 实验原理&#xff1a; RC电路是由一个电容和一个阻值串联而成的电…

RC电路充放电时间的计算

V0是电容上的初始电压值 V1是电容最终可以充到或者放到的电压值 Vt是t时刻电容上的电压值 VtV0(V1-V0)x[1-exp(-t/RC)] 这里的exp是以e为底的指数函数 上面的公式还可以写成 tRCxln[(V1-V0)/(V1-Vt)] 1.电压为E的电池通过R向初值为0的电容C充电&#xff0c;V00&#xff0c;V1E…

模拟电路知识点总结(详细版)--放大电路的频率效应(RC电路)

一、高通电路 1.1传输特性 A u A_u Au​ R R 1 j ω C \frac{R}{R \frac {1} { j \omega C}} RjωC1​R​   &#xff08;补充知识&#xff1a;j是复数域中的一个旋转因子&#xff09; 详细求解思路&#xff1a;   求解 A u A_u Au​就是要求输入与输出的关系。 所以 A…

RC电路 波形分析

在模拟及脉冲数字电路中&#xff0c;常常用到由电阻R和电容C组成的RC电路&#xff0c;在些电路中&#xff0c; 电阻R和电容C的取值不同、输入和输出关系以及处理的波形之间的关系&#xff0c;产生了RC电路的 不同应用&#xff0c;下面分别谈谈微分电路、积分电路、耦合电路、脉…

RC电路分析计算

RC电路有一个电容和一个电阻组成&#xff0c;可以是并联或者串联&#xff0c;可用作滤波&#xff0c;移相等。下面以RC串联电路为例计算分析电路的电流电压特性和频率特性。 RC串联电路 如上图所示&#xff0c;假设RC电路电源电压为Us&#xff0c;电容大小为C&#xff0c;电容两…

RC电路一阶线性微分方程

电路中一阶线性微分方程 在高等数学中&#xff0c;一阶微分方程求解过程需要先算出齐次的通解&#xff0c;然后再根据初始条件算出特解&#xff0c;计算与推理过程很是复杂。在我们学习电路的时候再遇到这个东西时&#xff0c;会因为之前复杂的求解方式严重打击自信心&#xf…

RC并联电路传递函数用MATLAb,RC电路(一)RC串联、并联电路详解

由电阻R和电容C组成的电路称为阻容电路,简称RC电路,这是电子电路中十分常见的一种电路,RC电路的种类和变化很多,需要认真学习,深入掌握。 RC串联电路 下图所示是RC串联电路,RC串联电路由一个电阻R1和一个电容C1串联而成。在串联电路中,电容C1在电阻R1后面或前面是一样的…

详解电路设计中的RC电路

​ 目录 一、什么是RC电路 二、RC充、放电电路 &#xff08;1&#xff09;RC充电电路 &#xff08;2&#xff09;RC放电电路 三、RC积分电路 &#xff08;1&#xff09;RC积分电路的作用 &#xff08;2&#xff09;电路图 四、RC微分电路 &#xff08;1&#xff09;R…

RC电路的充放过程C语言实现,RC电路的瞬态和稳态过程

RC电路的瞬态和稳态过程 以指数衰减方式进行运动变化,不仅在交流电路中有,在静电学及放射性衰变、原子核裂变中同样出现。在核物理与放射性研究中,半衰期是放射元素的一个特性常数,它与外界条件、元素状态、元素质量无关。在考古学、医学、环境保护学中,放射性元素半衰期这…

RC电路

&#xff08;1&#xff09;RC 串联电路   电路的特点&#xff1a;由于有电容存在不能流过直流电流&#xff0c;电阻和电容都对电流存在阻碍作用&#xff0c;其总阻抗由电阻和容抗确定&#xff0c;总阻抗随频率变化而变化。RC 串联有一个转折频率&#xff1a; f01/2πR1C1 …

RC并联电路

1电容充放电细节 电容是由一对普通的金属平板对组成的&#xff0c;假设上极板有四对正负电荷的粒子对。然后&#xff0c;突然在该电容两端加一个电源。由于电源正极带正电&#xff0c;电源正极成功吸引了两个上极板上的电子过去&#xff08;此时上极板有两个正电荷&#xff09…