CentOS8系统安装LSF集群管理软件

article/2025/9/16 0:45:58

一、什么是LSF?

        LSF(Load Sharing Facility)是IBM旗下的一款分布式集群管理系统软件,负责计算资源的管理和批处理作业的调度。常用的分布式集群管理系统软件有PBS、SLURM、LSF。

二、安装环境(虚拟机)

主机名

IP地址

操作系统

类型

admin(管理节点)

192.168.10.10

redhat8.3

虚拟机

node1(计算节点)

192.168.10.11

redhat8.3

虚拟机

三、配置节点间无密码访问

[root@admin ~]# ssh-key

[root@admin ~]# ssh-copy-id -i root@192.168.10.10

[root@admin ~]# ssh-copy-id -i root@192.168.10.11

四、编辑hosts文件

[root@admin ~]# vim /etc/hosts

[root@admin ~]# scp /etc/hosts root@192.168.10.11:/etc/hosts

五、配置共享存储

[root@admin ~]# rpm -ivh nfs-utils-2.3.3-35.el8.x86_64.rpm

warning: nfs-utils-2.3.3-35.el8.x86_64.rpm: Header V3 RSA/SHA256 Signature, key ID fd431d51: NOKEY

Verifying...                          ################################# [100%]

Preparing...                          ################################# [100%]

package nfs-utils-1:2.3.3-35.el8.x86_64 is already installed

[root@admin ~]# cat /etc/exports

/data 192.168.10.0/24(rw,no_root_squash)

[root@admin ~]# systemctl restart rpcbind

[root@admin ~]# systemctl restart nfs-server

[root@node1 ~]# mount -t nfs 192.168.10.10:/data /data/

[root@admin ~]# mkdir -p /data/software

[root@admin ~]# mkdir -p /data/packages

六、上传软件包

[root@admin ~]# mv lsfsce10.2.0.6-x86_64.tar.gz /data/packages/

[root@admin ~]# cd /data/packages/

[root@admin packages]# ls

lsfsce10.2.0.6-x86_64.tar.gz

[root@admin packages]# tar -xf lsfsce10.2.0.6-x86_64.tar.gz

[root@admin packages]# ls

lsfsce10.2.0.6-x86_64  lsfsce10.2.0.6-x86_64.tar.gz

[root@admin packages]# cd lsfsce10.2.0.6-x86_64/

[root@admin lsfsce10.2.0.6-x86_64]# ls

lsf  pac  pmpi

[root@admin lsfsce10.2.0.6-x86_64]# cd lsf/

[root@admin lsf]# ls

lsf10.1_linux2.6-glibc2.3-x86_64.tar.Z  lsf10.1_lsfinstall_linux_x86_64.tar.Z

[root@admin lsf]# tar -xf lsf10.1_lsfinstall_linux_x86_64.tar.Z lsf10.1_lsfinstall/

六、修改配置文件

[root@admin lsf10.1_lsfinstall]# vim install.config

[root@admin lsf10.1_lsfinstall]# cat install.config | grep -v "#"

LSF_TOP="/data/software/lsf"

LSF_ADMINS="huchh"

LSF_CLUSTER_NAME="lsf_cluster"

LSF_MASTER_LIST="admin"

LSF_TARDIR="/data/packages/lsfsce10.2.0.6-x86_64/lsf"

CONFIGURATION_TEMPLATE="DEFAULT"

LSF_ADD_SERVERS="node1"

LSF_ADD_CLIENTS="admin node1"

、安装LSF

[root@admin lsf10.1_lsfinstall]# ./lsfinstall -f install.config

 八、修改LSF配置文件

[root@admin ~]# vim /data/software/lsf/conf/lsf.conf

LSF_RSH="ssh"

九、加载LSF环境变量

[root@admin ~]# source /data/software/lsf/conf/profile.lsf
十、所有节点启动守护进程

[root@admin ~]# /data/software/lsf/10.1/install/hostsetup --top="/data/software/lsf" --boot="y"

[root@node1 ~]# /data/software/lsf/10.1/install/hostsetup --top="/data/software/lsf" --boot="y"

 十一、管理节点启动集群

[root@admin ~]# lsfstartup

十二、检查节点状态

[root@admin ~]# lsid

[root@admin ~]# lsload

[root@admin ~]# lshosts

十三、报错

报错:libnsl.so.1无法加载

 解决办法:

[root@admin ~]# rpm -ivh glibc-2.28-127.el8.x86_64.rpm

[root@admin ~]# rpm -ivh libnsl-2.28-127.el8.x86_64.rpm

 

 

 


http://chatgpt.dhexx.cn/article/8gOUfZiG.shtml

相关文章

集群解决方案

集群概念 集群是一种计算机系统, 它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有其它…

集群集群

一、什么是集群 集群(Cluster )是将多个单独存在的服务器,通过集群技术将其集合,构成一个工作组、一台大型的服务器,以单一系统的模式加以管理。 简而言之,集群就是将多台机器组合成一台机器使用。 二、…

集群监控

文章目录 一、监控简介1.1 重要性1.2 常见监控平台1.2.1 Cacti1.2.2 Nagios1.2.3 Zabbix 二、Cacti 监控服务器2.1 组件构成2.1.1 SNMP2.1.2 RRDtool2.1.3 工作架构 2.2 Cacti 监控组件安装配置2.2.1 安装环境(10.10.10.11)2.2.2 安装 rrdtool (10.10.10.11)2.2.3 部署 cacti&a…

群集技术:三款主流服务器集群软件

1、ROSE HA 服务器集群软件 在双机热备的架构中,除了要考虑切换时间外,要根据每个系统的作业环境,包括网路系统是单网或是双 网,数据库的安装和作业内容及用户端的设备是经由广域网路、区域网路接入不同用户有不同的需求&#x…

常见集群(Cluster)软件和技术解析

集群就是通过软件将一组服务器作为一个整体向客户提供资源。这些单个的服务器就是集群的节点。当对外提供资源的节点故障后,集群中其余的节点能够将资源接管起来,继续对客户提供资源。 集群技术的核心就是资源访问控制。由于集群中所有节点都可以访问集群…

【集群】集群的概念(相关知识)、常用工具/算法、常见集群

文章目录 前言一、集群架构1.1 负载调度器1.1.1 常用调度算法1.1.2 LVS模块 1.2 节点服务器1.3 共享储存1.3.1 NFS共享储存1.3.2 NAS存储设备 二、集群2.1 负载均衡2.1.1 定义2.1.2 负载均衡搭建 2.2 高可用2.2.1 定义2.2.2 高可用集群搭建 2.3 高性能运算群集 三、ipvsadm工具…

集群测试工具

DFSIO测试集群I/O性能 DFSIO 用法 hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.7.X-tests.jar TestDFSIO 15/05/22 19:50:22 INFO fs.TestDFSIO: TestDFSIO.1.8 Missing arguments. Usage: TestDFSIO [genericOptions] -read […

集群监视软件Ganglia

什么是ganglia Ganglia监控软件主要是用来监控系统性能的软件,如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到…

Linux集群管理软件clustershell

Linux集群管理软件clustershell 1.简介 机房有大概百台的服务器需要管理,加上需要搭建Hadoop以及Spark集群等,因此,一个轻量级的集群管理软件就显得非常有必要了。经过一段时间的了解以及尝试,最终选择了clustershell这个软件&…

计算机集群

计算机集群简称集群是一种计算机系统, 它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有…

HAProxy集群与常见的Web集群软件调度器对比

目录 一.常见的Web集群调度器 二.HAProxy基本介绍 1.HAProxy是什么? 2.HAProxy的特性 3.HAProxy常用的8种负载均衡调度算法 3.1 轮询:RR(Round Robin) 3.2 最小连接数:LC(Least Connections&#xf…

[Linux基础与服务管理——常用集群高可用软件 Keepalived]

1.Keepalived 简介 Keepalived是Linux下的一个免费的、轻量级的高可用解决方案。是一个由C语言编写的路由软件,主要目标是为Linux系统和基于Linux的基础架构提供简单而强大的负载平衡和高可用性设。Keepalived实现了一组检查器,以根据其健康状况动态地和…

高性能集群软件keepalived

背景 网络的飞速发展,给网络带宽和服务器性能带来了巨大的挑战,基于互联网的应用系统越来越多地瓶颈出现在服务器端,这就对服务器提出了更高的要求,来保证服务的持续性。 集群简介 定义:集群是一组协同工作的服务集合…

集群分为几种,用的软件分别是什么?

集群分为几种,用的软件分别是什么? 补充:涉及的组件 1.1、apache 跨平台的网页服务器,主要使用它做静态资源服务器,也可以做代理服务器转发请求 1.2、ngnix 高性能的 HTTP和反向代理服务器,ngnix处理能力相当于apache…

Linux下的5款主流高可用集群软件介绍

Linux集群主要分成三大类:高可用集群(High Availability Cluster)、负载均衡集群(Load Balance Cluster)、科学计算集群(High Performance Computing Cluster)。 其中高可用集群具有保障应用程序持续提供服务的能力,可以将因软、硬件、人为造成的故障对业务的影响降低到最小…

Horizon Daas 桌面报错:desktop agent通信错误

一、故障描述 上述错误是因无法解析来自身份验证错误响应中的错误时,会报出。这往往时由于horizon client与TA,view agent之间的通信中断造成的。造成在desktone.log日志里可看到相关warning或error,如下所示: 二、分析处理 1、…

一文看懂数据服务DaaS

数据是国家的,金融是国家的。朕不给,你不能要。 (1)中国数据服务 一、数据工具 像云计算厂商搞的大数据平台,就是这个定位。它们纯搞产品,做好品牌,做好合作伙伴招募,由合作伙伴去做…

IaaS、PaaS、SaaS、DaaS的区别与联系

按照服务划分,云计算可以分为IaaS、PaaS、SaaS、DaaS四个层次。 IaaS(Infrastructure as a Service,基础架构即服务)是基础层。在这一层,通过虚拟化、动态化将IT基础资源(计算、网络、存储)聚合…

Horizon Daas浮动桌面无法删除解决

Horizon Daas浮动桌面无法删除解决 【问题描述】 某次执行对桌面删除重新分配操作,发现桌面功能下拉列表里,未出现删除选项,【浮动桌面】无法删除,即无法释放所占资源。 【问题分析】 经检查发现,原来此类桌面为“…

关于Daas平台无法登录的故障处理

关于Daas平台无法登录的故障处理 【事件描述】 某天对Daas桌面环境中AD域控服务器进行挂起,执行克隆备份操作后,再次开启AD域控后,登录短少系统报错:身份验证失败,无法登录。如下图所示: 【故障分析及处…