计算机集群

article/2025/9/16 1:30:52

计算机集群简称集群是一种计算机系统, 它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有其它的可能连接方式。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个计算机,比如工作站或超级计算机性能价格比要高得多。


或者说:

集群,是一组独立的计算机系统构成一个松耦合的多处理器系统,它们之间通过网络实现进程间的通信。应用程序可以通过网络共享内存进行消息传送,实现分布式计算机。集群的工作方式类似于人们之间的协同工作。

 Vs-nat集群是一种最简单的集群。他的结构类似于linux透明代理服务器。

架设基于Linux(2.6内核)的服务器集群

  这是从网络上下载的一幅图,这是一种典型的nat结构。可以用此种结构作简单测试。上图的LVS标识是一台linux主机,它负责均衡流量。通常称它为linux虚拟服务器。RS1标识和RS2标识是实际的服务器。虚拟服务器不处理服务请求,所有的请求都由实际服务器处理。 上图的nat结构非常简单,可以根据实际情况修改网络结构。



集群分为同构与异构两种,它们的区别在于:组成集群系统的计算机之间的体系结构是否相同。集群计算机按功能和结构可以分成以下几类:

集群分类

  • 高可用性集群 High-availability (HA) clusters
  • 负载均衡集群 Load balancing clusters
  • 高性能计算集群 High-performance (HPC) clusters
  • 网格计算 Grid computing


高可用性集群

一般是指当集群中有某个节点失效的情况下,其上的任务会自动转移到其他正常的节点上。还指可以将集群中的某节点进行离线维护再上线,该过程并不影响整个集群的运行。

负载均衡集群

负载均衡集群运行时,一般通过一个或者多个前端负载均衡器,将工作负载分发到后端的一组服务器上,从而达到整个系统的高性能和高可用性。这样的计算机集群有时也被称为服务器群(Server Farm)。 一般高可用性集群和负载均衡集群会使用类似的技术,或同时具有高可用性与负载均衡的特点。

Linux虚拟服务器(LVS)项目在Linux操作系统上提供了最常用的负载均衡软件。

在现实的应用中,LVS得到了大量的部署,请参考http://www.linuxvirtualserver.org/deployment.html,

关于Linux LVS的工作原理和更详细的信息,请参考http://www.linuxvirtualserver.org


或者说:

即把负载压力根据某种算法合理分配到集群中的每一台计算机上,以减轻主服务器的压力,降低对主服务器的硬件和软件要求。

基于Linux的集群解决方案可谓百花齐放,具体请参见Linux 集群系统大比拼。在实际应用中,最常见的情况是利用集群解决负载平衡问题,比如用于提供WWW服务。在这里主要展示如何使用LVS(Linux Virtial Server)来实现实用的WWW负载平衡集群系统。


高性能计算集群

高性能计算集群采用将计算任务分配到集群的不同计算节点而提高计算能力,因而主要应用在科学计算领域。比较流行的HPC采用Linux操作系统和其它一些免费软件来完成并行运算。这一集群配置通常被称为Beowulf集群。这类集群通常运行特定的程序以发挥HPC cluster的并行能力。这类程序一般应用特定的运行库, 比如专为科学计算设计的MPI库。

HPC集群特别适合于在计算中各计算节点之间发生大量数据通讯的计算作业,比如一个节点的中间结果或影响到其它节点计算结果的情况。

或者说:

即充分利用集群中的每一台计算机的资源,实现复杂运算的并行处理,通常用于科学计算领域,比如基因分析,化学分析等。

网格计算

网格计算或网格集群是一种与集群计算非常相关的技术。网格与传统集群的主要差别是网格是连接一组相关并不信任的计算机,它的运作更像一个计算公共设施而不是一个独立的计算机。还有,网格通常比集群支持更多不同类型的计算机集合。

网格计算是针对有许多独立作业的工作任务作优化,在计算过程中作业间无需共享数据。网格主要服务于管理在独立执行工作的计算机间的作业分配。资源如存储可以被所有结点共享,但作业的中间结果不会影响在其他网格结点上作业的进展。

集群技术特点

1、是通过多台计算机完成同一个工作。达到更高的效率。

2、是两机或多机内容、工作过程等完全一样。如果一台死机,另一台可以起作用。

集群软件

  • Sun Grid Engine
  • SLURM (天河一号的Job Scheduler)
  • JBoss Application Server
  • Lander Vault
  • Solaris Cluster
  • Oracle Real Application Cluster RAC


-------------------------------------------------------------------------------------------------------

三 LVS配置实例

通过Linux LVS,实现WWW,Telnet服务的负载平衡。这里实现Telnet集群服务仅为了测试上的方便。

LVS有三种负载平衡方式,NAT(Network Address Translation),DR(Direct Routing),IP Tunneling。其中,最为常用的是DR方式,因此这里只说明DR(Direct Routing)方式的LVS负载平衡。为测试方便,4台机器处于同一网段内,通过一交换机或者集线器相连。实际的应用中,最好能将虚拟服务器vs1和真实服务器rs1, rs2置于于不同的网段上,即提高了性能,也加强了整个集群系统的安全性。

服务器的软硬件配置

首先说明,虽然本文的测试环境中用的是3台相同配置的服务器,但LVS并不要求集群中的服务器规格划一,相反,可以根据服务器的不同配置和负载情况,调整负载分配策略,充分利用集群环境中的每一台服务器。

这3台服务器中,vs1作为虚拟服务器(即负载平衡服务器),负责将用户的访问请求转发到集群内部的rs1,rs2,然后由rs1,rs2分别处理。client为客户端测试机器,可以为任意操作系统。 4台服务器的操作系统和网络配置分别为:

vs1: RedHat 6.2, Kernel 2.2.19 
vs1: eth0 192.168.0.1 
vs1: eth0:101 192.168.0.101 
rs1: RedHat 6.2, Kernel 2.2.14 
rs1: eth0 192.168.0.3 
rs1: dummy0 192.168.0.101 
rs2: RedHat 6.2, Kernel 2.2.14 
rs2: eth0 192.168.0.4 
rs2: dummy0 192.168.0.101 
client: Windows 2000 
client: eth0 192.168.0.200

其中,192.168.0.101是允许用户访问的IP。

虚拟服务器的集群配置

大部分的集群配置工作都在虚拟服务器vs1上面,需要下面的几个步骤:

重新编译内核。

首先,下载最新的Linux内核,版本号为2.2.19,下载地址为:http://www.kernel.org/,解压缩后置于/usr/src/linux目录下。

其次需要下载LVS的内核补丁,地址为:http://www.linuxvirtualserver.org/software/ipvs-1.0.6-2.2.19.tar.gz。这里注意,如果你用的Linux内核不是2.2.19版本的,请下载相应版本的LVS内核补丁。将ipvs-1.0.6-2.2.19.tar.gz解压缩后置于/usr/src/linux目录下。

然后,对内核打补丁,如下操作:

[root@vs2 /root]# cd /usr/src/linux 
[root@vs2 linux]# patch -p1 < ipvs-1.0.6-2.2.19/ipvs-1.0.6-2.2.19. 
patch

下面就是重新配置和编译Linux的内核。特别注意以下选项:

1 Code maturity level options---> 
* [*]Prompt for development and/or incomplete code/drivers 
2 Networking部分: 
[*] Kernel/User netlink socket 
[*] Routing messages 
<*> Netlink device emulation 
* [*] Network firewalls 
[*] Socket Filtering 
<*> Unix domain sockets 
* [*] TCP/IP networking 
[*] IP: multicasting 
[*] IP: advanced router 
[ ] IP: policy routing 
[ ] IP: equal cost multipath 
[ ] IP: use TOS value as routing key 
[ ] IP: verbose route monitoring 
[ ] IP: large routing tables 
[ ] IP: kernel level autoconfiguration 
* [*] IP: firewalling 
[ ] IP: firewall packet netlink device 
* [*] IP: transparent proxy support 
* [*] IP: masquerading 
--- Protocol-specific masquerading support will be built as modules. 
* [*] IP: ICMP masquerading 
--- Protocol-specific masquerading support will be built as modules. 
* [*] IP: masquerading special modules support 
* IP: ipautofw masq support (EXPERIMENTAL)(NEW) 
* IP: ipportfw masq support (EXPERIMENTAL)(NEW) 
* IP: ip fwmark masq-forwarding support (EXPERIMENTAL)(NEW) 
* [*] IP: masquerading virtual server support (EXPERIMENTAL)(NEW) 
[*] IP Virtual Server debugging (NEW) <--最好选择此项,以便观察LVS的调试信息 
* (12) IP masquerading VS table size (the Nth power of 2) (NEW) 
* IPVS: round-robin scheduling (NEW) 
* IPVS: weighted round-robin scheduling (NEW) 
* IPVS: least-connection scheduling (NEW) 
* IPVS: weighted least-connection scheduling (NEW) 
* IPVS: locality-based least-connection scheduling (NEW) 
* IPVS: locality-based least-connection with replication scheduling 
(NEW) 
* [*] IP: optimize as router not host 
* IP: tunneling 
IP: GRE tunnels over IP 
[*] IP: broadcast GRE over IP 
[*] IP: multicast routing 
[*] IP: PIM-SM version 1 support 
[*] IP: PIM-SM version 2 support 
* [*] IP: aliasing support 
[ ] IP: ARP daemon support (EXPERIMENTAL) 
* [*] IP: TCP syncookie support (not enabled per default) 
--- (it is safe to leave these untouched) 
< > IP: Reverse ARP 
[*] IP: Allow large windows (not recommended if <16Mb of memory) 
< > The IPv6 protocol (EXPERIMENTAL)

面,带*号的为必选项。然后就是常规的编译内核过程,不再赘述,请参考编译Linux教程。

在这里要注意一点:如果你使用的是RedHat自带的内核或者从RedHat下载的内核版本,已经预先打好了LVS的补丁。这可以通过查看/usr/src/linux/net/目录下有没有几个ipvs开头的文件来判断:如果有,则说明已经打过补丁。

编写LVS配置文件,实例中的配置文件如下:

#lvs_dr.conf (C) Joseph Mack mack@ncifcrf.gov 
LVS_TYPE=VS_DR 
INITIAL_STATE=on 
VIP=eth0:101 192.168.0.101 255.255.255.0 192.168.0.0 
DIRECTOR_INSIDEIP=eth0 192.168.0.1 192.168.0.0 255.255.255.0 192.168.0. 255 
SERVICE=t telnet rr rs1:telnet rs2:telnet 
SERVICE=t www rr rs1:www rs2:www 
SERVER_VIP_DEVICE=dummy0 
SERVER_NET_DEVICE=eth0 
#----------end lvs_dr.conf------------------------------------

将该文件置于/etc/lvs目录下。

使用LVS的配置脚本产生lvs.conf文件。该配置脚本可以从http://www.linuxvirtualserver.org/Joseph.Mack/configure-lvs_0.8.tar.gz 单独下载,在ipvs-1.0.6-2.2.19.tar.gz包中也有包含脚本configure的使用方法:

[root@vs2 lvs]# configure lvs.conf

这样会产生几个配置文件,这里我们只使用其中的rc.lvs_dr文件。修改/etc/rc.d/init.d/rc.local,增加如下几行:

echo 1 > /proc/sys/net/ipv4/ip_forward 
echo 1 > /proc/sys/net/ipv4/ip_always_defrag 
# 显示最多调试信息 
echo 10 > /proc/sys/net/ipv4/vs/debug_level

配置NFS服务。这一步仅仅是为了方便管理,不是必须的步骤。假设配置文件lvs.conf文件放在/etc/lvs目录下,则/etc/exports文件的内容为:

/etc/lvs ro(rs1,rs2)

然后使用exportfs命令输出这个目录:

[root@vs2 lvs]# exportfs

如果遇到什么麻烦,可以尝试:

[root@vs2 lvs]# /etc/rc.d/init.d/nfs restart 
[root@vs2 lvs]# exportfs
这样,各个real server可以通过NFS获得rc.lvs_dr文件,方便了 集群的配置:你每次修改lvs.conf中的配置选项,都可以即可反映在rs1,rs2的相应目录里。 修改/etc/syslogd.conf,增加如下一行: kern.* /var/log/kernel_log。这样,LVS的一些调试信息就会写入/var/log/kernel_log文件中。
Real Server的配置
Real Server的配置相对简单,主要是是以下几点:
配置telnet和WWW服务。telnet服务没有需要特别注意的事项,但是对于www服务,需要修改httpd.conf文件,使得 apache在虚拟服务器的ip地址上监听,如下所示:
Listen 192.168.0.101:80
关闭Real Server上dummy0的 arp请求响应能力。这是必须的,具体原因请参见 ARP problem in LVS/TUN and LVS/DR关闭dummy0的arp响应的方式有多种,比较简单地方法是,修改/etc/rc.d/rc.local文件,增加如下几行:
echo 1 > /proc/sys/net/ipv4/conf/all/hidden 
ifconfig dummy0 up 
ifconfig dummy0 192.168.0.101 netmask 255.255.255.0 broadcast 192.168. 0.0 up 
echo 1 > /proc/sys/net/ipv4/conf/dummy0/hidden 
再次修改/etc/rc.d/rc.local,增加如下一行:(可以和步骤2合并) 
echo 1 > /proc/sys/net/ipv4/ip_forward
四 LVS的测试
好了,经过了上面的配置步骤,现在可以测试LVS了,步骤如下:
分别在vs1,rs1,rs2上运行/etc/lvs/rc.lvs_dr。注意,rs1,rs2上面的/etc/lvs目录是vs2输出的。如果您的NFS配置没有成功,也可以把vs1上/etc/lvs/rc.lvs_dr复制到rs1,rs2上,然后分别运行。确保rs1,rs2上面的apache已经启动并且允许telnet。
然后从client运行telnet 192.168.0.101,如果登录后看到如下输出就说明集群已经开始工作了。(假设以guest用户身份登录)
[guest@rs1 guest]$-----------说明已经登录到服务器rs1上。
再开启一个telnet窗口,登录后会发现系统提示变为:
[guest@rs2 guest]$-----------说明已经登录到服务器rs2上。
然后在vs2上运行如下命令:
[root@vs2 /root]ipvsadm
运行结果应该为:
IP Virtual Server version 1.0.6 (size=4096) 
Prot LocalAddress:Port Scheduler Flags 
-> RemoteAddress:Port Forward Weight ActiveConn InActConn 
TCP 192.168.0.101:telnet rr 
-> rs2:telnet Route 1 1 0 
-> rs1:telnet Route 1 1 0 
TCP 192.168.0.101:www rr 
-> rs2:www Route 1 0 0 
-> rs1:www Route 1 0 0
至此已经验证telnet的LVS正常。然后测试一下WWW是否正常:用你的浏览器查看http://192.168.0.101/是否有什么变化?为了更明确的区别响应来自那个Real Server,可以在rs1,rs2上面分别放置如下的测试页面(test.html):
我是real server #1 or #2
然后刷新几次页面(http://192.168.0.101/test.html),如果你看到“我是real server #1”和“我是real server #2”交替出现,说明www的LVS系统已经正常工作了。
但是由于Internet Explore 或者Netscape本身的缓存机制,你也许总是只能看到其中的一个。不过通过ipvsadm还是可以看出,页面请求已经分配到两个Real Server上了,如下所示:
IP Virtual Server version 1.0.6 (size=4096)
Prot LocalAddress:Port Scheduler Flags
-> RemoteAddress:Port       Forward Weight ActiveConn InActConn
TCP 192.168.0.101:telnet rr
-> rs2:telnet Route 1 0 0
-> rs1:telnet Route 1 0 0
TCP 192.168.0.101:www rr
-> rs2:www Route 1 0 5
-> rs1:www Route 1 0 4
或者,可以采用linux的lynx作为测试客户端,效果更好一些。如下运行命令:
[root@client /root]while true; do lynx -dump 
http://10.64.1.56/test.html; sleep 1; done
这样,每隔1秒钟“我是realserver #1”和“我是realserver #2”就交替出现一次,清楚地表明响应分别来自两个不同的Real Server。



http://chatgpt.dhexx.cn/article/H5DsnCcL.shtml

相关文章

HAProxy集群与常见的Web集群软件调度器对比

目录 一.常见的Web集群调度器 二.HAProxy基本介绍 1.HAProxy是什么&#xff1f; 2.HAProxy的特性 3.HAProxy常用的8种负载均衡调度算法 3.1 轮询&#xff1a;RR&#xff08;Round Robin&#xff09; 3.2 最小连接数&#xff1a;LC&#xff08;Least Connections&#xf…

[Linux基础与服务管理——常用集群高可用软件 Keepalived]

1.Keepalived 简介 Keepalived是Linux下的一个免费的、轻量级的高可用解决方案。是一个由C语言编写的路由软件&#xff0c;主要目标是为Linux系统和基于Linux的基础架构提供简单而强大的负载平衡和高可用性设。Keepalived实现了一组检查器&#xff0c;以根据其健康状况动态地和…

高性能集群软件keepalived

背景 网络的飞速发展&#xff0c;给网络带宽和服务器性能带来了巨大的挑战&#xff0c;基于互联网的应用系统越来越多地瓶颈出现在服务器端&#xff0c;这就对服务器提出了更高的要求&#xff0c;来保证服务的持续性。 集群简介 定义&#xff1a;集群是一组协同工作的服务集合…

集群分为几种,用的软件分别是什么?

集群分为几种&#xff0c;用的软件分别是什么? 补充&#xff1a;涉及的组件 1.1、apache 跨平台的网页服务器&#xff0c;主要使用它做静态资源服务器&#xff0c;也可以做代理服务器转发请求 1.2、ngnix 高性能的 HTTP和反向代理服务器&#xff0c;ngnix处理能力相当于apache…

Linux下的5款主流高可用集群软件介绍

Linux集群主要分成三大类:高可用集群(High Availability Cluster)、负载均衡集群(Load Balance Cluster)、科学计算集群(High Performance Computing Cluster)。 其中高可用集群具有保障应用程序持续提供服务的能力,可以将因软、硬件、人为造成的故障对业务的影响降低到最小…

Horizon Daas 桌面报错:desktop agent通信错误

一、故障描述 上述错误是因无法解析来自身份验证错误响应中的错误时&#xff0c;会报出。这往往时由于horizon client与TA&#xff0c;view agent之间的通信中断造成的。造成在desktone.log日志里可看到相关warning或error&#xff0c;如下所示&#xff1a; 二、分析处理 1、…

一文看懂数据服务DaaS

数据是国家的&#xff0c;金融是国家的。朕不给&#xff0c;你不能要。 &#xff08;1&#xff09;中国数据服务 一、数据工具 像云计算厂商搞的大数据平台&#xff0c;就是这个定位。它们纯搞产品&#xff0c;做好品牌&#xff0c;做好合作伙伴招募&#xff0c;由合作伙伴去做…

IaaS、PaaS、SaaS、DaaS的区别与联系

按照服务划分&#xff0c;云计算可以分为IaaS、PaaS、SaaS、DaaS四个层次。 IaaS&#xff08;Infrastructure as a Service&#xff0c;基础架构即服务&#xff09;是基础层。在这一层&#xff0c;通过虚拟化、动态化将IT基础资源&#xff08;计算、网络、存储&#xff09;聚合…

Horizon Daas浮动桌面无法删除解决

Horizon Daas浮动桌面无法删除解决 【问题描述】 某次执行对桌面删除重新分配操作&#xff0c;发现桌面功能下拉列表里&#xff0c;未出现删除选项&#xff0c;【浮动桌面】无法删除&#xff0c;即无法释放所占资源。 【问题分析】 经检查发现&#xff0c;原来此类桌面为“…

关于Daas平台无法登录的故障处理

关于Daas平台无法登录的故障处理 【事件描述】 某天对Daas桌面环境中AD域控服务器进行挂起&#xff0c;执行克隆备份操作后&#xff0c;再次开启AD域控后&#xff0c;登录短少系统报错&#xff1a;身份验证失败&#xff0c;无法登录。如下图所示&#xff1a; 【故障分析及处…

daas 数据即服务_万物物联时代,数据即服务

关于DAAS的概念 1.未来万物互联&#xff0c;数据就是服务 如何利用移动通信将万物互联&#xff0c;彻底实现智能化&#xff0c;是当前发展的愿景。在这个愿景之下&#xff0c;我们希望能够建立统一的框架&#xff0c;把人的通讯问题、万物互联的问题囊括其中&#xff0c;以超高…

跑出了几个明星厂商,DaaS赛道要火?

图片来源于Unsplash 文丨螳螂观察 作者丨陈淼 从今年的形势来判断&#xff0c;DaaS&#xff08;数据即服务&#xff09;赛道看来要火。 相关的信号有两个。 6月末&#xff0c;阿里成立了一家子公司&#xff0c;瓴羊智能服务公司。根据介绍&#xff0c;这家公司将把阿里巴巴…

IaaS、PaaS、SaaS、DaaS的区别

1.IaaS IaaS是Infrastructure as a server的缩写&#xff0c;意思是基础设施即服务。又云端公司把IT环境的基础设施建设好&#xff0c;然后直接对外出租硬件服务器或者虚拟机。消费者可以利用所有计算基础设施&#xff0c;包括处理CPU、内存、存储、网络和其它基本的计算资源&…

Tapdata 在线研讨会:DaaS vs 大数据平台,是竞争还是共处?

从20年前的传统数仓&#xff0c;到10年前大数据平台&#xff0c;5年前开始火热的数据中台以及最近出现的湖仓一体新数据平台&#xff0c;今天被数据孤岛困扰的企业&#xff0c;面临着太多的选择。这些数据产品及架构有一个共性&#xff1a;他们本质上解决的大部分都是分析洞察类…

云目录(DaaS )快速入门

目录即服务&#xff08;Directory-as-a-Service&#xff0c;DaaS&#xff09;是针对企业用户存储的云解决方案&#xff0c;将 LDAP 或微软 Active Directory&#xff08;AD&#xff09;作为云服务进行管理。DaaS 和很多云平台一样&#xff0c;不仅仅是基于云的 AD 或LDAP不单单…

关于Horizon DaaS Platform的一些疑问

问&#xff1a; DaaS 是什么意思&#xff1f; 答&#xff1a; DaaS 的含义是“Desktops as a Service”&#xff08;桌面即服务&#xff09;。 问&#xff1a;所谓的“以云计算服务的形式交付 Windows 桌面或应用”是什么意思&#xff1f; 答&#xff1a;是指云提供商利用他们…

数据中台:始于阿里,兴于DaaS

2014年&#xff0c;马云从芬兰一家游戏公司Supercell接触到中台概念后&#xff0c;在阿里内部积极践行&#xff0c;开创了“大中台、小前台”的组织机制和业务机制。 阿里数据中台的理念是通过高效、统一的后方系统来支撑快速变化的前端业务&#xff0c;提高业务产出效率&…

daas(daas医学上是什么意思)

什么是氨基酸评分 本词条缺少概述、名片图&#xff0c;补充相关内容使词条更完整&#xff0c;还能快速升级&#xff0c;赶紧来编辑吧&#xff01; 氨基酸评分 别称 蛋白质化学评分 消化率评分 (PCDAAS)氨基酸评分真消化率 2计算公式 3经消化率修正的氨基酸评分 1简介编辑 氨基酸…

IaaS、PaaS、SaaS、DaaS之间的区别与联系

参考文档&#xff1a;IaaS、PaaS、SaaS、DaaS之间的区别与联系&#xff01; 关于云计算的百度百科释义&#xff1a; 通过网络“云”将巨大的数据计算处理程序分解成无数个小程序&#xff0c;然后&#xff0c;通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给…

Horizon DAAS环境Log4J远程代码执行漏洞危害减轻措施

一、问题描述 2021 年 12 月 9 日&#xff0c;VMware 威胁分析部门 (TAU) 也注意到Java Log4j 模块中存在的一个大规模、高影响的漏洞。此漏洞称为 Log4Shell&#xff0c;安全跟踪编码为 CVE-2021-44228及后续衍生的 CVE-2021-45046。它是一个未经身份验证的远程代码执行 (RCE…