简单说,集群(cluster)就是一组计算机,它们作为一个整体向用户提供网络服务与网络资源。一组集群内单个的计算机系统,就是集群的节点(node)。

一个理想的集群,是用户从来不会意识到集群系统底层的这些节点,在他们看来,集群是一个整体的系统,而非多个计算机系统节点。一个好的集群,系统管理员可以随意增加和删改集群系统的节点。“集群”并不是一个全新的概念,其实早在七十年代计算机厂商和研究机构就开始了对集群系统的研究。由于当时“集群”主要用于科学工程计算,所以这些系统并不为大众所熟知。知道Linux系统出现,“集群”的概念才得以广为传播。

一、服务器集群技术以及它所具备的优点

我们通常所说的“服务器集群技术”,是将多个独立存在的服务器,通过集群技术进行集合,构成一个工作组、一台大型的服务器,并以“单一系统”的模式加以管理。服务器集群技术具有以下优点:

1、可以在低成本的情况下,将服务器的性能提高,发挥出其更大的价值;
2、可以提高扩展性。当服务器的整体性能不符合需求时,不需要像常规的办法一样更换性能更好的服务器,只需要将新的服务器加入到集群当中,即可提高整体性能;
3、可以增强可靠性。在集群内单个独立的节点发生故障时,仍然可以继续正常工作,尽可能的规避和降低企业因机器故障所带来的业务损失。

二、集群技术的目的

1、 提高处理性能

一些计算密集型应用,如:“天气预报、核试验模拟”等,需要计算机有很强的运算处理能力,但现有的技术,即使是普通的大型机器计算也很难胜任。这就需要用到“计算机集群技术”,集中几十台甚至上百台计算机的运算能力来满足任务要求。提高处理性能一直是集群技术研究的一个重要目标之一。

2、 降低成本开销

通常一套较好的集群配置,其软硬件开销要超过10万美元,但与价值上百万美元的专用超级计算机相比,已经是相当便宜。在达到同样性能的条件下,采用计算机集群比采用同等运算能力的大型计算机或超级计算机,具有更高的性价比。

3、 提高可扩展性

用户若想扩展系统的整体性能,不得不购买更高性能的服务器,才能获得额外所需的CPU处理能力和存储资源。如果采用集群技术,则只需要将新的服务器加入到集群当中即可,这样就可以扩展和提升系统的整体性能。

4、 增强可靠性

集群技术,使集群系统内单个独立的节点发生故障时,仍然可以继续正常工作,将系统停运时间缩减到最小。集群系统在提高系统的可靠性同时,也大大减小了故障所带来的损失。

三、集群技术的分类

集群分为“同构”和“异构”两种,它们的区别在于:组成集群系统的计算机之间的体系结构是否相同。集群计算机按功能和结构可以分成以下三类:

1、 高可用性集群

高可用性(High Availability)集群,简称:HA cluster。一般是指当集群中有某个节点失效的情况下,这个节点上面的任务会自动转移到其他正常的节点上,还可以将集群中的某个节点进行离线维护,然后再上线,该过程并不影响整个集群的运行。当应用程序出现故障,或者系统硬件、网络出现故障时,应用可以自动化、快速地从一个节点切换到另一个节点,从而保证应用持续、不间断地对外提供服务。

高可用性集群,主要使得服务器系统的运行速度和响应速度尽可能更快。它们经常利用在多台机器上运行的冗余节点和服务,用来相互跟踪。如果某个节点失败,它的替补将在几秒钟或更短的时间内接管它的职责和功能。因此,对于用户而言,集群永远不会停机。

2、负载均衡集群

负载均衡(Load Balancer)集群,分为“前端负载调度”和“后端服务”两个部分。负载调度部分负责把客户端的请求,按照不同的策略均衡分配给后端服务节点。与高可用性集群不同的是,在负载均衡集群中,所有的后端服务节点都处于活动状态,一致对外提供服务,分摊系统的工作负载。

负载均衡集群可以把一个高负荷的应用分散到多个节点共同完成,适用于业务繁忙、大负荷访问的应用系统。但是它也有不足的地方,就是当一个节点出现故障时,前端调度系统并不知道此节点已经不能提供服务,仍然会把客户端的请求调度到故障节点上来,这样就会出现访问失败。为了解决这个问题,负载均衡的前端调度系统,一般都引入了“节点监控系统”。

“节点监控系统”位于前端负载调度机上,负责监控下面的服务节点。当某个节点出现故障后,节点监控系统会自动将故障节点从集群中剔除;当此节点恢复正常使用后,节点监控系统又会自动将其加入到集群当中,而这一过程,对用户来说是完全透明的。

3、高性能计算集群

高性能计算(High - Performance Computing)集群,简称“HPC集群”。高性能计算集群,采用将计算任务分配到集群的不同节点,从而提高计算能力,因而主要应用在“科学计算领域”。

比较流行的HPC(高性能计算),采用Linux操作系统和其他的一些免费软件来完成并行运算。这类集群配置通常被称为“Beowulf集群”。它们通常运行特定的程序,以发挥“HPC集群”的并行能力。

HPC集群,特别适合于在计算中各计算节点之间发生大量数据通讯的计算作业,比如:一个节点的中间结果或影响到其他节点计算结果的情况。

HPC(高性能计算)的应用领域非常广泛,典型应用有“科学研究、基因测试对比、数据挖掘应用、石油和天然气勘探、图像呈现”等。

在实际的使用中,集群的这三种类型相互交融,例如:高可用性集群,也可以在其节点之间均衡用户负载。同样,也可以从要编写应用程序的集群中,找到一个并行集群,它可以在节点之间执行负载均衡。从这个意义上来讲,这种集群类别的划分是一个相对的概念,而不是绝对的。

亿速云,作为一家资质齐全、正规合法、拥有丰富行业积淀的云计算服务提供商。致力于为广大互联网企业用户和传统行业的企业用户提供“安全可靠、高效便捷、高性价比”的云主机租用服务。提供租用的云主机包括“云服务器、裸金属服务器、高防服务器香港服务器、美国服务器”等。

选择亿速云的云主机租用服务和其他增值服务,用户可以享受到7*24小时全天候不间断的技术支持和售后服务。如用户有问题需要咨询和帮助,可通过“在线 QQ、客服电话、工单系统”等方式进行联系,售后客服人员会在接收到反馈之后,第一时间进行回复,尽心帮助每一位用户答疑解惑、解决问题;数据中心机房轮值的专业技术人员与团队,还可以帮助用户进行故障排查和抢修。