集群是一种比较新颖的计算机技术,集群技术,具有成本低、性能稳定、可靠、灵活等特性。集群的任务调度是集群系统中的核心技术。
集群是由一些相互独立、通过高速网络互联的计算机组成。集群上的计算机构成了一个组,可以通过单一系统的模式对其进行管理。
客户在与集群相互作用时,集群像是一个独立的服务器。集群的配置主要用于提高可用性和可缩放性,通过部署集群架构可以将成百上千台的主机结合在一起,以满足大数据时代的海量访问负载。
根据集群的体系结构,可以把集群中所使用的关键技术归纳为以下 4 个层次:
集群技术是网络层、节点机及操作系统层、集群系统管理层和应用层的有机结合,所有的系统层次中的相关技术分别负责解决不同的问题,因此每个层次都有它本身不可或缺的重要性。
集群技术的特点有如下:
根据自身的功能不同,可以将集群分为高可用集群、负载平衡集群和分布式计算集群 3 种。
高可用集群也叫 HA 集群,常被称作“双机热备”。
高可用集群一般有两台服务器,其中一台进行工作,另外一台作为冗余,当提供服务的机器出现故障时,冗余将接替出现故障的服务器继续提供服务。通常实现高可用集群的开源软件是 Keepalived。
高可用集群就是当某一个节点或服务器发生故障时,另一个节点能够自动且立即向外提供服务,即将有故障节点上的资源转移到另一个节点上去,这样另一个节点有了资源就可以立即向外提供服务。
高可用集群在单个节点发生故障时,能够自动将资源、服务进行切换,这样可以保证服务一直在线。而在这个过程中,所有行为过程对于客户端来说是透明的。
负载均衡集群,需要有一台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,这些服务器数量至少为 2,实现负载均衡的开源软件有 LVS、Keepalived、haproxy、nginx,商业的有 F5、Netscaler。
分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。
分布式集群主要是解决大型应用平台,由于高并发的负载,集群可以分发各个服务器的访问压力,也可以实现服务器故障转移,一台硬件出问题,会快速转到好的服务器上继续运行,业务不会中断。这样就避免了因单台服务器出现故障,引发访问负载过高,而导致业务中断的问题。