相关阅读:
虚拟化动手实验之高可用实现1:背景描述及解决方案
http://virtual.it168.com/a2010/0831/1097/000001097072.shtml
虚拟化动手实验之高可用实现2:准备软硬件环境
http://virtual.it168.com/a2010/0831/1097/000001097081.shtml
虚拟化动手实验之高可用实现3:准备实验环境
http://virtual.it168.com/a2010/0830/1096/000001096519.shtml
虚拟化动手实验之高可用实现4:添加主机及存储
http://virtual.it168.com/a2010/0830/1096/000001096578.shtml
虚拟化动手实验之高可用实现5:HA安装及配置
http://virtual.it168.com/a2010/0830/1096/000001096672.shtml
虚拟化动手实验之高可用实现6:VMwareHA、VMotion测试验收
http://virtual.it168.com/a2010/0830/1096/000001096720.shtml
虚拟化动手实验之高可用实现7: 容错(FT)的实现
http://virtual.it168.com/a2010/0831/1097/000001097110.shtml
虚拟化动手实验之高可用实现8:常见问题分析
http://virtual.it168.com/a2010/0831/1097/000001097119.shtml
本期动手实验相关演示操作视频:(1)、(2)、(3)、(4)、(5)、(6)。
【IT168 虚拟化动手实验】在前面几个章节中,不但讲述了如何准备适合虚拟化的硬件、软件,以及如何使用现有的硬件、软件搭建一套实验环境,还讲述了通过vCenter Server如何添加主机和ISCSI存储。
这几章节是实现VMware HA所不可少的。它构成了整个实验的很重要的第一步,同时也循序渐进的提供了创建VMwareHA的渐进步骤,如果你在看本章节前,你仍没有阅读以上三篇内容,建议您返回去阅读。
在本章节中,不但会讲述HA与VMwareHA的概念,也会讲述通过vCenter Server如何创建VMwareHA。(当然也会提及VMotion的创建)
一、高用性(HA)与VMwareHA的理解
1、HA(高可用性)群集
高可用性(HA)集群是群集的一种,平日较常见的为MSCS(微软群集服务),如SQL的故障转移群集。
高可用性群集,一般有两个或两个以上的节点,且分为活动节点及备用节点。通常把正在执行业务的称为活动节点,而作为活动节点的一个备份的则称为备用节点。当活动节点出现问题,导致正在运行的业务(任务)不能正常运行时,备用节点此时就会侦测到,并立即接续活动节点来执行业务。从而实现业务的不中断或短暂中断(对客户端来说,基本上感觉不到故障的存在)。
高可用性群集的实现是基于资源切换来进行的。这些资源包括节点的IP地址、主机名(NetBios名称)、磁盘卷、应用程序等。而资源的监控和接续,是依靠HA软件来实现的如MSCS等,这些软件用来通过"心跳信号"监控群集中对方节点的运行状态,一旦发现对方存在了故障,就会强制将所有的资源据为已有并继续对外提供服务。
而VMwareHA也是高可用性的一种应用。VMware HA 与传统的群集和高可用性解决方案都支持主机发生故障时的自动恢复。它们是互为补充的,但是在软硬件要求、恢复时间及应用程序和操作系统的识别程度等方面有所不同。
2、VMware HA的工作方式、首先及辅助主机
VMware HA 可以将虚拟机及其所驻留的主机集中在群集内,从而为虚拟机提供高可用性。群集中的主机均会受到监控,如果发生故障,故障主机上的虚拟机将在备用主机上重新启动。
在将主机添加到 VMware HA 群集时,代理将上载到主机,并配置为与群集内的其他代理通信。添加到群集的前五台主机将指定为首选主机,随后的所有主机将指定为辅助主机。首选主机维护和复制所有群集状况,并用于启动故障切换操作。如果从群集内移除某台首选主机,则 VMware HA 会将另一台主机提升为首选状态。
加入群集的任何主机必须与现有首选主机通信以完成其配置(当您正在将第一台主机添加到群集时除外)。必须至少有一台首选主机运行正常,以便 VMware HA 正确进行操作。如果所有首选主机均不可用(不响应),则无法为 VMware HA 成功配置任何主机。
其中一台首选主机还将指定为活动首选主机,其职责包括:
决定在何处重新启动虚拟机。
跟踪失败的重新启动尝试。
确定尝试重新启动虚拟机的适当时间。
如果活动首选主机发生故障,则另一台首选主机会将其替换。
3、结合使用 VMware HA 和 DRS
通过VMware HA 和 Distributed Resource Scheduler (DRS) 相结合,可将自动故障切换与负载平衡结合起来。这种结合可在 VMware HA 将虚拟机移至其他主机后更快再平衡虚拟机。
VMware HA 执行故障切换并在其他主机上重新启动虚拟机时,首要任务就是使所有的虚拟机立即可用。重新启动虚拟机后,启动这些虚拟机的主机可能会负载过重,而其他主机则相对负载较轻。VMware HA 将使用 CPU和内存预留来确定故障切换,而实际使用情况可能会更高。
在结合使用 DRS 和 VMware HA 并且启用了接入控制的群集内,可能不会从正在进入维护模式的主机上撤出虚拟机。这是由于预留用于维护故障切换级别的资源造成的。必须使用 VMotion 将虚拟机手动迁出主机。
当禁用了 VMware HA 接入控制时,故障切换资源限制将不会传递到 DRS 和 VMware 分布式电源管理 (DPM)。也不会强制执行限制条件。
DRS 会从主机撤出虚拟机,并将主机置于维护模式或待机模式,而不考虑这样做可能对故障切换要求造成影响。
VMware DPM 会关闭主机(将其置于待机模式),即使这样做会违反故障切换要求。
4、VMwareHA、DRS、VMotion相互关系
VMware VMotion是能够将虚拟机动态地在不同的物理主机(ESX主机)之间迁移的技术,且在迁移的过程是不会终止最终用户的访问。
VMware HA利用了vmotion技术,能够在虚拟机失效,或是ESX主机发生错误时,实时地迁移至还存活的ESX主机上继续执行。
VMware DRS将VMotion及HA技术融合在一起,根据ESX主机的CPU或内存资源负载,动态地迁移虚拟机至较负载较轻的ESX主机上,期间可以利用DRS建议,把一台ESX主机的上多个虚拟机放置在不同ESX主机上。(虚拟机放置,简单的说就是会为当前虚拟机选择较为适合此存放的ESX主机的过程,一般会依据CPU负载、内存多少、I/O读写、网络负载四个方面来衡量,并有星级评价,越好星级越高)
5、VMwareHA的工作原理和功能
A、工作原理是什么
VMware HA 不间断地监控群集中所有的 ESX Server 主机,并检测故障。放置在每台主机上的代理程序不断向群集中的其他主机发出"心跳信号","心跳信号"的终止将启动所有受影响的虚拟机在其他主机上的重启过程。
HA 时刻监控群集中是否有足够的资源可用,以便在主机发生故障时能够在其他物理主机上重启虚拟机。利用 ESX Server 存储堆栈中的锁定技术,可以使虚拟机的安全重启成为可能,它允许多个 ESX Server 同时访问同一虚拟机文件。
B、VMware HA 的功能
当 ESX Server 主机发生硬件故障时,将为故障切换容量范围内所有正在运行的虚拟机提供自动故障切换(请参见下面的指定故障切换容量)。可以在无需任何人员干预的情况下自动检测服务器故障和重启虚拟机。
VMware HA 利用 DRS 在故障切换后提供动态的、智能的资源分配和虚拟机优化。主机发生故障并且虚拟机已在其他主机上重启后, DRS 可以提供进一步的迁移建议,或者迁移虚拟机以获得更优化的主机放置和平衡的资源分配。
VMware HA 支持易于使用的配置和使用 VirtualCenter 进行监控。HA 确保该容量总是可用的(在指定的故障切换容量限制内),以便重启所有受服务器故障影响的虚拟机(基于为虚拟机配置的资源预留)。
不间断地监控容量利用率,并"预留"备用容量以便能够重启虚拟机。当未发生故障时,虚拟机可以完全利用备用故障切换容量。
6、VMwareHA实验过程中的心得
A、HA是针对安装有ESX主机的硬件的,在ESX主机故障后,虚拟机在其它主机恢复时使用了VMotion技术。但VMotion则是针对虚拟机的。(参考4、VMwareHA、DRS、VMotion相互关系)
B、HA实现过程也就是虚拟机故障恢后在其它主机的过程中,虚拟机对外的服务会中断,但是时间相对较短罢了。这和VMotion上也有不同之处。
C、所有的虚拟机硬盘文件等必需要放在共享存储上。
D、需要使用到DNS或HOSTS服务。
E、ESX主机在同一子网内,如果有多个网段,要确保ESX主机上有足够的网卡去连接。
F、保证虚拟机交换机的一致性,网络构架的一致性,管理和ISCSI的为一组ports,而虚拟机的为一组ports。