元绍华

摘要:双活数据中心能够有效提升数据中心的资源利用率,并在更高层次上提高业务连续性保障能力。但双活数据中心的构建是一个系统性工程,实现起来较为复杂。本文介绍了一种基于vSphere FT技术在双数据中心实现业务双活的通用方法,列举了其优势和局限性,最后给出方案实施的建议。

关键词:双活数据中心;vSphere FT

1.引言

近年来,信息化技术在促进业务质效提升方面发挥着越来越重要的作用,企业对数据中心的RTO和RPO也提出了更高的要求,双活数据中心建设逐渐成为热门话题。严格来说,关于双活数据中心的定义,目前业界还没有统一的标准和规范,现有的定义主要是一些厂商从基础架构角度提出的理念,最终都体现为业务连续性和资源利用率的提升。

2.vSphere FT简介

VMware Fault Tolerance是VMware保护虚拟机可用性的一项功能。针对被保护虚拟机——主虚拟机,通过在集群内另外一台主机上创建和维护与之完全相同的辅助虚拟机,提供比HA更高级别的业务连续性保障。

正常情况下,vSphere平台通过一定机制,实时将内存数据在内的所有信息同步至辅助虚拟机。当主虚拟机所在主机发生故障时,辅助虚拟机立刻成为主虚拟机并接管业务,同时在其他可用主机上新建辅助虚拟机,整个切换过程RPO和RTO为0。

3.方案基本原理

二层网络打通的情况下,通过在双数据中心搭建跨站点的vSphere集群架构,将不同业务虚拟机分散至双数据中心同时对外提供服务,开启被保护虚拟机的FT功能,并指定辅助虚拟机所在数据中心,从而实现业务级数据中心双活。

4.主要做法

一是检查网络环境,以满足跨站点FT对网络的要求,具体包括两个数据中心间的10Gbit链路、二层网络互通等;二是调整虚拟化平台的部署,在两个数据中心分别构建ESXi集群和存储虚拟化,配置存储对本数据中心及对端数据中心集群可见;三是调整关键业务虚拟机的资源配置并部署于主数据中心虚拟化平台,以满足FT对单主机保护虚拟机数量的限制,可利用vCenter Operation Manager获取关键业务虚拟机的实际资源需求,进而对其配置进行调整;四是进行FT相关配置,包括开启HA、指定辅助虚拟机所在主机等。

5.方案评价

严格意义上的数据中心双活包括网络双活、应用双活和数据双活等,除网络双活技术已发展较为成熟外,其他方面都还处在发展完善阶段,且存在“脑裂”、性能下降等风险。

相比之下,本文所提方案具有以下优点。

成本低廉:硬件要求与其它数据中心双活解决方案类似,但该方案基于vSphere自带功能实现,无需购买额外的软件产品。

架构简单:依托网络双活技术,基于vSphere平台环境运行,不需要对现有应用、数据库进行改造。

运维简便:类似于常规的虚拟化运维,不存在“脑裂”、性能下降等风险。

5.1.局限性

目前,vSphere FT功能仍处在一个持续完善的过程中,在诸多方面有一定的局限性。

5.1.1. 基础硬件设施要求高

主要体现在:主机中用于容错虚拟机的CPU必须与vSpherevMotion兼容,并需要CPU支持硬件MMU虚拟化;需要使用10 Gb日志记录网络并确保网络延迟时间非常短。

5.1.2. 软件许可限制较严格

群集中的主机上允许的最大容错虚拟机数量为4,并且主虚拟机和辅助虚拟机均计入此限制;跨主机上所有容错虚拟机聚合的最大vCPU数量为8,主虚拟机和辅助虚拟机中的vCPU均计入此限制;最高级别的vSphere版本,单个容错虚拟机支持的vCPU数量最多为8。

5.1.3. 不支持vSphere部分功能

开启FT的虚拟机不支持vSphere部分功能,主要包括:不能对已启用FT的虚拟机执行快照;支持为vStorage APIs - Data Protection (VADP)备份而创建的仅磁盘快照,但旧版FT不支持VADP;不能为已启用FT的虚拟机调用 Storage vMotion;不能在为链接克隆的虚拟机上使用Fault Tolerance,也不能从启用了FT的虚拟机创建链接克隆;不支持磁盘加密、虚拟卷数据存储、基于存储的策略管理、 I/O 筛选器、TPM、启用VBS的虚拟机、UPIT。

5.1.4. 不兼容虚拟机部分功能和设备

开启FT的虚拟机不能兼容虚拟机部分功能和设备,主要包括:物理裸磁盘映射、由物理或远程设备支持的CD-ROM或虚拟软盘设备、USB和声音设备、N_Port ID虚拟化(NPIV)、网卡直通、热插拔设备、串行或并行端口、启用了3D的视频设备、虚拟EFI固件、虚拟机通信接口(VMCI)、2TB+VMDK。

6.最佳实践

6.1.主机配置

运行主虚拟机和辅助虚拟机的主机应当按照与处理器大致相同的频率运行,否则辅助虚拟机可能会频繁地重新启动。

6.2.主机网络配置

按照一定规则配置主机网络,以便在不同流量类型的组合和不同数目的物理网卡的情况下支持FT。

6.3.同类集群

构建群集时,所有主机都应具有以下配置:对虚拟机所用数据存储的一般访问权限、相同的虚拟机网络配置、所有主机相同的 BIOS 设置。

6.4.性能

要为主虚拟机和辅助虚拟机之间的日志记录通信增加可用带宽,须使用10千兆位网卡,并允许使用巨帧。

6.5.在共享存储上存储 ISO 以连续进行访问

对于启用了FT的虚拟机,其所访问的ISO应存储在可以供容错虚拟机的两个实例访问的共享存储上。

6.6.避免网络分区

当vSphere HA群集出现管理网络故障,导致某些主机与vCenter Server隔离并且使这些主机彼此隔离时,会出现网络分区,有可能降低FT保护。

7.结语

vSphere FT技术通过创建和维护与主虚拟机相同、且可在故障发生时随时切换的辅助虚拟机,提供了较HA更高等级的业务连续性保障能力。从vSphere最近版本中对FT功能的更新情况可以看出,FT技术仍然处在不断发展进步的过程中,通过合理利用,有望形成一套更为成熟、简单可靠的双活数据中心解决方案。