H3C CAS云平台⽅案
CAS基于开源KVM的虚拟化技术优化
⽂/欧珊瑚KVM(Kernel-based Virtual Machine,基于内核的虚拟机)是⼀个基于Linux环境的开源虚拟化解决⽅案,最早由Qumranet公司开发,在2006年10⽉出现在Linux内核的邮件列表上,并于2007年2⽉被集成到Linux 2.6.20内核中,成为内核的⼀部分。
“基于Linux内核”实现的KVM系统在实现⽅式上不同于其它的Hypervisor,其设计⽬标是最⼤限度地利⽤现有操作系统的各个功能模块和硬件对虚拟化技术进⾏⽀持,以⼀个内核来加载功能模块的⽅式实现,并将整个Linux内核转化成⼀个裸机的
Hypervisor。除此之外,KVM还充分利⽤了Linux内核已有的成熟功能和基础服务,减少不必要的重新开发,如任务调度、物理内存管理、内存空间虚拟化、电源管理等功能。在KVM的系统构架中,虚拟机以普通Linux进程的⽅式来实现,由标准的Linux进程调度器来调度,每个虚拟CPU(vCPU)都以⼀个常规的Linux进程来呈现,硬件设备的模拟则是通过⼀个修改过的QEMU来进⾏,提供了BIOS,PCI总线,USB总线和其他标准设备(如IDE和SCSI硬盘控制器以及⽹络控制器等)的模拟。KVM将Linux内核转化为Hypervisor,通常情况下,⽀持Linux的硬件设备就可以被KVM⽀持。
虽然开源KVM存在诸多优点,但是原⽣态的KVM在业务可靠性、⽹络控制、可管理性、可运维性等⽅⾯存在缺陷。⾸先,开源KVM基于虚拟化内核实现,对底层硬件故障、虚拟机故障、虚拟机操作系统故障和上层应⽤故障都缺少解决⽅案;其
次,KVM系统的虚拟交换机是⼀个标准化的流量转发模块,它⽆法应对实际⽣产系统对复杂⽹络访问控制策略的需求,例如:QoS、ACL、VxLAN、端⼝聚合、流量镜像等;最后,KVM缺少可视化的配置与管理⼯具、丰富的业务系统性能监控能⼒和资源的⾃动化调度管理能⼒。⼀、CAS对开源KVM的优化
H3C CAS云计算管理平台(下⽂简称CAS)是华三通信基于开源KVM研发的⼀款虚拟化管理软件,与开源KVM相⽐,H3CCAS云计算管理平台不仅在⾼可靠性、⽹络控制、可管理性和可运维性等⽅⾯进⾏了改进,⽽且与H3C公司成熟的⽹络产品、第三⽅存储与安全⼚商合作,形成了全融合虚拟化解决⽅案,,这也成为CAS的核⼼竞争⼒。●CAS对KVM进⾏了哪些优化?⾼可靠性
对于⼀些重要的业务⼊⼝或接⼊点(例如:企业的⽣产服务器和⾦融⾏业的数据库服务器等),即使出现秒级的业务中断,也将遭受灾难性的后果。因此,如何保证虚拟化环境下业务应⽤系统的⾼可靠性,成为云平台管理软件需要解决的⾸要问题。CAS的⾼可靠性(High Availability,HA)技术技术很好的破解了这⼀难题。集群HA
在开源KVM软件的基础上,H3C CAS CVK虚拟化内核系统(下⽂简称CVK)集成了集群HA软件,将⼀组
物理主机划分到⼀个具有共享存储资源池的逻辑集群中,通过H3C CAS CVM虚拟化管理平台(下⽂简称CVM)持续监控集群内所有的物理主机和虚拟机的运⾏状况,⼀旦发⽣故障,CVM会触发虚拟机迁移,在集群内⾃动选择另⼀台正常⼯作的物理主机,并在这台物理主机上重启所有受影响的虚拟机。应⽤HA
应⽤HA是指运⾏于虚拟机操作系统内的业务系统的⾼可靠性,当业务系统由于⾃⾝原因导致⽆法对外正常提供服务时,可以借助应⽤HA功能,以最短的时间⾃动恢复业务。
企业级业务系统⼀般都以进程服务的⽅式驻留在操作系统内,CVM虚拟化管理平台利⽤CAStools⼯具来监控业务服务进程的状态,该⼯具安装在虚拟机操作系统上,通过虚拟串⼝通道保持与H3C CAS CVM虚拟化管理平台的实时通信,判定业务的存活状态。如果在连续3个时间周期(1个周期为30秒)内探测到被监测的服务状态为⾮运⾏或⾮活跃状态,则⾃动重启该服务;如果连续4个时间周期检测到应⽤服务故障,且重启服务失败,则根据系统管理员配置的应⽤HA策略,重新启动虚拟机或仅上报应⽤故障不可恢复的告警消息。◆⽹络控制
CVK不仅在开源KVM基础上增加了ACL、QoS、VLAN、链路聚合、端⼝镜像、硬件SR-IOV等基础⽹络功能,⽽且,考虑到虚拟化环境中虚拟机迁移前后的⽹络策略同步问题,设计和实现了分布式虚拟交换机(virtual Distributed Switch,vDS)功能。
当虚拟机在集群内迁移时,CVK⾃动将虚拟机的⽹络配置从源虚拟交换机同步到⽬的虚拟交换机,实现迁移前后⽹络策略的⾃动感知与⽣效,从⽽确保虚拟机迁移前后⽹络策略的⼀致性。源和⽬的虚拟交换机就构成了⼀个逻辑上统⼀的虚拟交换机,即分布式虚拟交换机。分布式虚拟交换机的控制由CVM统⼀管理,包括虚拟交换机策略的配置与下发,数据平⾯则分布在各个承载虚拟机的物理主机内核中。●可视化管理
开源KVM重点关注的是虚拟化内核的实现,在可管理性⽅⾯远远没有达到商⽤的级别,⽽且,在性能监控、邮件、短信告警、API接⼝等企业级特性完全是⼀⽚空⽩。CAS提供了简洁易⽤的图形化操作界⾯,为IT系统管理员提供了直观的虚拟化环境视图。
图1虚拟化环境健康状态概览
图2虚拟化拓扑
图3 虚拟化业务系统状态
除了基本的可视化管理能⼒之外,CVM 还提供了开放的REST API 接⼝和兼容OpenStack 云平台的插件,通过这两种⽅式实现与第三⽅云管理平台及基于标准OpenStack 云平台的⽆缝对接(如图所⽰)。客户基于标准OpenStack 开发⾃⼰的云平台时,只需要关注与⾃⾝业务相关的前端流程,底层虚拟化基础架构功能完全由H3C CAS CVM 虚拟化管理平台完成。H3C CAS CVKHypervisor
基于OpenStack 的云平台H3C CAS CVM
Nova-Driver 服务器(机架& ⼑⽚)⽹络(ToR &机箱)
存储(IP & FC )计算组件(Nova )Nova-PluginNova-Compute存储组件(Cinder )Cinder-PluginCinder-Storage⽹络组件(Neutron )Neutron-PluginNeutron-NetworkOpenStack APIsOpenStack APIsOpenStack APIs
Cinder-Driver Neutron-DriverProprietary APIs (REST)Proprietary APIs (REST)Proprietary APIs (REST)
H3C or 3rd PartyH3C客户⾃研H3C服务门户⽤户管理资源申请资源监管计量计费报表清单
图4 H3C CAS 与标准OpenStack 对接技术架构图可运维性
开源KVM 的定位仅仅是⼀个开源的虚拟化内核实现,它对IT 运维与云计算没有任何涉及。H3C CAS CIC 云业务管理中⼼(下⽂简称CIC )组件将基础架构资源(包括计算、存储和⽹络)及其相关策略整合成虚拟数据中⼼资源池,允许⽤户申请这些资源,从⽽构建⼀个安全的、多租户的、可⾃助服务的“互联⽹化私有云”,为IT 部门提供⼀种全新的基础架构交付和使⽤模式。这种⾃助式的服务真正实现了云计算的敏
捷性、可控性和⾼效性,并极⼤程度地提⾼了业务的响应能⼒。⼆、CAS全融合解决⽅案
CAS借助华三通信⾃⼰成熟的⽹络产品与技术,并与第三⽅存储及安全⼚商合作,形成了业界领先的全融合解决⽅案。例如:H3C CAS云计算管理平台融合了独创的DRX(Dynamic Resource eXtension,动态资源扩展)、分布式存储组件vStor、业界落地最为⼴泛的VxLAN解决⽅案和轻代理/⽆代理防病毒解决⽅案,真正实现了计算、存储、⽹络和安全虚拟化的全⾯融合。下⾯对上述⽅案作详细分析。
图5H3C CAS:全融合虚拟化解决⽅案●计算资源虚拟化技术-DRX
资源动态扩展技术(Dynamic Resource eXtension,DRX)是华三通信的专利技术,实现基于⽤户业务负载的资源动态扩展与回收。即:当⽤户某项正常运⾏的业务⾯临突发流量访问时,CVM能够监控到业务所在虚拟机性能不⾜,并将虚拟机进⾏快速复制,在负载均衡设备的配合下共同对外提供服务;当业务访问⾼峰过后,能够⾃动回收资源,删除多余的虚拟机,从⽽实现⼀个计算资源随需⽽动的⾃动化环境。●存储虚拟化技术-vStor
CAS的vStor组件是⼀种分布式存储技术⽅案,它将多个服务器上的空闲磁盘空间整合成⼀个的存储资源池,依靠“软件+标准的x86硬件”来实现存储,形成低成本、⾼可靠、可横向扩展(Scale-out)的存储虚拟化基础架构,在⽤户⽆需购买专⽤存储设备和SAN⽹络设备的情况下,将数据中⼼存储架构扁平化,不仅简化了IT运维和管理,同时降低了能耗,帮助企业实现IT环境的节能减排。
●⽹络虚拟化技术-VxLAN
VxLAN⽹络架构在传统物理⽹络基础上构建了⼀个逻辑的⼆层⽹络,是⽹络⽀持⼤规模虚拟化发展的理想选择,也是H3C云⽹融合解决⽅案技术路线中的关键技术。
H3C CAS CVK虚拟化内核系统⽀持标准VxLAN封装技术的分布式虚拟交换机,实现虚拟⽹络与物理⽹
络的解耦,虚拟机可以在⼀个⼤⼆层⽹络环境中迁移,实现了安全策略的跨数据中⼼同步跟随,同时,⽤户最多可以创建多达16M相互隔离的虚拟⽹络,突破了VLAN⽅案4K个隔离⽹络的,帮助⽤户构建安全的多租户虚拟⽹络。虚拟化安全:防病毒
⼀般情况下,传统数据中⼼⽹络的安全解决⽅案都通过防⽕墙和IPS等物理设备进⾏攻击与病毒防范,当数据中⼼往虚拟化环境迁移的时候,由于原来部署在物理主机上的业务系统“深藏”于虚拟机中,传统安全解决⽅案的“触⾓”⽆法深⼊到物理主机内部,造成了安全管理的灰⾊区域。
CAS与专业安全⼚商合作,提出了轻代理和⽆代理防病毒解决⽅案,旨在保护数据中⼼和虚拟机业务免遭数据泄露的风险。其中,轻代理防病毒⽅案需要在每个被保护的虚拟机操作系统内部安装代理程序,由该代理程序触发虚拟机病毒扫描任务;⽆代理防病毒⽅案则需要在虚拟化内核系统中集成防病毒引擎,在底层实现整个虚拟机⽹络总体安装状况的统⼀管理,在虚拟机磁盘⽂件读写的时候,实时查病毒。
开源KVM作为直接构建在Linux内核上的虚拟机管理程序,已经成为最⼴泛的应⽤于Linux操作系统的虚拟化平台。尽管H3CCAS云计算管理平台基于开源KVM内核开发,但与开源KVM相⽐,H3C CAS云计算管理平台从⾼可靠性、⽹络控制、可管理性、可运维性等⽅⾯进⾏了增强、补充和创新,使其更契合企业和⾏业数据中⼼对虚拟化的技术要求和业务要求,并通过开放合作的⽅式,结合H3C公司⾃⾝在⽹络技术⽅⾯的深厚积累,形成了计算、⽹络、存储、安全的多⽅位全融合虚拟化管理平台。这些功能和解决⽅案的设计和开发过程,也是⼀个不断创新的过程,这些创新已经成为H3C CAS云计算管理平台的核⼼竞争⼒。
表1H3C CAS云计算管理平台核⼼专利⼀览表
CAS⾼可靠性和⾼可⽤性三、技术应⽤背景
随着虚拟化和云计算浪潮在全球IT⾏业的兴起,越来越多的企业、⾏业和运营商纷纷将⾃⾝的IT架构切换到虚拟化环境中。虚拟化技术对数据中⼼内未被充分利⽤的服务器进⾏整合,极⼤地降低了客户的⼀次性投⼊成本,精简了数据中⼼物理服务器的数量,同时,减少了供电、制冷、场地和运维⼈员⽅⾯的运营成本。
但是,虚拟化也为IT应⽤带来了单点故障问题,在未实施虚拟化技术之前,IT管理员往往遵循“根据最坏情况下的⼯作负载来确定所有服务器的配置”这⼀策略,即⼀台⾼性能物理服务器仅安装⼀个应⽤程序。在这种情况下,即使该物理服务器出现了断电或操作系统崩溃等异常状况,最多只会影响到⼀个应⽤的运⾏,⽽在虚拟化环境下,每台物理服务器往往运⾏多个虚拟的应⽤服务器,因此,虚拟化技术的实施将使IT环境⾯临的灾难破坏性更严重,尤其对于⼀些重要的业务⼊⼝或接⼊点(如企业的⽣产服务器和⾦融⾏业的数据库服务器等),即使出现秒级的业务中断,也将遭受灾难性的后果。在这种应⽤背景下,如何保证虚拟化环境下业务应⽤的⾼可靠性和⾼可⽤性,成为急需解决的⼀个技术问题。
VM VM VM
图6物理服务器故障造成虚拟化业务全部中断
传统的集群解决⽅案(如微软的Cluster Service和Veritas Cluster Server)致⼒于在发⽣服务器主机故障或虚拟机故障时,在最短的应⽤程序停机时间内实现即时恢复,要达到这个⽬标,IT基础架构必须进⾏如下设置:
每台物理服务器和虚拟机都必须有⼀个镜像虚拟机(可能在其它服务器主机上)。
使⽤集群软件将服务器(或虚拟机及其主机)设置为互相镜像,⼀般情况下,由主虚拟机向镜像发送⼼跳信号,⼀旦发⽣故障,镜像将⽴即接管。
下图显⽰使⽤传统集群⽅法的典型的虚拟机设置:
机箱内集群跨机箱集群
图7使⽤传统集群配置确保虚拟化应⽤的⾼可靠性
设置和维护这样的集群解决⽅案成本昂贵,并会占⽤⼤量资源。每添加⼀台新的虚拟机,可能需要更多的虚拟机甚⾄是更多的服务器主机才能进⾏故障切换。您将不得不设置、连接和配置所有的新计算机,并更新群集应⽤程序的配置。
总之,传统解决⽅案虽然能够保证快速恢复,但却是资源和劳动密集型的,⽽且通常存在对应⽤程序和操作系统的依赖性问题。
由于集群解决⽅案的成本和复杂性问题,它们通常只被⼀⼩部分企业应⽤程序所采⽤,⽽⼤部分应⽤程序则没有任何故障切换保护。
为了解决虚拟化和云计算部署带来的单点故障问题,H3C CAS云计算软件摒弃了⾼成本、⾼复杂度的传统
集群⽅案,通过为应⽤程序提供可⽤的、经济的⾼可⽤性,⽽使其更“⼤众化”。四、H3C实现的技术特⾊
1.2 H3C CAS云计算管理平台简介
H3C CAS云计算管理平台是H3C公司⾯向企业和⾏业数据中⼼推出的虚拟化和云计算管理软件,通过精简数据中⼼服务器的数量,整合数据中⼼IT基础设施资源,精简IT操作,提⾼管理效率,达到提⾼物理资源利⽤率和降低整体拥有成本的⽬的。同时,利⽤先进的云管理理念,建⽴安全的、可审核的数据中⼼环境,为业务部门提供成本更低、服务⽔平更⾼的基础架构,从⽽能够针对业务部门的需求做出快速的响应。H3C CAS云计算管理平台由三个组件构成:CVK:Cloud Virtualization Kernel,虚拟化内核平台
运⾏在基础设施层和上层客户操作系统之间的虚拟化内核软件。针对上层客户操作系统对底层硬件资源的访问,CVK⽤于屏蔽底层异构硬件之间的差异性,消除上层客户操作系统
对硬件设备以及驱动的依赖,同时增强了虚拟化运⾏环境中的硬件兼容性、⾼可靠性、⾼可⽤性、可扩展性、性能优化等功能。
CVM:Cloud Virtualization Manager,虚拟化管理系统
主要实现对数据中⼼内的计算、⽹络和存储等硬件资源的软件虚拟化管理,对上层应⽤提供⾃动化服务。其业务范围包括:虚拟计算、虚拟⽹络、虚拟存储、⾼可⽤性(HA)、动
态资源调度(DRS)、虚拟机容灾与备份、虚拟机模板管理、集群⽂件系统、虚拟交换机策略等。
CIC:Cloud Intelligence Center,云业务管理中⼼
由⼀系列云基础业务模块组成,通过将基础架构资源(包括计算、存储和⽹络)及其相关策略整合成虚拟数据中⼼资源池,并允许⽤户按需消费这些资源,从⽽构建安全的多租户
混合云。其业务范围包括:组织(虚拟数据中⼼)、多租户数据和业务安全、云业务⼯作流、⾃助式服务门户、兼容OpenStack的REST API接⼝等。
图8H3C CAS云计算管理平台系统逻辑结构图1.3 相关技术基础简介共享存储
H3C CAS云计算管理平台中的存储⽤于保存虚拟机的操作系统、应⽤程序⽂件、配置⽂件以及与活动相关的其它数据,是虚拟机正常⼯作的基本前提条件。
根据存储的种类不同,可以分为本地存储和共享存储两种。
在部署了H3C CAS云计算管理平台,并将主机作为被管理资源对象添加到H3C CAS云计算管理平台之后,该主机默认使⽤本地磁盘介质作为存储,其它主机不能使⽤。
在数据中⼼中,很多⽤户选择使⽤共享存储来承载虚拟机及其数据,⽬前,H3C CAS云计算管理平台⽀持IP SAN等类型的存储。
采⽤共享存储的好处是:
共享存储往往⽐本地存储提供更好的I/O性能(尤其在多虚拟机环境下)。
H3C CAS云计算管理平台中的⾼可⽤性功能需要共享存储作为先决条件,例如HA和动态资源调整等。
H3C CAS中的虚拟机⽂件系统是⼀种优化后的⾼性能集群⽂件系统,允许多个云计算节点同时访问同⼀虚拟机存储。由于虚拟架构系统中的虚拟机实际上是被封装成了⼀个档案⽂件和若⼲相关环境配置⽂件,通过将这些⽂件放在SAN存储阵列上的⽂件系统中,可以让不同服务器上的虚拟机都可以访问到该⽂件,从⽽消除了单点故障。
图9共享存储组⽹拓扑结构动态迁移
动态迁移是实现⾃动化和⾃我优化的数据中⼼所必需的关键特性。H3C CAS动态迁移⽀持在物理服务器之间实时迁移正在运⾏中的虚拟机,利⽤虚拟机实时迁移技术,不仅在执⾏硬件维护时⽆需安排宕机和中断业务操作,⽽且可以使资源池内的虚拟机不断⾃动优化,最⼤限度地提⾼硬件利⽤率、灵活性和可⽤性。
图10虚拟机迁移技术
利⽤H3C CAS动态迁移技术在物理服务器之间实时迁移虚拟机的过程是通过两项底层技术实现的。(1) 虚拟机操作系统和应⽤程序的完整状态被封装在共享存储设备上的⼀组⽂件之中,这样的共享存储设备可以是iSCSI存储区域⽹络(SAN)或⽹络连接存储(NAS)。通过H3CCAS⾼性能集群⽂件系统,多个物理服务器主机可以同时访问同⼀个虚拟机⽂件。(2) 虚拟机的内存映像和精确执⾏状态可通过⾼速⽹络在各物理服务器主机之间迅速传递。H3C动态迁移技术通过在⼀个位图中保存对现⾏内存处理过程的跟踪,使⽤户在数据传递期间察觉不到性能变化。⼀旦整个内存和系统状态被复制到⽬标物理服务器主机之后,H3C CAS动态迁移技术就会中⽌源虚拟机的运⾏,随后,将位图复制到⽬标物理服务器,并在⽬标物理服务器上继续运⾏该虚拟机。
1.4 H3C CAS⾼可靠性(HA)技术
H3C CAS云计算软件将⼀组服务器主机合并为⼀个具有共享资源池的集群,并持续对集群内所有的服务器主机与虚拟机运⾏状况进⾏检测,⼀旦某台服务器主机或虚拟机发⽣故障,H3C CAS HA软件模块会⽴即响应并在集群内另⼀台服务器主机上重启所有受影响的虚拟机。●相关术语
1. 节点(Node)
运⾏HA⼼跳进程的⼀个独⽴主机,称为节点。节点是HA软件模块的运⾏载体,每个节点上运⾏着H3C CAS 云计算操作系统和⼼跳软件服务。
2. DC(Designated Coordinator,指定协调者)
HA软件模块在开始⼯作前,⾸先在各节点间选举产⽣⼀个节点作为主节点,⽤于管理和控制集群HA的指令,所有配置操作都在该DC主机上进⾏,并由其分发到集群下的各个节点上。3. 资源(Resource)
资源是⼀个节点可以控制的实体,并且当节点发⽣故障时,这些资源能够被其它节点接管,如虚拟机镜像⽂件资源等。4. 事件(Event)
集群中可能发⽣的事情,例如节点系统故障、⽹络连通故障、⽹卡故障、应⽤程序故障等。这些事件都会导致节点的资源发⽣转移,HA的稳定运⾏与检测也是基于这些事件来进⾏的。5. 动作(Action)
事件发⽣时HA的响应⽅式,动作是由shell脚本控制的,例如,当某个节点发⽣故障后,备份节点将通过事先设定好的执⾏脚本进⾏服务的关闭或启动。进⽽接管故障节点的资源。●物理服务器主机HA⼯作原理
H3C CAS云计算软件统⼀在各个物理服务器节点之间维持“⼼跳”(默认为3秒),节点之间通过相互发送组播报⽂以检测对⽅是否存在,当发现某个节点连续多次(默认为10次)未响应组播请求时,就认为该节点发⽣了节点系统故障事件,此时,集群内的DC就会重启该节点,并根据⼀定的策略算法,尝试在其它的服务器上重新启动所有失效的虚拟机。HA软件模块会保证在任何时候当物理服务器发⽣宕机时,资源池中都有⾜够的硬件资源,使失效的服务器中的虚拟机在其它的服务器上顺利启动。H3C CAS采⽤优化后的⾼性能集群⽂件系统,通过⽀持SAN/iSCSI/NFS等存储协议,可以允许不同的服务器访问同⼀虚拟机磁盘⽂件,这⼀特性使得H3C CAS HA的实现⾮常的简单和⽅便。
VM VM VM
图11使⽤H3C CAS云计算软件HA特性进⾏主机故障切换
需要注意的是,如果发⽣系统故障事件的节点恰好为DC节点,那么,在检测到DC节点故障后,集群内的备份节点之间⾃动发起DC的选举,重新⽣成新的DC。虚拟机HA⼯作原理
除了对集群中的物理服务器节点进⾏持续检测之外,H3C CAS HA软件模块还对运⾏于物理服务器节点之上的虚拟机进⾏持续检测。
在每台服务器节点上都运⾏了⼀个LRMd(Local Resource Manager daemon,本地资源管理器守护进程),它是HA软件模块中直接操作所管理的各种资源的⼀个⼦模块,负责对本地的虚拟化资源进⾏状态检测,并通过shell脚本调⽤⽅式实现对资源的各种操作。
当LRMd守护进程检测到本机的某台虚拟机出现通信故障时,⾸先将事件通知给DC,由DC统⼀将该虚拟机状态告知集群内所有的物理服务器节点,并按照⼀定的策略算法,为该故障的虚拟机选择⼀个空闲的服务器节点,在该节点上重启该虚拟机。
图12使⽤H3C CAS云计算软件HA特性进⾏虚拟机故障切换●技术特⾊总结
H3C CAS HA技术有效的解决了⽬前其它⾼可⽤性解决⽅案⾯临的问题:
当物理服务器发⽣硬件故障时,所有运⾏于该服务器的虚拟机可以⾃动切换到其它的可⽤服务器上,相对传统的双机容错⽅案,H3C CAS HA可以最⼤程度减少因硬件故障造成的服务器故障和服务中断时间。
不同于其它HA的双机热备⽅式,所有参与HA的物理服务器都在运⾏⽣产系统,充分利⽤现有硬件资源。同时,对众多的操作系统和应⽤程序,H3C CAS提供统⼀的HA解决⽅案,避
免了针对不同操作系统或者应⽤,采⽤不同的HA⽅案带来的额外开销和复杂性。通过H3C CAS HA,IT部门可以:为没有容错功能的应⽤提供冗余保护
传统意义上HA实现很复杂并且价格昂贵,多⽤于关键性的服务或应⽤,⽽H3C CAS HA 为所有的应⽤程序提供了⾼性价⽐的HA解决⽅案。
为整个IT环境提供“第⼀条安全防线”
不同于其它基于操作系统和应⽤的HA实现⽅式,H3C CAS HA为IT系统提供了更统⼀、更易于管理的⾼可⽤性解决⽅案。H3C CAS⽤最少的成本和最简单的管理⽅式为所⽤的应⽤提供了最基本的冗余保护功能。
综上所述,H3C CAS HA解决⽅案的技术特点总结如下:
1. ⾃动侦测物理服务器和虚拟机失效
H3C CAS会⾃动的监测物理服务器和虚拟机的运⾏状态,如果发现服务器或虚拟机出现故障,会在其它的服务器上重新启动故障机上所有虚拟机,这个过程⽆需任何⼈为⼲预。2. 资源预留
H3C CAS永远会保证资源池⾥有⾜够的资源提供给虚拟机,当物理服务器宕机后,这部分资源可以保证虚拟机能够顺利的重新启动。
3. 虚拟机⾃动重新启动
通过在其它的物理服务器上重新启动虚拟机,HA可以保护任何应⽤程序不会因为硬件失效⽽中断服务。4. 智能选择物理服务器
当与H3C CAS动态负载均衡功能共同使⽤时,H3C CAS HA可以根据资源的使⽤情况,为失效物理服务器上的虚拟机选择能获得最佳运⾏效果的物理服务器。1.5 H3C CAS⾼可⽤性技术动态资源调整
在虚拟化和云计算环境中,⼀旦客户将服务器整合到资源较少的物理主机上,虚拟机的资源需求往往会成为意想不到的瓶颈,全部资源需求很有可能超过主机的可⽤资源。H3C CAS云计算软件提供的动态负载均衡特性引⼊⼀个⾃动化机制,通过持续地平衡容量,将虚拟机迁移到有更多可⽤资源的主机上,确保每个虚拟机在任何节点都能及时地调⽤相应的资源。即便⼤量运⾏SQL Server的虚拟机,只要开启了动态资源调整功能,就不必再对CPU和内存的瓶颈进⾏⼀⼀监测。全⾃动化的资源分配和负载平衡功能,也可以显著地降低数据中⼼的成本与运营费⽤。
1. ⼯作原理
图13使⽤H3C CAS云计算软件动态资源调整特性进⾏虚拟机动态迁移
H3C CAS管理台定期(默认1分钟)轮询集群内所有的物理服务器主机,对CPU和内存等关键计算资源的利⽤率进⾏检测,并根据⽤户⾃定义的规则来判断是否需要为物理服务器主机在集群内寻找有更多可⽤资源的主机,以将该主机上的虚拟机迁移到另外⼀台具有更多合适资源的服务器上,或者将该服务器上其它的虚拟机迁移出去,从⽽为某个虚拟机腾出更多的“空间”。图14集群动态资源调度⾃定义规则配置
除了定时检测和动态迁移之外,H3C CAS还充分考虑了虚拟机对物理服务器主机的亲和性因素,即衡量虚拟机对当前物理主机的依赖程度。例如,⽤户可能希望某些虚拟应⽤系统只允许在固定的物理主机上运⾏,⽽不允许其动态迁移。此时,只需要在H3C CAS云计算管理平台上,去勾选虚拟机的⾃动迁移属性即可。
图15虚拟机⾃动迁移属性配置2. 技术特⾊总结
根据业务需求⾃动调整资源
H3C CAS动态资源调度功能将物理服务器主机资源聚合到集群中,通过监控CPU和内存等关键计算资源的利⽤率持续优化虚拟机跨物理主机的分发,将这些资源动态⾃动分发到各虚拟机中。⾃动平衡计算容量
H3C CAS动态资源调度功能会不间断地平衡资源池内的计算容量,提⾼服务级别并确保每个虚拟机能随时访问相应资源,满⾜虚拟应⽤程序的⾼可⽤性。●虚拟机资源限额
默认情况下,H3C CAS给每台物理服务器主机上的虚拟机分配数量相同的CPU、内存以及磁盘I/O资源。但是,并不是所有虚拟机⼯作负载天⽣相同,例如,SQL服务器和Web服务器的访问需求就不尽相同,因此,⼿动调整分配给每个虚拟机的资源就显得⾮常重要。
图16 资源限额机制确保虚拟机的⾼可⽤性
H3C CAS 通过资源限额⽅式来为虚拟机指定资源调度的优先级。有三种预设的限额分配⽅式:⾼、中、低,⽐如,⼀台物理服务器主机上分配了5个虚拟机,CPU 调度优先级分别为⾼、中、中、低、低,那么,⾼优先级的虚拟机⾄少可以获得
4/(4+2+2+1+1)=40%的CPU 资源,中优先级的虚拟机⾄少可以获得20%的CPU 资源,⽽低优先级的虚拟机⾄少可以获得10%的CPU 资源。
需要强调的是,虚拟机资源限额机制的真正⽬的是为了确保每个虚拟机对资源的调度下限,如果物理服务器上没有发⽣虚拟机的资源抢占⾏为,那么,即使是低优先级的虚拟机也有可能独享该物理服务器上绝⼤部分的资源。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务