聪明文档网

聪明文档网

最新最全的文档下载
当前位置: 首页> 最全的云计算平台设计方案

最全的云计算平台设计方案

时间:2018-06-27 05:49:18    下载该word文档

1. 云计算参考架构

在私有云当中,主要包含以下几个组件:物理基础架构、虚拟化层、服务自动化层、服务门户、安全体系、云API和可集成的其它功能。(如图 私有云参考架构)

图 3.4 私有云参考架构

a) 物理基础架构

物理架构的定义是组成私有云的各种计算资源,包括存储、计算服务器、网络,无论是云还是传统的数据中心,都必须基于一定的物理架构才能运行。

在私有云参考架构中的物理基础架构其表现形式应当是以资源池模式出现,也就是说,所有的物理基础架构应当是统一被管,且任一设备可以看成是无状态,或者说并不与其它的资源,或者是上层应用存在紧耦合关系,可以被私有云根据最终用户的需求,和预先定制好的策略,对其进行改变。

b) 虚拟化层

虚拟化是实现私有云的前提条件,通过虚拟化的方式,可以让计算资源运行超过以前更多的负载,提升资源利用率。虚拟化让应用和物理设备之间采用松耦合部署,物理资源状态的变更不影响到虚拟化的逻辑计算资源。且可以根据物力基础资源变化而动态调整,提升整体的灵活性。

c) 服务自动化层

服务自动化层实现了对计算资源操作的自动化处理。它可以集中的监控目前整体计算资源的状态,比如性能、可用性、故障、事件汇总等等,并通过预先定义的自动化工作流进行相关的处理。

服务自动化层是计算资源与云计算服务门户相关联的重要部件,服务自动化层拥有自动化配置和部署功能,可以进行服务模板的制定,并将服务内容和选择方式在云计算服务门户上注册,用户可以通过服务门户上的服务目录来选择相应的计算资源请求,由服务自动化层实现服务交付。

d) 云API

云应用开发接口提供了一组方法,让云服务门户和不同的服务自动化层进行联系,通过云API,可以在一个私有云当中接入多个不同地方的计算资源池,包括不同架构的计算资源,并通过各自的服务自动化体系去进行服务交互。

e) 云服务门户

云服务门户是用户使用私有云计算资源的接口,云服务门户上提供了所有可用服务的目录,并提供了完善的服务申请流程,用户可以执行申请、变更、退回等计算资源使用服务。

云服务门户收到最终用户的请求时,将根据预先定义好的策略对该请求进行立刻供应、预留或者排队。

不同的用户通过同一个云服务门户当中,将会看到只属于自己的应用、计算资源和服务目录,这是云计算当中的多租户技术,用户使用的资源在后台集中,但是在前端是完全的逻辑分离,有众多的安全保护措施来确保隔离。

f) 安全体系

在私有云当中,具有完整的安全体系,包括物理资源、虚拟化平台、系统安全、应用安全和用户访问安全,每个层次都有相关的安全监控和控制,确保最终用户的应用运行稳定可靠。

g) 集成

私有云当中可以集成其它更多的功能,以达到更好的服务效果。如服务级别管理,提供更好的服务质量。容量管理,为私有云的服务能力和扩展趋势作出建议。计量和收费,真正实现按使用付费。

2.1 虚拟化数据中心参考架构

2.1.1虚拟化数据中心蓝图

图-虚拟化数据中心

如图“图-虚拟化数据中心“所示,在整个虚拟化数据中心当中包括了虚拟化平台,虚拟化数据中心管理,虚拟化数据中心备份,虚拟化数据中心运维,虚拟化数据中心安全,总共5个组成部分。通过对每个组成部分的功能进行详细划分,我们可以得到虚拟化数据中心的参考架构图(图3.8 虚拟化数据中心架构图)。

图-虚拟化数据中心架构图

虚拟化平台:虚拟化数据中心的基础和应用运行平台,实现所有计算资源的池化,能够实现共享、动态、集中监控、集中管理、扩展和高可用的特性。

虚拟化数据中心管理:虚拟化数据中心的管理平台不但可以实现对底层基础架构的管理,同时也可以实现对虚拟化资源的管理,并且可以在统一的管理平台上实现跨地域,多数据中心的管理。

虚拟化数据中心运维:虚拟化数据中心运维平台是确保虚拟化数据中心进行自动化操作的关键平台,也是和未来的有云门户进行接口的平台。

虚拟化数据中心备份:通过虚拟化备份平台的建设,对整个数据中心中的应用、数据实现集中的备份和恢复,确保当出现系统故障、误操作等情况下的应用系统可用性和可恢复。

虚拟化数据中心安全:集中的虚拟化数据中心安全,根据不同用户、不同管理员的使用权限和角色,对其能够访问的系统,能够执行的操作进行详细的定义。

2.1.2虚拟化中心计算平台

2.1.2.1虚拟化平台组成

虚拟化数据中心基础架构平台是面向业务系统以虚拟化技术为核心的一体化架构平台。它主要包含:

统一计算资源层:无状态的计算资源节点,各个计算节点能够透明的添加,调配,更改或删除,并且不影响应用系统的正常运行;单个计算节点应具备更好的虚拟化技术支持能力,优化的CPUMEM配比,充分保证虚拟技术对物理资源的充分利用;多协议支持能力,要对FCiSCSINFS协议均具备良好的拨接端口和支持能力;精简的连接架构,网络交换架构要控制在二层之内,做到一次布线的多协议,多链路支持能力;图形化的管理界面,能实施动态监控和管理各个模块单元;开放的体系架构,能够连接第三方的统一网络和统一存储及虚拟化资源层。

统一网络资源层:与虚拟交换机环境一体化的网络交换环境,能实现虚拟机提供的平滑漂移;端到端的网络QoS保障,能动态调节虚拟机的网络负载;可支持跨地域的二层网络交换架构,同步状态下能支持100KM的同城数据中心间实现一体化资源池体系;能与现有的网络结构充分融合,应由业界领导的网络厂商的核心产品构成,充分保障兼容性和用户投资。

统一存储资源层:多协议支持能力,要同时具备FCiSCSINFS的稳定支持能力;动态的I/O资源调整能力,通过分层存储(企业级闪存磁盘,光纤通道磁盘和SATA磁盘)自动化的调度其上的虚拟机所处的位置,使虚拟机在存储资源层具备透明的I/O随需调整能力;存储级的虚拟环境快照和克隆能力,要能支持虚拟机环境的快照和克隆技术,对虚拟化环境提供高效的保障环境;针对虚拟化环境的存储消重技术,充分利用虚拟化环境下大量数据重复的特点进行消重支持,更高效的利用存储资源;与虚拟资源层紧密结合的复制和灾备技术,从数据层充分保障虚拟化环境的备份,复制和灾备体系的稳定和高效实现。

虚拟化资源层:稳定可靠的虚拟化操作系统,具备安全高效的内核,充分保障虚拟化操作系统层的稳定可靠运行;极小的性能消耗,最大限度的把物理资源有效的提供给虚拟机进行使用;个体封装,各个虚拟机之间独立运行,互不影响;高可用的支持支持能力,保障虚拟化的业务应用系统可以按需实现容错,漂移,冷备等不同层次的高可用能力;开放性的支持能力,对统一计算平台、统一网络平台和统一存储平台的第三方环境具备良好的兼容性和支持能力,并得到充分的测试认证。

在各个统一资源层的基础上通过开放的API接口,构建一体化的监控部署工具进行统一管理,其目标就是构建一套有机结合在一起的,可以快速灵活部署和调用的虚拟化数据中心基础架构体系。

word/media/image6.gif

图-虚拟化数据中心基础架构平台组成图

2.1.2.2 虚拟化平台功能特性

虚拟化数据中心基础架构平台要求整个平台能够端到端的灵活调整资源部署,能够按照业务部署的要求快速的添加和调用资源部署;在这个平台上运行的应用业务系统能够实时调节计算、网络和存储资源配置,而且对应用用户完全透明没有影响;因此该平台应该具备以下功能特点:

为应用业务系统提供可快速部署、调配的资源池体系,满足虚拟机的部署和资源灵活调整需求 ;

与虚拟化层技术紧密结合在一起,使虚拟化层的管理工具可以直接快速的调用底层资源 ;

一体化的监控和部署环境,能够对统一计算平台、统一网络平台和统一存储存储的各个层资源进行一体化的监控和快速部署及调整 ;

统一计算平台的各个计算单元应具备无状态的属性特点,满足透明的实时变更、添加和调整计算资源的需要;

统一网络平台应具备多协议的稳定支持能力,具备面向虚拟化层的QoS保障能力,具备一致的网络性能和安全规则部署能力;

统一存储平台应具备稳定的多协议支持能力,具备面向虚拟化层的I/O实时调节能力,具备完整的与虚拟化技术紧密结合的存储备份、复制与恢复技术能力 ;

经过严格测试认证和预先集成的体系架构,有效避免各个层面的潜在风险,并最大限度的发挥虚拟化平台的优势 ;

在空间、能耗和维护成本上应比传统的物理架构具备明显的优势 ;

能够提供面向SLA的服务级别保障,使用户的整个IT资源平滑的向ITaaS架构过渡 ;

提供统一的支持服务体系,帮助用户快速准确的解决问题 。

2.1.2.3 虚拟化平台扩展性

虚拟化数据中心基础架构平台要能够满足用户业务应用系统实施变更和快速增长的需求,因此要求整个平台能够具有非常灵活和高效的扩展能力 :

模块化的快速部署能力,可一体化的添加计算、网络和存储资源,并与原有虚拟化基础平台能够形成统一的资源体系 ;

按需独立横向扩展计算资源、网络资源或存储资源的能力,满足各个层面资源扩展的需求;

具备跨地域的资源融合能力,可以将位于不同地理位置的虚拟化基础架构平台融合为统一的虚拟资源池架构,满足用户构建双活或多活数据中心及未来云架构数据中心的需求。

2.1.2.4 虚拟化平台性能

虚拟化数据中心基础架构平台必须能够充分发挥虚拟化技术的性能,支持业界领先的虚拟化技术软件所需要的各种功能,并能够在最大程度上发挥虚拟化技术的优势。在稳定可靠的前提条件下,整个统一虚拟化基础架构平台应具备足够的灵活性以满足用户业务应用系统对不同规模和性能的要求。例如:应具备小型、中型、大型的平台建设规模 ,它们之间的性能和容量不同,但又在一定的范围内灵活可调,同时具备统一在一起融合管理的能力。

按照目前用户的普遍规律来划分:

小型规模应满足50 个左右的业务应用系统或500个左右的虚拟桌面环境;

中型规模应满足200个左右的业务应用系统或1000个左右的虚拟桌面环境;

大型规模应满足800个左右的业务应用系统或3000个左右的虚拟桌面环境。

2.1.2.5 与现有环境融合

虚拟化数据中心基础架构平台是用户今后部署和运维业务应用系统的主要资源平台,同时它又是全面面向虚拟化技术紧密集成的资源平台,所以它需要完善的支持好虚拟化技术所需的各种支撑,而虚拟化资源层则需要尽量丰富的支持用户现有的应用部署环境。以用户现有环境为例,Intel平台上的Windows环境和Linux环境的支持是十分必要的。另外还应该提供有效的工具和服务能够为用户提供所需的从物理环境到虚拟化环境下的应用迁移服务。

在用户今后的使用过程中还应提供相应的规划 、部署 、运维 等方面的最佳实践建议。

2.1.2.6 虚拟化平台高可用

虚拟化数据中心基础架构平台至少需要具备“5个9”或更高的高可用性,还应该能够用户需求扩展相应的保护和安全手段,满足用户迈向“永不停顿”的云计算数据中心的需求。至少应该从以下层面综合考虑:

产品层次的高可用性:冗余的产品模块和结构,在发生局部硬件故障时不影响产品正常使用或可以实时更换修复;

架构层次的高可用性:计算,网络和存储控制节点都是冗余的体系架构,充分保障整个系统的高可用性;

管理层次的高可用性:管理控制节点和路径均有冗余保障,充分实现管理架构的高可用性;

提供不同层级的应用和数据保护能力:根据用户的SLA模型,结合备份恢复,快照,克隆,归档,压缩,消重,同步异步复制,灾备技术,多路径负载均衡技术,等等方面的技术保障,来实现不同级别,比如:小时级别、分钟级别或秒级别的高可用业务保护能力;

提供不同层级的安全访问控制能力:能实现针对不同需求用户的功能分层管理,在虚拟化的动态数据中心中也要实时保障整个系统认证的稳定可靠,保障权限分配系统的安全和高效运行,实时监控异常状态,并能够进行处理和恢复。

2.1.3 虚拟化数据中心管理

2.1.3.1 虚拟化数据中心管理挑战

随着虚拟化技术在数据中心的实现,虚拟化数据中心到私有云以及公有云的过程中,传统的IT管理方式已经被彻底改变。虚拟化转变了 IT 基础架构的管理方式。服务器成了动态软件文件,网络成为了可以灵活调度的资源,存储由单一的阵列和磁盘变成了透明共享的存储空间。IT管理者可按需使用基础架构资源池以更高的速度和效率加以配置、管理和保护。企业可以按最高的可用性和服务级别无缝交付应用程序,而没有传统 IT 解决方案的高昂成本和复杂性。

图-虚拟化数据中心管理挑战:

但是伴随着数据中心虚拟化程度的深入,用户将会面临越来越多的管理瓶颈(如图-虚拟化数据中心管理挑战):

IT架构复杂度提高

随着IT系统虚拟化程度越来越高,面临的虚拟化管理也越来越复杂 ;基于虚拟化平台的企业内部应用系统越来越多 ,使得虚拟数据平台的压力变的多样化,同时多样的应用对虚拟化平台资源的交付要求也有差异;业务系统的发展使得对分布式虚拟数据中心的需求也提上了日程 ;用户将要面对的是私有云和公有云的转变 ,如何保证目前虚拟化数据中心可以平滑的过渡到未来发展的私有云到公有云,这种转变要求目前的架构具有可靠地弹性管理。

IT管理成本增加的趋势

毫无疑问,虚拟化将用户从传统的管理方式过渡到虚拟化之后,面对大量的虚拟资源,虚拟服务器,虚拟存储,要求数据中心管理成本必须得到控制,不能够随着虚拟机数量的增多以及其他要控制的虚拟对象的增多而无谓的增加管理人员的开支,管理软件的购买等成本消耗上。 虚拟化管理的TCO 要达到更高的水平,就必须依赖于虚拟化架构上的管理手段,而不能依赖于将虚拟化平台甚至私有云架构放到第三方昂贵的管理软件产品中去。

IT管理效率

业务应用系统对IT服务的交付要求越来越高 ,同时虚拟化数据中心的业务流程亟待完善,面对提高IT管理效率压力的同时,还要保障IT管理服务的级别。

2.1.3.2 虚拟化数据中心管理参考架构

图-虚拟化数据中心管理参考架构

虚拟化数据中心的管理系统建立包含多个方面的内容,从上图(图-虚拟化数据中心管理参考架构)可以看出,虚拟化数据中心管理虚拟化数据中心面对的管理主要关注以上五个部分的内容:

虚拟化数据中心资源池管理:针对虚拟化数据中心当中基础架构的管理,能够实现对服务器、网络、存储的统一和融合管理,能够实现对异构资源的管理。

虚拟化资源管理:在虚拟化数据中心当中,所有的计算资源都是虚拟化的方式体现,以逻辑单元的模式对应用提供服务,虚拟化数据中心管理系统应当实现对虚拟化资源的集中管理,包括自动发现,统一监控,自动化配置,资源调配,虚拟服务器部署等。

高可用性管理:关键性业务在虚拟化平台上的运行必须要有高可用平台的保证,虚拟化中心管理平台需要能够为应用提供数据迁移、复制和容灾等方面的管理功能。

服务级别管理:虚拟化数据中心的资源将通过标准化服务的模式提供,管理系统应当能够提供流程自动化管理,ITIL管理和CMDB联合。

丰富的API接口:虚拟化数据中心管理平台需要具有丰富的API接口,为用户提供标准化的、开放的用户业务系统开发接口,实现与用户现有系统的对接和扩展。

2.1.3.3 资源池管理

对于虚拟化数据中心的基础部分,是由基础平台的计算资源,网络资源和存储资源共同组成的,对于不同的资源,管理员必须实现统一的资源管理才能够对各种资源做更好的调度和分配。

统一的基础架构管理平台应当提供了对于资源池的统一管理和资源的自动化灵活配置等多种有效的虚拟数据中心管理功能。包括:

统一的对各组成元素的管理,减少多个服务器,网络和存储配置的管理工具

从单个管理点管理单个的虚拟化中心计算平台和跨地域的计算平台,实现变更的合规性管理

整合的控制面板

基于策略的配置和更改管理

深度可见性,可以从虚拟层到物理层的深度定位

可以对整个系统的硬件和应用进行监控

可与第三方企业管理解决方案集成

2.1.3.4 虚拟化资源管理

通过采用虚拟化资源的管理平台,IT管理员可大幅改进对虚拟环境的控制:

提供集中的虚拟资源控制和实现虚拟基础架构各个级别的可视性。

通过前瞻性的资源管理更好的发挥每个物理资源的性能。

能够实现资源清单搜索,使得包括虚拟机、主机、数据存储区和网络在内的整个虚拟化资源在虚拟化中心中的任何位置唾手可得。

存储映射和报告可传达有关存储使用、连接和配置的信息。可定制的拓扑视图为您提供存储基础架构的可视性,并可帮助进行存储问题的诊断和故障排除。

性能图表通过可实时或按指定时间间隔查看的更详细统计数据和图表,监视虚拟机、资源池和服务器的利用率及可用性。

主机配置文件标准化并简化您配置和管理虚拟主机配置的方式。捕获经过验证的已知配置(包括网络、存储和安全设置)的蓝图,并将其应用于多台主机以简化设置。主机配置文件策略还可以监视遵从性。

能效完全支持资源动态调度,可持续监视同一个个资源群集中的利用率,并在群集只需较少资源时将主机置于备用状态以减少能耗。

提供一个功能强大的编排引擎,使您可以使用即时可用的工作流来自动执行多个任务,或使用轻松的拖放式界面来组装工作流,从而简化管理。

具有资源整合指导功能,可指导您逐步完成整合过程,包括自动发现多台服务器、执行性能分析、转换,以及智能化地在适当主机上放置虚拟机。

虚拟资源管理可以实现大规模管理,随着用户虚拟化的不断深入,和应用的不断增多,单台管理服务器需要管理成百上千台服务器,而且虚拟资源管理服务器应当可以通过链接模式进行扩展,可以跨越多个数据中心进行管理,并管理更多的虚拟资源。

虚拟资源管理服务器的链接模式应当利用在整个基础架构中复制的角色、权限和许可证,实现可扩展的体系结构和跨多个虚拟化数据中心实例的可视性,使您可以同时登录、查看和搜索所有虚拟化数据中心的资源清单。

虚拟机的资源管理。将处理器和内存资源分配给运行于同一物理服务器上的多个虚拟机。建立针对 CPU、内存、磁盘和网络带宽的最小、最大和按比例的资源份额。在虚拟机运行的同时修改分配。使应用程序能够动态获得更多资源以适应峰值性能需要。

动态资源分配。实现跨资源池的持续监视利用率,并根据业务需要和不断变化的优先事务的预定义规则,在多个虚拟机之间智能地分配可用资源。

高能效的资源优化。持续地监视整个虚拟资源池群集中的资源需求和能耗。当群集只需较少的资源时,它将整合工作负载并将主机置于备用模式以减少能耗。当工作负载的资源需求增加时,将已关闭的主机恢复在线,以确保满足服务级别要求。

与标准化目录管理系统集成。实现基于现有的身份验证机制实现访问控制。

定制角色和权限。利用用户定义的角色增强安全性和灵活性。拥有适当权限的用户可以创建定制角色,如夜班操作员或备份管理员。通过为用户分配这些定制角色,可限制对由虚拟机、资源池和服务器组成的整个资源库的访问权限。

审核跟踪。保留对重大配置更改和发起这些更改的管理员的记录。导出报告以进行事件跟踪。

2.1.3.5 高可用管理

虚拟化数据中心管理平台的高可用性管理包括对管理服务器本身的高可用管理和对管理资源中的应用高可用。

虚拟化资源高可用管理可扩展数据中心的可用性,虚拟化资源高可用管理能深入了解所有数据中心的服务器组件,并且非常易于配置和部署。

能够自动重启虚拟机。提供一个易于使用、经济高效的故障切换解决方案。

精确的访问控制,利用可配置、分层的组定义和精确的权限来保护环境。

集成硬件监视可在硬件的主要组件(如风扇、主板和电源)发生故障时发出警报,从而提供物理和虚拟服务器运行情况的综合视图,预防和快速解决问题。

警报和通知支持新的实体、指标和事件,如特定于数据存储区及虚拟机的警报。这些警报可触发新的自动化工作流以补救和防范问题。

2.1.3.6服务流程管理

客户业务的快速变化对IT部门提出了更高的要求,如何能快速响应业务推出新的IT系统;如何保证IT系统安全、稳定的运行;如何提高服务效率和服务质量等问题成为目前IT部门主要面临的压力。而服务流程管理和自动化服务可以使用户更好地使用动态资源池中的资源,使管理方更好地管理动态资源,提供服务。

服务流程管理系统应当从两个部分来进行功能建设,一个是面向服务使用用户,另一个是面向服务的管理功能,主要包括以下内容:

面向服务用户:

VDC管理:创建、配置、调整、删除VDC,支持对虚拟设备管理;

资源申请:通过Web界面申请资源环境、时间周期、SLA要求、环境配置等;

计费管理:根据VDC查询得到分配资源的使用情况、计费、结算管理等;

监控管理:查询VDC的运行状态,实施监控资源状态;

用户管理:建立用户、授权管理、密码管理等;

日志管理:运行日志的查询、分析和审计管理等

面向服务管理:

客户管理:多租户管理,服务满意度、服务投诉、SLA/OLA管理;

计费管理:费率、服务包、折扣等定义,结算、收费、提醒等管理;

监控管理:VDC、虚拟设备、物理设备监控;

报表管理:固定报表、动态报表、统计分析、仪表盘等;

平台管理:资产配置管理、资源分配管理、服务交付管理等;

系统日志:系统日志、安全日志、自定义日志管理;

服务流程管理系统的系统架构应该考虑到其核心组件的驱动、扩展和组件扩充能力,同时,整体系统应该有分层设计的特点,具体内容如下:

核心组件能力

驱动管理组件:具有统一驱动知识库管理功能,可支持多厂家虚拟化技术及管理平台接入;(目前完成VmwareApiVizioncore管理平台接入)

采控服务组件:完成服务项运行状态信息采集、实现服务项操作控制功能;

策略控制组件:可设定规则、设定性能指标阈值,触发不同任务及工作流;利用该组件可实现资源池预警、服务项资源动态分配、服务等级保障等

工作流引擎:图形化方式预定义工作流,可实现自动或人工任务单流转。

平台分层设计

资产管理:对物理设备资产信息进行信息手工录入、自动采集,信息变更采集对比提醒;

资源池管理:资源池分类管理、资源池容量及性能管理

服务管理:完成服务目录、服务项定义,服务模版包括配置模版、部署模版、SLA模版

交付管理:对服务用户VDC及其服务项实例进行管理,完成基础架构云服务交付

通过服务流程管理系统,业务部门和用户可以方便的进行计算资源的申请、交付、维护和运行、回收及再利用(如图-资源申请流程)。

图-资源服务流程

资源的申请

确保业务部门和用户可以方便地申请IT服务和资源,通过将服务目录与资源请求管理流程集成在一起来实现,服务目录作为一个工具在创建、管理、服务定价和与IT工作整合方面变得越来越重要。应该让业务部门和用户可以基于他们的业务需求和预算情况从服务目录中选择合适的服务和对应的成本。对于每个产品和服务,保证恰当的服务级别,审批流程以及相关的成本。通过从一开始就为客户设定好期望可以减少IT与业务部门之间的不一致,这些期望包括实现请求的时间,所要执行和审批的流程以及实现请求所需的费用。

同业务部门和用户约定从服务目录中选择服务,而这些服务是IT定义和维护的标准的产品和服务的集合。这样作也可以保证IT必须选择标准化的产品和服务,以便通过减少因为购买非标准的,没有经过测试或审批的产品所带来的风险。

允许业务部门和用户很容易的找到、请求他们所需要的服务和跟踪服务的处理状况,这样作可以提高请求实现处理情况的透明度(跟踪从提交到完成的请求状态,也跟踪资源的使用状况,相关的成本和基于服务级别协议交付的治理)。为了提高客户的满意度,IT可以提供服务报表,发布对业务经理和用户来说有意义的指标,来展示服务的执行情况(如完成一个服务请求所用的平均时间),表明IT部门如何完成所承诺的服务内容(如满足承诺的服务请求完成时间的能力)。

资源的交付

在完成资源申请后,IT部门将根据确定的服务能力和要求转换为虚拟化架构可提供的资源配置,并通过自动化和程序化的管理快速的为客户提供资源,并对交付的虚拟化资源进行追踪和记录。根据当前的IT运维模式,建议以以下三种方式进行虚拟化资源的交付:

对同当前运行虚拟机有相同配置要求和业务应用要求的,可使用Clone的方式复制虚机,客户化后交付;

对配置和能力要求有相应模板对应的虚机,可从模板转换为虚机进行交付。模板的定义应符合能力及安全基线的要求,并随时根据相关管理要求进行更新。

对不符合以上两种情况的,可使用自动定制化的方式创建虚拟机,并进行客户化配置和按照要求进行标准化配置,如安全加固要求、防病毒要求,认证授权配置及审计配置等,然后进行交付。

资源的运行及维护

用户可通过IT运维管理流程和机制来支撑当前的IT运行和维护,主要包括:

事件管理

问题管理

变更管理

配置管理

能力管理

所交付虚拟化资源的运行维护可集成在当前统一的IT运维管理中统一进行管理,考虑到虚拟化架构的特殊性,可在以上各管理流程中增加虚拟化架构的各服务属性。

资源的回收及利用

资源的回收和利用主要同业务应用的运行周期相对应,对下线业务应用和不再使用的业务应用停止虚拟机,释放相应的CPU、内存、网络及存储资源,同时根据业务和合规性要求对退网的虚拟机文件进行归档和保留。

虚拟化资源回收和利用的审批可在流程管理系统中进行,资源回收和利用的工作流可通过工作流系统进行管理。

2.1.3.7 管理平台扩展

一个有效的成功的虚拟化数据中心管理平台必须同时是一个开放的,具有完善接口的平台。每个企业面临的应用不同,如何将这些业务系统和虚拟化平台的管理联系起来,是衡量一个虚拟化数据中心管理平台的重要部分。

能与系统管理产品 Web 服务 API 的集成可保护您的投资,让您可以自由选择如何管理您的环境。

是可扩展的管理平台,且拥有庞大的合作伙伴体系,对操作系统和应用程序的兼容性很强。

基于这种开放性,使得虚拟化数据中心的管理可以和企业现有管理平台很好的结合起来。

2.1.4 虚拟化数据中心备份

2.1.4.1虚拟化数据中心备份挑战

根据IDC的统计表明,在虚拟化环境下,备份系统遇到了新的挑战,在有限的资源中,在更少的时间内,如何备份大量的重复的数据。

与传统的备份环境不同,虚拟化环境下的计算资源,不再是有大量的空闲时间,平均资源利用率不到30%,而是由于单个物理服务器上运行大量的虚拟环境,资源利用率达到80%甚至更高。传统备份软件消耗大量的处理器,这种备份机制在传统的物理服务器使用模式下可以应用,但是在虚拟化环境下,将会由于占用的处理器资源过大而带来问题,影响应用的性能和服务级别。

同时,由于虚拟化环境下,备份的内容会包括虚拟化系统的系统文件等,在每次对虚拟文件镜像进行备份时,会存在大量的冗余数据,如果不进行重复数据的删除,大量的系统文件占用的空间将被浪费,同时,在备份过程中,由于占用大量的带宽,也会对应用的性能带来影响。

所以,我们需要一种新的备份机制,能够占用更少的处理器资源,同时能够利用更少的空间去存储更大的数据。

重复数据消除工作是一种特殊的数据压缩技术,能够消除掉在备份过程中冗余的部分,或者是重复的部分。在消重的过程中,重复数据会被删除,只保留唯一的一份数据存储下来,重复数据的备份仅仅是增加一个引用指针。消重能够大大降低备份过程中所需要的存储空间。

2.1.4.2 虚拟化数据中心备份参考架构

在虚拟化数据中心中,备份系统的参考架构如下图所示(图-备份参考架构)

图-备份参考架构

参考架构由三层组成:

1. 管理层

集中的管理服务器来进行整个备份和恢复系统的管理,包括配置、策略、汇报,介质管理,客户备份目录管理,恢复目录索引管理等。

2. 介质层

备份介质可以使磁盘、虚拟带库(利用磁盘模拟磁带)和磁带,是用来存储备份数据,用来进行恢复使用。

3. 客户端

通常包括虚拟服务器、应用平台(如Sql Server,Oracle,.Net Web服务器)等

客户端是备份数据的源端,其产生的数据将交由备份系统备份到备份介质上,用来进行应用回滚和灾难恢复。

在并行数据中心中,参考架构如下图所示(图-并行数据中心备份架构)

图-并行数据中心备份架构

2.1.4.3 虚拟化数据中心备份设计原则

1. 统一的备份管理架构,提供简便的操作管理界面;并提供强大的备份报表功能,制定和不断完善备份策略。

2. 确定虚拟环境的备份策略,采用不同的备份技术,实现多样化的备份方式,以提供多种数据恢复策略,从而增强备份系统的可用性。

3. 设计快速有效的备份数据恢复机制,实现备份系统在业务系统允许的异常时间内进行数据完整无丢失的恢复。

4. 基于disk 为主的备份介质,结合数据重复删除技术及数据传输技术在最短的时间里,安全地把数据保存在异地。

5. 制定完善的备份数据保存策略,实现备份数据的异地存放,从而达到系统的容灾目的。

6. 支持虚拟环境的统一应用接口(APIs)

2.1.5 虚拟化数据中心运维

随着虚拟化架构的建立,系统架构中不但存在物理设备,还将存在大量的虚拟设备,如虚拟机、虚拟磁盘、虚拟CPU等。虚拟化动态架构的易扩展和变化的特性可能造成虚拟机大量蔓延,出现违反公司法规的操作,对日常的运维管理造成巨大挑战。虚拟化运行维护主要从运行监控和IT运维流程的角度确定保证交付和支持有效的虚拟化资源的正常运行的技术能力。因此,为了简化运维管理工作,降低运维管理的复杂性,提高运维管理效率和运维管理质量,必须要建立对虚拟化环境的运维管理系统,建立集中管理系统,实现设备性能监控、故障告警、配置管理和软件管理等功能,简化运维管理工作、提高运维管理效率的自动化手段。

2.1.5.1 运维组织和角色定义

a) 虚拟化组织架构

虚拟化运维组织基本可分为三级(如图-运维组织),流程管理系统人员为0线,负责基础架构的监控和初步的事件判断和处理;应用管理员、数据库管理员、系统管理员、网络管理员、存储管理员、备份管理员、虚拟化管理员等为1线人员,负责处理0线人员升级的请求和问题处理;IT运维团队为2线人员,负责处理无法解决的故障问题。

图-运维组织

b) IT运维团队人员分配

其中IT运维团队的人员根据其角色和职能的不同,又可以分为业务部门,IT管理层,IT运维经理和系统工程师,其具体的工作内容如下表所示:

2.1.5.2 虚拟化运维内容:

IT运维通过标准化的,策略化的,自动化的运维体系建立,对虚拟化数据中心的各种IT操作进行标准化定义,降低IT操作的风险,提升整体的IT维护效率,并确保IT服务的质量,具体的运维系统内容如图(图-虚拟化运维内容)所示:

图-虚拟化运维内容

a) 容量管理

为更好支撑系统运行维护,需要系统运行现状,评估虚拟化基础资源的支撑能力,分析虚拟化资源的趋势特点,对将来需要及资源的预期进行测算,制定容量规划,使得虚拟化资源可以在有效范围运行,提升运维的控制能力和准确性,使系统建设规划可以按需分配。

虚拟化容量管理涉及如下关键因素:

性能分析

资源趋势分析

资源的分配及利用率分析

虚拟化能力管理可分为以下几个层面:

整个虚拟化数据中心的容量

动态资源组内部的容量

虚拟化服务器的容量

虚拟机的容量

虚拟化容量管理的服务要求

虚拟化能力管理的服务参照服务目录如下:

性能分析:定义性能分析的内容及周期

资源分配及利用率分析:定义资源分配和分配资源使用率分析的内容及周期

能力趋势分析: 定义性能和资源使用率趋势分析的内容和周期

容量管理流程

通过评估后,建立容量管理流程并交付容量管理规划流程图。

容量指标定义

协助客户有效掌握虚拟化资源运行支撑能力,设定容量指标用于衡量虚拟化架构的支持能力,以进一步持续优化容量管理。 对象包含如下:

虚拟数据中心

动态资源组

虚拟化服务器

虚拟机

容量管理报告

为有效的监控虚拟化资源的使用和利用率,需定期的生成各种虚拟化架构的能力报告,以便掌握虚拟化架构的当前运行能力和使用效率,并对资源的使用进行趋势分析,掌握可扩展的能力,并按需求提供虚拟化资源。协助客户定义和交付虚拟化容量管理报告,主要内容如下所示:

性能使用报告

资源分配及利用率分析报告

资源使用趋势分析报告

b) 配置管理

虚拟化配置管理通过发现,控制,维护和确认虚拟化环境的所有配置项(CI)及其关系构建虚拟化架构的配置管理数据库,并根据变更需求进行更新,保证并统一集成到当前的配置管理流程中。虚拟化增加如下配置管理属性:

虚拟环境的特殊配置属性

虚拟资产的配置除具有原物理环境的资产属性外,还需对虚拟机增加如下属性:

虚拟机的服务起始时间

虚拟机申请的服务期

虚拟机的宿主机

虚拟化配置服务管理的服务要求

虚拟化配置管理的服务要求参照服务目录的定义

CMDB建立: 收集虚拟环境的CI信息建立配置管理数据库

配置变更:当虚拟化环境发生变更后,更新配置管理数据库中相关配置项的时限

c) 变更管理

虚拟化变更管理以标准的方式和过程快速有效的处理虚拟化环境的变更请求,统一集成到当前的变更管理流程中,协助客户增加/修改,定义管理属性。

虚拟化变更类型

虚拟化变更的类型主要包括:

虚拟化架构的物理变更

虚拟机状态变更

虚拟机配置和位置变更

虚拟资产的变更

补丁升级管理

定义虚拟化变更流程

设定变更的请求、批准、实施的人员角色定义

变更请求发起

变更请求验证

变更请求确认

变更请求实施

集成配置管理更新

虚拟化变更的服务要求(OLA)

虚拟化变更管理的服务要求参照服务目录的定义

平台供应交付: 定义确定业务需求后和经过审批后,交付满足业务要求的虚拟机及相关资源的时限

系统配置变更:定义根据业务要求和经审批后,对现有虚拟化系统更改配置并交付满足业务要求的虚拟机及相关资源的时限

资源释放: 定义根据业务要求和经审批后,对现有虚拟化系统退网处理并释放相关资源的时限

d) 事件管理

虚拟化事件管理跟踪所有虚拟化环境故障事件,维护相应记录,及时处理等内容,统一集成到当前的事件管理流程中。虚拟化增加事件管理属性如下:

虚拟化事件来源

虚拟化事件来源主要包括:

安装在虚拟机和虚拟化服务器上的监控软件

vCenter发出的警告(Alarm)及事件(Event

虚拟化硬件平台告警和时间

虚拟化事件类别

在事件管理中增加虚拟化事件类别,子类可定义为:

DataCenter

Cluster

虚拟化服务器

虚拟机

虚拟网络

虚拟存储

虚拟化事件分级与处理流程

目前可提供严重错误、警告和一般信息三级虚拟化事件告警,虚拟化事件分级可按同当前的分级标准映射,统一进行事件管理。

建立虚拟化事件处理流程:

定义事件处理角色和职责

虚拟化事件收集与分类

虚拟化事件升级

虚拟化事件解决

输入问题管理数据库

虚拟化事件管理的服务要求(OLA)

虚拟化事件管理服务要求定义如下内容:

服务时间:定义接受和处理故障的工作时间

响应时间: 定义收到故障事件后进行响应的时间要求

故障处理时限: 定义故障发生后必须处理并解决的时间,如不能解决则升级处理

问题转换: 定义如果时间处理超过时限,是否转换成问题

故障/事件报告: 定义故障统计报告的周期及内容

e) 问题管理

虚拟化问题管理通过故障事件、问题和错误的收集和记录,预防已知虚拟化问题出现,减少对业务影响,并统一集成到当前的问题管理流程中,在当前的问题管理流程中增加虚拟化问题分类,知识库建立,其他属性可集成到当前问题管理流程中。

设计问题管理流程:

定义问题管理人员角色和职责

识别故障事件、问题和错误

问题根源分析

问题影响分析

输入知识数据库

虚拟化问题管理的服务参照服务目录如下:

服务时间: 定义接受和处理问题的工作时间

响应时间:定义收到问题请求后进行响应的时间要求

问题处理时限:定义问题产生后必须处理并解决的时间,如不能解决则升级处理

问题根源分析及处理报告:定义问题处理后的根源分析和问题处理过程方法以及和保留总结方式

问题报告:定义问题统计报告的周期及内容

f) 服务等级管理

虚拟化服务等级管理持续监控虚拟化平台运行性能与客户体验,确保虚拟应用持续稳定的满足业务需求,提升虚拟化服务等级质量,集成到当前的服务等级管理流程中,增加虚拟化服务等级管理属性。

建立虚拟化服务器等级管理体系,内容包括:

建立虚拟化服务目录

确认服务等级参数与目标,设立KPI指标

与容量管理和财务管理集成

监控系统性能和可用性水平

确认并解决限制服务等级的瓶颈

输出服务等级报告

g) 资源成本控制

虚拟化财务管理通过统计虚拟化环境的资源使用,建立财务成本模型,为虚拟化资源的合理使用和未来财务规划提供决策支持。

建立虚拟化财务管理流程,内容包括:

收集成本的类型和要素

定义成本单元

监控虚拟化资源使用状况

构建成本模型

TCO/ROI报告

收费结算

h) 生命周期管理

为了保证向用户交付满足业务服务要求的高性价比的虚拟化资源,保证所交付虚拟化资源的持续稳定的提供服务,保证根据业务的生命周期合理的创建、分配、交付、回收和重新利用虚拟化资源,在满足业务服务要求的基础上,获得最大的投资回报比,将整个虚拟化资源的生命周期分为虚拟化资源申请、虚拟化资源交付、虚拟化资源的运行维护及虚拟化资源的回收利用四个阶段。

虚拟化资源(虚拟机)生命周期管理建立标准的虚拟化资源的申请,交付和回收流程,确保虚拟化资源的有效利用,防止虚拟机蔓延(sprawl),减少安全风险。

虚拟化资源的服务交付和支持过程图

虚拟化资源生命周期管理流程建立:

虚拟化资源生命周期管理流程内容包括:

定义人员角色和职责:申请者(用户),批准者(IT管理者),实施者(虚拟化管理员)

建立虚拟化资源服务目录

资源申请流程:申请,审核确认,批复,资源交付

资源的运行维护,状态监控

资源回收(过期,业务下线):下线通知,审核确认,备份归档,释放资源

配置,容量,变更管理更新

虚拟机生命周期属性参考

虚拟机请求日期,虚拟机创建日期,虚拟机过期日期,虚拟机状态(请求,建立,活动,删除等),虚拟机拥有者等

虚拟化资源的服务交付和流程图(图-虚拟化资源服务交付流程图):

图-虚拟化资源服务交付流程图

虚拟化资源生命周期管理KPI

服务时间:定义接受和处理请求的工作时间

响应时间:定义收到请求后进行响应的时间

2.1.6 虚拟化数据中心安全

虚拟化技术带来的好处不言而喻,它可以使企业对硬件资源进行有效地整合,并且可以在单一的硬件上运行多个虚拟机,不同操作系统,不同应用的虚拟机都可以运行在同一台物理机上,因此优化了硬件的利用率。虚拟化技术现在正在大规模广泛的被应用到企业当中,因此,企业不能局限于传统的安全防护手段,而是要在虚拟化层进行安全控制,才能给企业IT带来更高的安全性。

但是目前国内的很多用户在实施自己的虚拟化数据中心的时候,过多的考虑了虚拟化技术的实现,而对于构建一个安全可靠地数据中心并没有什么考虑,甚至不知道怎么去实现虚拟化数据中心的安全性。

2.1.6.1 虚拟化数据中心安全设计原则

当用户实施虚拟化技术的时候,企业必须确保他们能够持续的保障安全的虚拟化环境来满足他们应用和数据的可靠性,安全性。保护管理控制安全总是隐含在适用于虚拟和物理环境的基本安全原则中。因此,保证虚拟化管理的安全始于保证物理环境的安全并将这些安全原则扩展到虚拟化中。

限制可能会导致未经授权的高级权限访问的风险。

安装防恶意软件、防火墙和主机入侵防护系统等常见安全工具。

禁用不必要或多余的功能。

为修补程序、更改、资产和配置管理等服务管理流程保留系统资源。

应该将安全配置内建在固定模板中,以确保在部署新系统时能够正确配置。这包括物理主机配置、管理程序的配置和每个客户虚拟机的配置。

网络分段拓展了虚拟化环境的维度,因为每个客户虚拟机都具有各自与虚拟主机外部的物理和逻辑网络拓扑的连接和在主机自身内部的连接。

在大多数情况下,应该隔离客户虚拟机之间的网络通信。VMware vShield Zones 等技术可以限制虚拟机之间可能会带来风险的通信,并将长期建立的网络分段原则扩展到虚拟世界。

与特定物理接口的连接可以进一步确保这种保护性隔离,并降低软件配置风险。

虚拟化管理系统的配置尤其重要,因为这些配置可直接控制功能。例如,VMware vCenter 提供了对 VMware 环境的集中管理,因此必须小心部署。

限制对正在运行 vCenter 的主机的管理访问。vCenter 自身应该运行在一个专门为此目的准备的独立管理帐户下

管理网络和生产网络应该相互隔离,以限制可能造成对管理功能未经授权访问的风险。

如果授权管理访问权限,应该适用最低权限原则。

管理访问权限应该尽可能与个人责任联系在一起。应该限制对根用户等共享管理帐户的访问,同时还应严格限制“su”等工具。

基于角色的访问控制 (RBAC) 提供了一种将管理功能分为多个单独角色的方法,授权用户可以根据需要调用角色。对于 VMware vCenter,它的 Custom Roles 功能提供了一种根据角色定义和分离管理权限的内置方法。

环境监控非常重要,尤其是监控管理访问和操作,包括授权和未经授权的访问与操作。公司应该在计划部署事件管理工具时深入了解虚拟化风险。这包括监控对虚拟机映像存储资源的访问。

在此,基于 RBAC 的角色分离应该有助于确保那些具有管理访问权限的用户不能同时具有篡改管理操作证据的能力。

2.1.6.2 虚拟化数据中心安全架构

图-虚拟化数据中心安全参考架构

在虚拟化数据中心安全设计当中,由于相比于传统的安全管理环境增加了虚拟化层,并且由于虚拟化漂移技术的出现,和动态资源变更的需求特点,必须要考虑更多的原则,来确保整体的虚拟化数据中心安全。

硬件和虚拟化平台的整合监控:对基础架构的安全监控不仅仅需要针对物理设备,且需要对虚拟化资源进行监控,如虚拟化系统文件,虚拟化网络设备,虚拟化计算资源池等,做到确保计算平台环境的安全。

从虚拟架构层开始:在虚拟化环境当中,存在虚拟化宿主服务器,用户可能采用多种虚拟化技术来进行虚拟化的实现,安全监控应当能够深入到虚拟化架构中,对虚拟化技术产品进行监控,如虚拟化环境下的攻击可能并不发生在从某一物理端口到另一端口,而是在虚拟化服务平台上,同一台物理服务器内部的两个虚拟机之间。

逻辑化安全策略:在虚拟化环境中,虚拟化服务器,虚拟化网络端口都可能随着资源的动态变化进行资源池内的漂移,安全策略不能绑定或固定在某一个物理的资源上,必须能够跟随虚拟资源进行动态变化。

统一汇报和深度挖掘:在虚拟化环境中,资源的复杂度相比物理环境下层次更多,互相之间的联系也更加复杂,且动态变化,虚拟化环境下的安全管理系统应当能够从众多联系之中,众多安全事件的联系之中,给出联合的汇报,并可以对具体的事件进行细化分析,深度挖掘,帮助管理员迅速找到安全问题。

2.1.6.3 虚拟化数据中心安全组成

安全解决方案包括信息安全领域通用的安全措施,同时针对虚拟化的引入,应当具有特别针对虚拟化提出了相应的解决手段,主要包括五部分内容:

硬件平台加固

对虚拟化总线和管理层进行加固,同时遵循虚拟化技术厂家,互联网安全中心(CIS)和信息系统防御组织(DISA)的标准。

虚拟化增加了新的总线Hypervisor层(也可以被看做是虚拟机管理器层),在这一层,总线层对虚拟资源进行分配和调度等工作;同时虚拟化架构还包括虚拟网络和虚拟交换机。所有的这些组件,在传统的数据中心都是由物理机构成的。虚拟化技术同时还引入了新的管理层,负责对虚拟架构的管理。所以为了减少未授权访问的风险,Hypervisor层和管理层必须被“加固”。

系统加固帮助减少了系统的安全脆弱性,通过一系列的措施,例如为虚拟架构平台配置安全的设置,应用最新的补丁包。

虚拟化服务器对于它的虚拟化架构安全提供了一系列的加固方法,自动化的工具大大的降低了管理工作的负担。可以帮助每个系统确保配置成符合行业标准的系统,并且可以定制化配置特性,同时提供了系统变更的监控和管理。

配置和变更管理

对于虚拟化系统的配置和变更管理,对于保证IT系统的准确性和灵活性有重要的作用。

虚拟环境的访问控制规则

安全认证用来增强强壮的,多重的管理员身份认证,使得认证用户在访问虚拟化服务器管理终端的时候是可信的。

虚拟环境中的网络安全和网络隔离

充分利用虚拟化软件提供的功能(虚拟交换机,虚拟防火墙)妥善段虚拟机和虚拟网络。

日志审计

为客户提供了虚拟化平台原始的日志审计,并且可以对特定事件进行告警。并且,安全管理平台可以配置成对特定的异常和怀疑的行为进行告警,例如当有新的机器进入到虚拟的数据中心等等。

2.1.7 虚拟化数据中心容灾

2.1.7.1 数据中心容灾的挑战

近年来,很多企业都在面临一大难题,即:如何对他们的基础设施、技术和网络进行灾难备份与恢复,以保证其业务连续性。一个高性价比的容灾解决方案可以帮助企业以一定的IT投入获得最大的产出,同时很好地保护企业的业务免于灾难事件的影响。

在多年以前的主机时代,很多企业选择建设第二数据中心,以此来平衡生产中心的工作量,并对企业的备份能力进行测试和改进,从而满足业务运营的要求并提供灾难恢复保障。

随着时代的变迁,数据中心的工作量不断膨胀,对第二数据中心的管理和协调也越来越困难。为满足由于业务增长而急剧增加的数据量对数据中心的要求,更大、更复杂的数据中心环境开始出现。

除此之外,众多分布式技术平台和安装在各种层面上的系统软件不断出现,而网络技术的发展也使得“随时随地任意互联”成为可能。很多企业开始认识到技术已经越来越难以维护和管理,这不仅增加了维持灾难恢复能力的复杂性,也导致了管理一个完全冗余的第二数据中心无法实现,特别是考虑到对财务、运营和技术方面的整体影响。

为了帮助解决这些问题,IT服务提供商引进了多企业共享灾难恢复设施的概念——建设一个配备各种必需技术的综合基础设施,它可以被虚拟地划分为任意大小并进行相应的配置。这一“热站”概念为客户的个性化需求提供了一个资源池,并且全部都由第三方供应商在异地管理,因此可以远离企业的生产中心。这第一次证明了虚拟化灾难恢复策略的可实现性。

2.1.7.2 数据中心容灾中的虚拟化

从整体上看,虚拟化方法的主要好处是可以通过整合来实现规模效应。大量的服务器、存储和网络集中在一个资源池中管理,并可以按需配置。从灾难恢复的角度来看,当灾难发生时,资源池可以配置更多的容量和网络接入来帮助恢复主要生产环境。虚拟化方法有其独特的吸引力,但还需要考虑很多潜在的因素。

在虚拟化技术下,服务提供商可以在个性化需求的基础上为企业提供约定的资源。为实现对硬件的最大化利用,单一物理设备将被虚拟化为多个分区,从而实现对多个环境进行恢复。同时,这种方式也允许企业只购买其需要的资源。

随着时间的推移,对分布式处理恢复的更大需求越来越明显和必要。企业开始认识到利用软件去装备虚拟机器的技术,这种技术可以在恢复场地的独立硬件设备上进行恢复,同时使得明确和描述恢复过程变得更加容易——只需明确定义备份,以及严格遵守硬件的具体要求即可。假设容量、存储和界面足够充分可以为每个个体提供相等或更多吞吐量,就可以实现大量的虚拟机器恢复到一个物理点上。

2.1.7.3 数据容灾的等级和技术

容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。

根据容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。数据容灾是指建立一个异地的数据系统,该系统是对本地系统关键应用数据实时复制。当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高,即在异地建立一套完整的、与本地数据系统相当的备份应用系统(可以同本地应用系统互为备份,也可与本地应用系统共同工作)。在灾难出现后,远程应用系统迅速接管或承担本地应用系统的业务运行。

设计一个容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等。根据这些因素和不同的应用场合,通常可将容灾备份分为四个等级。

第0级:没有备援中心

这一级容灾备份,实际上没有灾难恢复能力,它只在本地进行数据备份,并且被备份的数据只在本地保存,没有送往异地。

第1级:本地磁带备份,异地保存

在本地将关键数据备份,然后送到异地保存。灾难发生后,按预定数据恢复程序恢复系统和数据。这种方案成本低、易于配置。但当数据量增大时,存在存储介质难管理的问题,并且当灾难发生时存在大量数据难以及时恢复的问题。为了解决此问题,灾难发生时,先恢复关键数据,后恢复非关键数据。

第2级:热备份站点备份

在异地建立一个热备份点,通过网络进行数据备份。也就是通过网络以同步或异步方式,把主站点的数据备份到备份站点,备份站点一般只备份数据,不承担业务。当出现灾难时,备份站点接替主站点的业务,从而维护业务运行的连续性。

第3级:活动备援中心

在相隔较远的地方分别建立两个数据中心,它们都处于工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。这种级别的备份根据实际要求和投入资金的多少,又可分为两种:①两个数据中心之间只限于关键数据的相互备份;②两个数据中心之间互为镜像,即零数据丢失等。零数据丢失是目前要求最高的一种容灾备份方式,它要求不管什么灾难发生,系统都能保证数据的安全。所以,它需要配置复杂的管理软件和专用的硬件设备,需要投资相对而言是最大的,但恢复速度也是最快的。

2.1.7.4 虚拟化灾难恢复策略的要点

在使用虚拟化灾难恢复策略时需要考虑以下要点:

恢复容量

制定虚拟化灾难恢复策略的时候很重要的一点是考虑容量。企业通常会认为恢复时容量利用率不会超过100%.事实上,由于恢复的启动阶段会将系统推向极致,所需容量可能会超过生产容量。此外,恢复过程中有大量的跟进工作,这些工作也需要容量。

配套资源

恢复能力虽然是需要考虑的重点,但其它各种支持生产环境的要素也要考虑在内。这些要素包括处理器资源(存储、设备界面等)、磁盘资源(存储阵列、存储场地网络SANs、磁盘簇等)、外围设备(控制单元、终端、刀片等)、基础设施(外部交换机)和网络连通性(交换机、带宽等)。

资源独立、网络冗余和可测量性

避免灾难恢复失败的一个重点是确保虚拟化资源保持独立,而不需要依赖主生产环境。网络冗余是指不仅为内部用户,还必须为外部用户(如客户、业务伙伴、供应商等)提供接入。可测量性则是处理灾难恢复和生产运营的工作量峰值所必需的。

恢复计划测试

制定虚拟化灾难恢复策略非常重要的一点是考虑对计划的有效测试。测试应在系统层面上全面进行,以有效地了解特定时间段内工作量对虚拟化资源的要求,同时验证业务的完整性和基础设施的有效性。虽然局部的功能测试更容易安排,但却无法保证测试结果的真实性,因此会导致测试的效果大打折扣。

重设工作量计划

不论是真实情况下还是演练过程中,恢复时都应该制定详细的计划来管理整个过程中不断变化的工作量。该计划应该包括一份高层认可的正式时间表,一份恢复时资源分配的备选工作计划,一个对偏移工作量的日常备份流程,以及一份在备用场地复原这些工作的经过测试的恢复计划。

灾难恢复风险控制

在制定虚拟化灾难恢复策略时应考虑到给业务带来的风险。由于虚拟化的固有弱点,距离可能会受到限制,但地理的多样性必须被考虑在内。恢复场所应该与企业已有的风险规避策略所明确的风险承受能力相符,而不应该是满足技术要求的结果。

清晰明确的工作量

在确定构成虚拟池的具体资源之前,很重要的一点是要了解灾难恢复的工作量。明确业务的优先次序和临界点,制定出与处理流程、应用的集成和相互依赖性、以及IT支持模块相关的详细计划,从而保证虚拟化环境的可恢复性。

保持完整性的规则

包括问题、变更、事件、配置和资产管理在内的严格的系统管理规则是实施任何新的虚拟化灾难恢复策略的前提。这对保持恢复环境的完整性是至关重要的,同时对虚拟化资源池的最终操作、监控和维护的有效性也是至关重要的。

业务和IT报告

对灾难恢复项目进程的跟踪、状态的传递和结果的报告是所有灾难恢复项目的重要输出,对于判断IT功能虚拟化所进行的大量投入的效果是非常重要的。

2.1.8 应用部署参考标准

并非所有的应用都可以迁移到虚拟化环境,但是应当尽可能的迁移到虚拟化环境中。

当虚拟环境下进行应用进行部署时会存在两种情况:

从物理环境迁移到虚拟化环境

在虚拟化环境下直接部署新的应用

在虚拟环境下进行应用部署时应当遵循以下的原则:

战略制定

设计应用虚拟化战略,获得最终的架构图,以降低整体部署的复杂度并确保得到最优的价值。

单一目的服务器

使用单一目的的服务器来简化管理,并且能够提供更优的独立性、降低应用冲突和提升资源利用率。

Active-Active

将关键业务应用复杂部署到多个服务器上,并实现共同服务,以分散风险,避免当系统出现故障时的意外业务停止。

备份

维护基于快照的备份,提供更加可靠和稳固的恢复能力。

可迁移

采用基于SAN启动的服务器,确保应用系统可以随时迁移到不同的物理服务器上,避免单一服务器故障点。

安全

维护正确的访问控制列表,采用可靠的认真技术,如果需要的话,应当采用数据加密技术对应用产生的敏感性数据进行加密。

标准化配置

采用标准化的LUN,系统配置等,让部署更加快速。

SWAP空间存放在非虚拟磁盘上。

在虚拟化环境下部署应用不存在标准流程,但是通过上述的原则可以获得部署的指导。

无论应用时从物理服务器上迁移还是全新建立,一定要理解应用的特性并且准备针对性的部署方案。

2.2 云计算服务门户

2.2.1 云服务门户

在新的服务模式中,IT 是业务部门的服务提供者,这样既实现了云计算的优势,又不会牺牲安全性和控制力。用户将体验到前所未有的响应速度和灵活性,而 IT 部门则通过更高程度的整合、任务自动化和简化管理而得以降低成本。

用户只需点击一下按钮即可部署预先配置好或已定制的服务,即可提高业务灵活性。

利用基于策略的用户控制技术和安全技术,可以保持多租户环境的安全性和可控性。

以虚拟数据中心的形式向内部组织高效地提供资源以提高整合率并简化管理,可以降低成本。

以渐进方式实现云计算利用现有投资和开放标准,以保证云之间的互操作性和应用程序可移植性

2.2.1.1 云计算服务

云计算服务门户与底层虚拟化平台协同工作,可以将基础架构作为服务提供给终端用户来使用,即IaaS,包括了对IaaS使用流程的管理,资源生命周期的管理以及所提供的服务内容的管理。

IaaS服务采用自服务的方式,服务的生命周期如下图:

IaaS服务生命周期主要分成以下几个阶段:

服务模板定义

主要指准备云计算环境,将各种合适的资源纳入到云计算资源池,准备标准的计算能力。

创建服务目录

主要指将计算资源标准化,按照服务的方式进行提供。服务目录中的资源可以为服务器、可以为单个的CPU或内存、可以为存储容量、可以为应用软件、可以为特定执行程序,服务目录是一个云计算环境可用计算资源的集中体现。

服务订阅

主要是指云服务消费者申请云计算能力和服务,或者更改某个已有的服务申请。云计算环境越是庞大、其服务管理就越是要求准确和严格。如果出现计划服务的时间无法获得所需的计算资源,就会影响相关服务申请的服务水平,从而给使用部门,即云服务消费者,带来业务上的损失。

服务运行

服务运行首先意味着服务的供应,通过自动化的供应平台使消费者在指定的时间获得云计算资源;其次意味着服务的管理,需要确保云计算服务的质量,包括计算性能和可靠性。这些都是云计算服务中需要关注的部分。

服务终止

当消费者不再需要服务时,服务会被终止,资源会被回收。资源可以重新放回资源池以重新利用。

IaaS的生命周期围绕着业务需求将计算资源得以最大限度地使用,所以IaaS服务部件需要计算资源,也同样需要对其生命周期进行管理的平台。云计算服务管理平台可以涵盖云计算服务提供所需的各个环节,通常包括:

服务申请和流程管理

服务交付和回收,自动供应平台

资源使用统计和计费

服务质量监控

其它的支撑服务,包括安全性等

在整个服务的生命周期包括两类参与角色,终端用户即服务订阅者,云平台运营管理用户,包括云计算平台管理员,服务目录管理者和服务水平管理员。

用户申请资源IaaS时,可以指定需要使用的资源的起始/结束日期。申请资源在需要使用的日期之前,不会占用云计算中心的实际资源。在使用日期之前,云计算服务门户平台会自动在有合适的可用资源的资源池中,自动部署所需要的虚拟服务器(主机名、IP地址、CPU、内存、存储空间)及应用。

云计算基础架构以虚拟数据中心的形式为内/外部组织提供资源。通过以逻辑方式将计算、存储和网络容量组合成虚拟数据中心资源池,可以利用在 计算中心服务的交付和提供环节之间的完全抽象化,更高效地管理资源。

不再是为组织提供孤立的多个物理基础架构,而是基于公用物理基础架构提供相互隔离的虚拟数据中心。通过将这些后端物理资源创建为资源池,硬件利用率和整合率都获得了提高。类似地,底层基础架构也可以聚合到不同的层中,以不同的服务级别和价格向用户提供。

允许用户以自助方式访问自己的虚拟数据中心

云计算服务门户改变了组织使用云计算服务的方式。不必再填写服务台申请单并排队等待,现在,应用程序和业务线所有者可以利用自助门户来访问自己的虚拟数据中心。云计算服务门户使用户能够通过一个 Web 门户和编程接口,将这些资源作为一项目录服务来使用。

IT 团队可以针对同一基础架构定义多种使用模式,从按需提供容量到保留池不等。通过与有助于推动责任管理并实现精确使用量监控的计费软件集成,可以以适当的成本模型提供这些资源。

最终,IT 组织可利用基于现有 LDAP(轻型目录访问协议)目录服务实现的角色访问控制机制,通过权限、配额和租约来保持控制力。因为用户独立于底层基础架构,而且 IT 可以动态添加容量或过量提供资源,所以用户会感到容量取之不尽、用之不竭,因而不再需要储备容量。

2.1.1.1 云应用服务

云计算应提供一套完整的实时服务,在高度分布式的基于云的环境给予应用所需的容量:

全球数据管理 - 分布式数据管理

平台先进的内存处理应可提供数据库不能提供某些功能:针对虚拟化和基于云的应用的实时,弹性可扩展的数据分布和缓存。用户体验快速的响应,IT可获得数据库的所有的可靠性和数据管理能力。

云讯息

云的系统间消息传递对于形成基于云的应用高可用性,可扩展性和便携性,可预测的和保持一致性的吞吐量和延迟,是至关重要的。功能上要支持验证的高级消息队列协议(AMQP)以及其他信息技术,如HTTP,HTTPS,STOMP,XMPP和SMTP支持,vFabric消息易于使用和支持所有主流的操作系统和开发环境支持。

动态负载平衡

需要包括流行的和全面的HTTP服务器,提供优越的性能,可扩展性,安全性和简易性。可预编译,易于部署,调整性能和完整的后台支持。

性能管理

需提供跨物理,虚拟和云基础设施的连续的应用性能监测,提供细致的技术指标,支持广泛的互联网技术,可得到的深刻而完整的能见度,使可快速解决在应用程序的基础设施的任何层的性能问题,确保最佳的应用性能,并满足服务水平协议。

2.2.2 云服务门户成本计算

做为对外提供服务的云计算服务中心,对所提供的服务进行计费管理将是云计算服务中心需要考虑的重点之一。

利用管理平台的计费组件获得准确的成本测算、分析和报告。实现成本透明和责任落实,以便业务所有者和 IT 人员能够了解支持业务服务所需的实际虚拟基础架构成本。

云计算计费管理主要是分析成本架构、衡量和计费,帮助系统管理员分析成本。基于基本的成本模型、固定成本和其他的因素,帮助咱们清晰了解架构的成本构成。为此,云计算的计费管理主要实现如下目标:

云计算成本的精确报告

云计算计费要考虑多个因素,包括硬件成本(CPU、内存、存储等)和其他成本,包括供电和冷却。通过模型分析,计费模块可以帮助IT人员精确了解整个虚拟化环境的成本构成,从而可以实现对独立业务部门或者整个公司进行收费。要素如下:

了解每台虚拟机的成本;

在不同部门间恰当的分配成本;

完善的费用报告。

可以定制的计费模型和度量

计费模块要可以定制模型和度量,方便IT人员根据自己的需求进行合理的调张。

支持分配计费、基于利用率计费和两者混合计费;

允许输入计算结构、基本成本模型、固定成本和多个费率设置,来满足不同需求。当然也应该提供模板简化这些操作;

可以和第三方集成来进行数据结构的输入、输出。

简化计费

计费模块要能自动生成详细计费报表,可以发送给组织中的不同业务单位,让每个付费的业务单位清晰了解他们使用的资源和相关费用。通过计费模块,系统管理员可以将IT环境从费用中心转变为效益或价值中心。

A. 准确测算和分析虚拟机的成本

通过确保准确测算虚拟化工作负载的真实成本来制定更好的资源利用和分配决策。找出减少成本不合理的低优先级部署或低利用率工作负载的机会。借助对相关成本的更好可见性,帮助企业制定有关服务级别的明智决策。

促进 IT 与业务之间的透明性

使业务部门能够了解部署和维护业务服务的成本。

消除以为虚拟机“免费”的错误认识。

促进更好的决策制定和基础架构预算需求规划。

B. 简化共享虚拟基础架构的成本会计

准确说明各个业务单位的资源所有权

自动分配服务器、存储和网络资源的使用成本

定期安排和分发报告以向业务所有者传达使用和成本信息

C. 使用全面数据中心成本建模

跟踪与虚拟基础架构部署相关的电源、散热、占地空间、软件许可证和维护的成本

在组织单位之间分摊共享业务服务的成本

与现有的 IT 财务管理或资产管理系统集成,以获得跨物理和虚拟资源的完全成本可见性

2.2.3 云服务门户安全

对于想要充分利用云计算的优势,同时不牺牲安全性、控制力或遵从性的企业,安全解决方案需要为虚拟数据中心和云计算环境提供了支持虚拟化的保护,使用户可以加强应用程序和数据安全,提高可见性和控制力,以及加快整个企业内的云计算遵从性举措。

保护虚拟数据中心边缘的网关解决方案,具有 DHCP、网址转换、防火墙、负载平衡、站点间 VPN、端口组隔离等功能,可帮助企业在不同的企业部门之间保持适当的分隔。

可保护虚拟数据中心内的应用程序免受网络威胁的侵扰的解决方案。可以创建和管理更智能的策略,加强与业务的相关性,并深入了解虚拟机之间的网络通信,以及通过安全组细化实施。

为虚拟数据中心提供针对网络威胁的基础防护,利用基本流量信息(例如源/目标 IP 地址/端口),并基于管理员定义的“分区”,为应用程序提供防火墙保护和策略管理

提供基于主机的防病毒和恶意软件防护,可以降低性能延迟和省去在每个虚拟机内维护个别安全代理的工作,从而在简化安全管理的同时尽可能降低感染恶意软件的风险。

提供安全中心控制点,用于管理、部署、报告、记录和集成第三方安全服务。通过与管理平台配合,需要支持基于角色的访问控制和管理委派,以作为管理虚拟安全的统一框架的一部分。

免费下载 Word文档免费下载: 最全的云计算平台设计方案

  • 29.8

    ¥45 每天只需1.0元
    1个月 推荐
  • 9.9

    ¥15
    1天
  • 59.8

    ¥90
    3个月

选择支付方式

  • 微信付款
郑重提醒:支付后,系统自动为您完成注册

请使用微信扫码支付(元)

订单号:
支付后,系统自动为您完成注册
遇到问题请联系 在线客服

常用手机号:
用于找回密码
图片验证码:
看不清?点击更换
短信验证码:
新密码:
 
绑定后可用手机号登录
请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系 在线客服