摘要
本文主要讨论康柏UNIX企业服务器归并解决方案的高可用性优势。康柏将AphaServer GS系列、Tru64UNIX操作系统、先进的TruClusterV5集群技术和完善的高可用性服务结合起来,实现了无与伦比的归并可用性。
一、归并的价值
服务器归并是要求必须24小时全天候运营、很少或没有停机时间的企业的理想选择。
服务器归并为正在迅速发展而需要持续正常运行的企业提供了巨大的商业优势。完美的归并解决方案应易于管理,并且几乎没有停机。下面列举了采用康柏AlphaServer系统、软件和服务的服务器归并的优势:
·缩短或消除计划外停机时间;
·24x7全天候运行;
·可以达到99.999%的正常运行时间,享受可选保修;
·提供空前强大的性能,解决以前不能解决的问题;
·实现更短的软硬件错误恢复时间、更好的恢复过程和更少的操作错误,从而简化IT运营;
·实现完全“无人值守”支持;
·加快应用部署;
·实现与客户和合作伙伴的对外联系;
·在更多的服务器上平衡工作负载;
·在一台服务器或一个服务器集群上运行多个关键业务应用或操作系统。
企业服务器归并是从多个分布式服务器、应用和数据库向集中化的全球解决方案的转移
二、高可用性的重要性
如果停机时间影响了您开展商务的能力和盈利,您就需要一个高可用性的解决方案
今天,在经营过程的前端和后端,大多数系统对可用性的要求越来越高。如果任何一个计算系统的停机时间都有可能对一个企业的财务业绩或经营过程的连续性产生负面影响,则该系统就必须被视为关键任务系统并要求具有高可用性(Gartner Group)。停机时间的代价对生产率大有影响,进而可能导致收入和客户的流失。因为IT部门要求保持严格的停机时间限额(往往以分钟计算),所以可用性至关重要。
很多预期或意外的事件都有可能导致停机时间。根据Gartner Group的鉴定,造成停机时间的原因包括计划内维修、应用故障、操作错误、操作系统故障、硬件故障、断电和自然灾害等。最后两项因素造成的停机时间不到全部停机时间的2%。
计划内停机时间是最常见的停机时间,它可以利用高可用性服务器归并解决方案予以减少。如果连续正常运行时间对您的计算环境至关重要,那么将您的服务器归并起来并在其后设置适当的支持基础设施能够带来很好的经济效益。
从上图可以看到,正常运行时间从99%提高到99.999%,意味着将可用性提高了几乎10,000%,并将停机时间减少到了每月不到30秒。
三、康柏企业服务器归并解决方案
AlphaServer GS系列提供了大型分布式企业环境中所要求的可用性。
针对拥有由来自康柏、惠普、SUN或IBM的多个UNIX服务器组成的大规模分布式计算环境的企业,康柏提供了一款采用新型AlphaServer GS系列服务器的无与伦比的服务器归并解决方案。AlphaServer GS系列服务器经过精心设计,可扩展为拥有几百个CPU、数百GB内存和数TB存储设备的集群,从而提供最高等级的64位性能和可用性。
康柏归并解决方案是归并Oracle、SAP、PeopleSoft、BaaN、SAS、BEA、Lawson、Netscape和定制应用的理想选择,它能够增强竞争力、降低运营成本并创造出新的市场机遇。
四、AlphaServer GS系列的高可用性特性
AlphaServer GS系列使IT人员能够迅速更换或升级关键组件而不会对用户造成任何影响。
新型AlphaServer GS系列卓越的高可用性是服务器技术取得重大进展的结果,它消除了导致计划内和计划外停机时间的许多因素。从一开始,服务器的构建就采用了可用性技术进步所带来的最新特性,包括:
·在线维护和升级;
·完善的硬件监视和环境报告;
·完全冗余并具有自动故障切换能力的服务处理器;
·N+1容错电源子系统;
·高可用性网络和存储子系统;
·易维护性和高可用性。
在线维护和升级:AlphaServer GS系列内的大多数组件都设计为可以在线维护和升级。组件可以根据自身功能进行热插拔或温插拔(在系统运行时拆卸和插入)。为进一步提高可维护性,这一特性还支持操作系统、数据库或应用的在线维护和升级。
完善的硬件监视和环境报告:AlphaServer GS系列监视系统和操作环境中的所有组件和模块。任何组件的任何物理变化都将自动进行报告。环境的运行特性也受到监视,在状态发生变化时提交报告以便采取适当措施。
完全冗余并具有自动故障切换能力的服务处理器:AlphaServer GS系列中的每个模块和组件都有一个专用的监视处理器。监视处理器的服务处理网络即使在主电源失效或一个组件发生故障时仍然可用。它跟踪所有模块或组件信息,包括型号、序列号和固件等级。组件状态的任何变化(包括断电或故障)都会报告给系统操控台。
N+1容错电源子系统:AlphaServer GS系列利用其N+1容错电源能力来提供即时自动故障切换。万一电源发生故障,也不会中断应用可用性。这样就可以保持运行和应用的继续进行。另外还提供可选的双AC输入以将AC电网分开,从而在外部AC主电源中断时也能保证极高的可用性。
AlphaServer GS系列能够容忍服务器外部的故障。
高可用性网络和存储子系统:许多系统故障是由于服务器外部的故障所导致的。AlphaServer GS系列能够以一种既可提高系统配置可用性、又可确保在外部硬件子系统发生故障时服务器自身不会发生故障的方式连接到外部子系统。它还支持存储和网络的多路径输入/输出。通过在您的站点配置冗余存储或网络子系统,可以对服务器和外部环境之间的任何组件故障进行容错,而不会损害数据或交易的完整性。另外,GS系列操控台子系统不会发生单点故障。如果使用多个操控台,当一个操控台发生故障时可透明地自动故障切换到其它操控台,而后者就成为该部分或系统的操控台。
易维护性和高可用性:康柏对导致组件和系统故障的根源进行了广泛的分析,并据此设计出AlphaServer GS系列系统以提高可维护性和可用性。其特性包括:
·更少的组件和电缆(提高了可靠性)
·点到点连接取代了总线
·CPU中的“准备热插拔”指示灯可以实现轻松识别
·标有色码的构建模块、电缆和模块可供维修人员轻松识别
·提高连接器的对准程度以保证精确的连接,无弯针或偏离中心的触点,从而排除了可能由于震动而脱落的风险。
·在全系统中对所有可维护硬件均使用固定装置
·在关键子系统中使用最高品质的组件和模块
·内存、高速缓存和所有系统数据和指令路径均采用ECC校验,可防止数据讹误和系统故障
·广泛的工厂“预烧”,及早排除故障情况。
康柏在AlphaServer GS系列中所采用的创新设计与康柏Tru64 UNIX操作系统和TruCluster Server软件相结合,带来了业界可用性最强的RISC/UNIX系统。
康柏Tru64UNIX操作系统提供了业界领先的UNIX系统性能,并在客户满意度方面也居于业界领先地位(D.H.Brown报告,2000年3月1)。Tru64UNIX操作系统可理想地用于大规模关键业务应用,如电子商务、业务智能和业务处理应用。Tru64UNIX的最大优势是单系统映像集群和全球系统管理技术。该技术支持将集群作为一个单一系统进行管理,这在当今市场上是独一无二的(本文后面将对此进行更详细的讨论)。其它操作系统可用性特性还包括:
·事件管理:Tru64UNIX事件管理能力在UNIX市场上是独一无二的,它能够访问关键事件信息,用于管理和调节系统,从而加快问题诊断的速度。
·动态调节:Tru64UNIX操作系统可以在运行期间进行调节,从而使正常运行时间和可用性都达到了最大限度。
·路径可选:Tru64UNIX操作系统为每个存储设备或网络设备均提供多条路径,从而消除了单点故障并提高了可用性。
·多用户路径:这一特性支持在系统不停机的情况下在线安装补丁,进而提高了正常运行时间和可用性。
·动态内存隔离:Tru64UNIX操作系统能够隔离出现故障的内存,从而减少了计划外的停机时间。
如果您对可用性要求极高,那么就需要使用集群。Tru64 UNIX操作系统、TruClusterServer和AlphaServer系统提供了康柏AlphaServer产品线中最出色的UNIX可用性。
五、利用集群增强可用性
康柏TruCluster Server V5技术为服务器归并环境带来了最卓越的高可用性。D.H.Brown的一项最新调查2显示:AlphaServer系统上的TruCluster Server提供了业界最高的整体集群性能以及最全面的可用性等特性。
TruCluster Server V5能够使多台物理服务器达到极高的可用性,并为单台服务器的系统分区提供高可用性。TruCluster Server V5与运行Tru64 UNIX V5的服务器紧密集成,提供了自动负载平衡、单系统管理,并为整个集群范围内的文件系统提供集群应用可用性框架和可扩展性等诸多特性。
如图所示,TruClusterServer在单个系统中运行,并通过自动分区故障切换来提供高可用性。在这一情况中,第2分区自动接管了在第1分区上运行的应用。这个过程对于最终用户是透明的。
自动负载平衡:自动负载平衡能够将与TruClusterServer连接的客户机分配给当前负载最低的集群成员--无论它是一台独立的服务器还是分区。TruCluster Server V5还通过不断重新平衡客户机连接来确保最佳性能和资源利用率。即使在工作负载加重的情况下也可以轻松地添加系统和分区或重新调整它们的大小,而不会影响用户的性能。
“单一系统映像管理是康柏集群所特有的一种突破性的特性。”
单一系统映像管理:TruCluster Server V5将集群当作一个单一系统而不是多个系统的组合来进行管理,从而可以大大降低管理和运营成本。一个集群文件系统还加强了集群范围内的存储管理,从而提供了经过改进的数据管理,更高的可用性和更低的成本。另外,集群文件系统还使应用的故障切换更加迅速和更容易实施。
集群应用可用性(CAA):CAA程序记录已注册应用之间的相关性,并透明地监视其状态。如果某个硬件或软件出现故障致使系统不能运行支持应用的服务,故障切换机制将自动把该服务重新分配给集群中可用的系统,这样便保证了应用和数据的可用性。管理员还可以人工重新部署应用,以实现负载平衡或进行硬件维修。
可扩展性:如果应用要求发生改变,可以轻松地向TruClusterServer环境添加更多的服务器或系统分区。结合新型AlphaServer GS系列的系统分区能力,康柏提供了前所未有的灵活性来扩展或重新配置系统,从而满足您不断变化的需要。其优势包括:
·在单台服务器中创建更多分区
·扩展服务器的数量和在多台服务器上的系统分区数量
·在多台物理服务器和系统分区上扩展集群。此外,集群的扩展速度也非常快--IT员工在15分钟内就可以增加一个集群节点。
Tru64 UNIX的其它可扩展性还包括:
·文件系统可以扩展到几TB
·满足数据密集型计算需要的海量内存(VLM)技术
·分区。使一个系统划分为多达8个分区,每个分区都拥有各自的操作系统映像,以便将测试和生产环境隔离开来
·能够同时支持多达数百万用户
·通用集群寻址。可以使用一个主机名访问集群中任意系统的数据和应用
六、确保高可用性的服务
为了使您始终保持正常工作,康柏提供了广泛的高可用性服务。
需要进行一些具体的工作来确保可用性达到最高等级。为了使您始终保持正常工作,康柏提供了广泛的高可用性服务。AlphaServer GS系列可以使企业通过服务器归并获得高可用性。康柏归并服务提供了必要的系统集成服务、体系结构方法学和各种专业知识来帮助您以最经济高效的方法保持高可用性。为了满足最苛刻的可用性要求,康柏将与您建立密切的合作伙伴关系,以提供高达99.999%的正常运行时间。
安装与启动服务:这些服务确保硬件和操作系统在最开始时就能得到正确的安装。它们包括:设备启封、验收、装配、安装、测试、诊断、服务工具的安装和定位。以及软件的配置和测试。
可用性评估:此服务对包括硬件、系统软件和物理环境在内的计算环境和可用性进行评估。
可用性检查:此服务提供对计算对象和可用性的定制化的全面评估,重点是系统管理、应用、网络、系统软件、硬件和物理环境。康柏将与您密切合作,通过分析您的业务目标来区分可用性风险的先后顺序,并提供具体建议。
可用性合作伙伴关系:这项定制化的服务提供了一个不断改进的计划来最大限度地提高您的计算环境的可用性。康柏对物理环境、硬件配置、软件产品、网络功能和全面运行进行分析。根据分析的结果提出采用何种战略来实现您的可用性目标的建议。建议可能包括:常驻工程师、现场备用计划或一个改变管理计划。
99.999%正常运行时间的担保:针对需要把停机时间降至最低的关键业务环境,康柏通过AlphaServer GS系列系统提供99.999%的正常运行时间保证。此服务在康柏与您的IT组织之间建立一种独特的合作伙伴关系。有了这种正常运行时间保证,康柏将与您共同承担停机时间的责任和损失。通过与康柏的合作,您将获得预防性的服务和保持系统和业务正常运行所需的可靠性。
Internet安全状态检查:如果您的企业与Internet相连接,这就是一项必不可少的服务。使用Internet安全系统(ISS)公司提供的全面安全风险检测和分析解决方案,康柏安全专家评估您的基础Internet配置,包括通信服务、操作系统、关键应用和路由器。康柏将提交一份详细的报告,明确说明其中存在的弱点、列出安全风险的优先顺序、并据此提供行动计划的建议。同时提供后续服务来帮助您实施康柏的建议。
网络管理:康柏在为全球提供网络管理解决方案方面有着极为丰富的经验。服务包括:网络工作状态检查、网络优化,以及网络性能咨询服务。康柏能够评估并实施网络性能解决方案,并在降低广域网和局域网成本的同时监视网络的性能。
系统管理支持:此服务提供先进的系统管理专业知识和帮助,以增加您的IT员工。
另外还有多种其它的康柏服务,它们可以满足您全方位的服务器归并的需要。
七、总结
对于正在迅速成长而需要连续正常运行时间的企业而言,可靠的高可用性服务器归并解决方案能够为用户、合作伙伴和客户提供几乎永不停顿的服务。康柏企业服务器归并解决方案提供了无可匹敌的可用性及卓越性能,能够使您的关键运营永远保持正常工作。




