随着信息技术的迅速发展,IT基础设施的建设以惊人的速度逐年递增。通讯、金融、教育、交通、政府、企业等各个行业的迅猛发展都越来越密切的依赖于现代化的信息网络平台。在IT建设高速发展的同时,各行业巨大的网络维护和管理成本也在与日俱增,IT系统的健康性和可管理性越来越让人担忧。由于IT系统上承载着关键业务和应用,其运行状况直接关系到行业用户日常业务的正常运作。随着IT系统规模的增长以及对业务影响的扩大,需要对传统的管理系统和模式进行变革。
作为国内IT服务的先行者,神州数码根据多年来的行业积累,提出适合行业特性的系统管理解决方案,目标是针对行业用户在系统管理方面遇到的问题和挑战,帮助用户建立切合实际需求的IT管理和监控系统,主动地、自动地、智能地管理整个IT网络及系统,为用户IT环境的正常运转以及建立在其上的业务系统的高效运行提供强有力的保障。
一、项目概况
不久前,神州数码成功实施了中国联通193长途计费扩容系统管理工程。中国联通长途智能网从1998年开始建设,经过几年的努力,联通长途通信业务、长途智能网业务一直保持高速增长。随着业务的增长和网络扩容,对长途计费系统全国结算中心的业务要求及处理能力要求也有了很大变化,增加长途计费系统全网结算中心处理能力、存储能力,整合扩充全网结算中心业务支撑系统已经刻不容缓。同时,由于全网结算中心承担着国际局结算、网内分摊、智能网业务结算、汇总统计等重要功能,对软、硬件系统的可靠性要求极高。任何报表数据错误、数据丢失不可恢复等都会导致巨大的经济损失,甚至不可估量的后果。因此对系统硬件平台及应用软件的稳定性、可靠性提出了很高的要求。为了保证联通长途业务的稳定运行,在本次扩容工程中考虑采用系统管理软件对全网中心的网络、主机、数据库等进行全面的管理。
针对中国联通193长途计费系统在系统管理方面的需求和现状,神州数码设计了切合用户实际的系统管理解决方案:采用OpenView Operation 作为系统管理综合控制台,实现对主机系统的告警和性能管理,集成已有的OpenView NNM完成网络告警和性能管理功能。此外,对于关键数据库,采用HP OpenView OpenView Smart Plug-In智能插件进行管理。采用OpenView Performance Manager实现网络、主机、数据库的性能管理。在此基础上,通过神州数码系统管理专业化服务实现客户的特殊管理需求。
二、用户需求分析:
联通193全网中心承载着联通全国长途的主要业务,其网络系统和主机系统运行着关键的业务应用,为了保证联通长途业务的稳定运行,必须对其加强对全网中心IT系统环境的管理,对分布式信息系统中的所有网络设备、主机系统、各种系统软件和应用软件进行全面的集中的管理和监控。从管理内容和功能上看,可以分为以下几个方面:
1、网络管理和性能监测:包括网络设备的自动发现、生成当前网络的拓扑结构图;监控网络链路和设备的运行状态;探测故障、判别故障类型并对故障定位,纠正网络故障,保证网络正常运行;监控网络设备性能,如CPU利用率、内存利用率、端口利用率,实现主动告警;收集网络运行的统计数据、分析网络流量,对网络结构进行优化以减少网络运行故障等。
2、系统事件管理:为整个系统管理平台提供统一的操作界面,解决网络和系统中发生的各种问题。系统故障或问题管理的内容包括系统硬件、操作系统的重要问题,对管理对象进行故障检测,报告故障类型、严重级别,提供潜在问题报告并建立故障详细情况的日志。系统事件管理还提供事件通知、专家建议和事件分发处理机制。
3、系统性能分析:主要是对操作系统的性能管理,进行CPU、内存、磁盘空间利用率、交换区利用率等性能数据的统计和分析,包括资源的使用率统计值和分析报告,性能事件的捕捉与检测。可以对性能数据进行图形化展示,以及生成性能分析报告。
4、数据库系统管理:对数据库系统的性能进行多方面的监测,如数据库进程的状态、表空间的使用情况和I/O的吞吐量、读写缓存的命中率等,并可以对指定的性能指标设定阈值,一旦当性能达到瓶颈时能执行处理动作并生成报警。




