中国航信重视IT运维监控体系建设 IT运维监控的新挑战
作者: 刘燕
责任编辑: 阚智
来源: 《电脑商情报》授权转载
时间: 2010-08-09 15:18
作为一个以展现业务健康状况为中心,面向业务的、分层次的监控管理体系,中国航信ITOMS系统经历了一个循序渐进、不断发展的过程。
与时俱进
民航业的快速发展一方面便利了人们的出行,另方面也对整体经济市场起到了巨大的促进作用。相关数据显示:2009年,国内乘坐民航出行的人次已突破两亿大关,而且,这一数据今年仍在保持稳定增长态势。
作为一家面向航空公司、机场、机票销售代理、旅游企业及民航相关机构和国际组提供专业服务的信息技术及商务提供商,中国民航信息集团公司(中国航信)的主营业务包括航空客运业务处理、航空旅游电子分销、机场旅客处理、航空货运数据处理、互联网旅游平台、国际国内客货运收入管理系统应用和代理结算清算等。伴随整个行业的快速成长及公司自身业务的不断发展,对公司的IT运维工作也提出了巨大挑战,构建一个强健的IT运维监控管理体系对中国航信公司信息化的发展至关重要。
由于关联业务庞大,下辖机构众多,中国航信一直非常注重打造完整的、丰富的、功能强大的信息服务产品线和面向不同对象的多级系统服务产品体系,极大地提高了行业参与者的生产效率。目前为止,其下属共包括12家分公司、18家附属公司、8家联营公司,服务的客户包括近30家国内航空公司以及近200家地区及海外航空公司,国内147家机场以及近7000家机票代理人,服务范围覆盖到300个国内城市、80个国际城市,并通过互联网进入社会公众服务领域,资产总额达到73亿元人民币。
所有这些庞大的业务系统都由中国航信运行中心负责运维。这些设备及IT部件分置于两个高等级数据中心,总面积超过6000平方米。包括:2000多台硬件设备、17000多个端口的光纤和客户网络、1000多套系统中心平台、80套左右的数据库平台以及50余套中间件环境等。
长期以来,中国航信对于IT运维监控体系建设就非常重视。早在1999年,公司就开始启动开放系统的构建和监控体系,2003年引入集中监控机制。从2004年起,公司开始系统地实施基于ITIL(IT Infrastructure Library,即信息技术基础架构库)最佳实践的ITSM(IT服务管理)体系,并引入访问控制管理等管理理念。自2004年持续演进至今,已经部署了事件管理、问题管理、变更管理、配置管理、容量管理、业务连续性管理、服务级别管理、成本管理、供应商管理等9个管理模块和流程。
2008年,中国航信作为北京奥运会保障的重点单位之一,圆满完成了奥运航空运输信息服务保障。这其中,中国航信运行中心保障了航空旅游业最核心的信息系统,实现了奥运保障期间零停机的目标,在奥运保障项目中发挥了重要作用。项目的艰巨性和复杂性让中国航信意识到服务管理资源整合的迫切性和重要性。
对此,中国航信相关负责人指出,随着自身业务的发展和IT基础设施的不断扩张,IT管理正在从侧重资源管理向侧重于业务和服务水平的IT服务管理演进;相应的,IT监控也从资源监控向业务监控转变,构建一个强健的IT运维监控管理体系,将对其公司整体信息化建设起到至关重要的影响和推动。
面向业务
为了更好地满足当前及未来业务发展需求,创建更加完善的IT运维监控管理体系,经过长达6个月的技术论证和测试,中国航信最终决定选择IBM Tivoli Netcool lT服务管理解决方案来构建新一代的ITOMS系统(即IT运维监控管理体系,IT Operations Monitoring & Management System,简称ITOMS)。
作为一个以展现业务健康状况为中心,面向业务的、分层次的监控管理体系,中国航信ITOMS系统经历了一个循序渐进、不断发展的过程。2009年10月,中国航信开放系统集中监控功能完善项目的完成,标志着中国航信ITOMS在历经三代发展后,成为一个真正“面向业务”的监控体系。
该ITOMS项目于2008年10月开始正式启动,分两个阶段实施。新系统中增加了知识库管理系统、统一的事件中心、报表与分析中心、业务影响视图等新功能,在不改变原有基础监控平台功能的前提下,实现了系统与配置管理、事故管理等管理组件更有效的结合。
“中国航信开放系统集中监控功能完善项目的完成,标志着中国航信ITOMS在历经三代发展后,成为一个真正‘面向业务’的监控体系。事件管理、配置管理和运维知识库的整合是中国航信ITOMS渐进式发展进程中的关键一步。它让中国航信的IT运维监控管理体系实现了‘以业务为中心’的转型。” 中国航信副总裁兼运行中心总经理荣刚指出,中国航信一直将IT运维的安全性和可靠性作为IT服务水平持续改进的关键目标。中国航信拥有30年的IT运维管理经验,目前已经形成了具有自身特色的IT服务管理模式。
他表示,基于新的ITOMS系统,中国航信解决了原各种软件产品信息格式展现方式不统一、报警信息与业务信息脱节等问题,建立了以开放平台运维知识库系统为核心的IT运维监控管理体系:在一个平台上,把监控、安全、存储、备份等10多种运维管理软件所产生的报警信息进行统一处理、统一规则、综合呈现,极大地提高了事件管理的水平,为IT服务管理的进一步升级转变建立起IT管理支撑。
统一展现
在中国航信运行中心运行部经理沈强看来,就复杂、超大规模IT系统的运维而言,统一的事件信息展现平台是十分必要的。该平台以一致的方式来展示源自各种IT运维管理系统的事件信息,它还必须能够与配置管理平台和知识库平台紧密融合,以帮助值班人员快速定位和解决问题。而围绕企业的关键业务,该平台需要借助动态的业务影响视图来实时展现整个业务的服务水平。
目前,利用基于IBM Tivoli Netcool的ITOMS,中国航信在整个IT服务周期中充分实现了可视化、可控化和自动化管理。
可视化方面,所有业务视图从实施前的手工绘制实现了实时动态更新,同时创建了可反映业业务整体健康状况的业务影响视图,可全面展现包括事件信息以及与之相关的配置、业务、知识等信息;
可控化方面,在ITOMS系统中,监控屏幕数由实施前的至少16个统一为1个;平均事件相应时间由实施前的300秒缩短至实施后的30秒;平均事件处理时间缩短2分钟;实施后事件信息拥有统一的规范格式,改变了16种软件各自为政的状态;实施后监控平台和SD(service desk ,服务台)记录的事件平台状态自动保持同步,无需值班人员手工处理。
自动化方面,经过规则过滤、压缩后,关注事件量由实施前的每天几万件减少为几十件;事故管理能力得到提升:实施前手工创建事故单,内容不容易规范,准确性无法得到保证;实施后,经过值班人员审核后自动创建事故单,保证格式统一,确保信息内容准确可靠。
在总结中国航信IT 监控管理项目实施成功经经验时,沈强表示:“首先,ITOMS系统的实施涉及到企业变革,得到了上层领导对项目高度重视;第二,所选的产品要好。我们选择Tivoli Netcool这个产品,主要是因为其具有先进的IT服务管理理念,其技术上的维护量也比较小,并且能够帮助我们整合这十多种资源;第三,IBM在IT行业所积累的经验对项目的顺利实施有非常大的帮助。”
IT 监控管理项目实施成功要素:
@此类项目涉及到企业整体系统,必须得到企业高层的一致重视;
@选对产品。产品应该具有先进的IT服务管理念以及较低的后期维护成本;
@选对合作伙伴。选择在该领域具有丰富实施经验的方案商。
与时俱进
民航业的快速发展一方面便利了人们的出行,另方面也对整体经济市场起到了巨大的促进作用。相关数据显示:2009年,国内乘坐民航出行的人次已突破两亿大关,而且,这一数据今年仍在保持稳定增长态势。
作为一家面向航空公司、机场、机票销售代理、旅游企业及民航相关机构和国际组提供专业服务的信息技术及商务提供商,中国民航信息集团公司(中国航信)的主营业务包括航空客运业务处理、航空旅游电子分销、机场旅客处理、航空货运数据处理、互联网旅游平台、国际国内客货运收入管理系统应用和代理结算清算等。伴随整个行业的快速成长及公司自身业务的不断发展,对公司的IT运维工作也提出了巨大挑战,构建一个强健的IT运维监控管理体系对中国航信公司信息化的发展至关重要。
由于关联业务庞大,下辖机构众多,中国航信一直非常注重打造完整的、丰富的、功能强大的信息服务产品线和面向不同对象的多级系统服务产品体系,极大地提高了行业参与者的生产效率。目前为止,其下属共包括12家分公司、18家附属公司、8家联营公司,服务的客户包括近30家国内航空公司以及近200家地区及海外航空公司,国内147家机场以及近7000家机票代理人,服务范围覆盖到300个国内城市、80个国际城市,并通过互联网进入社会公众服务领域,资产总额达到73亿元人民币。
所有这些庞大的业务系统都由中国航信运行中心负责运维。这些设备及IT部件分置于两个高等级数据中心,总面积超过6000平方米。包括:2000多台硬件设备、17000多个端口的光纤和客户网络、1000多套系统中心平台、80套左右的数据库平台以及50余套中间件环境等。
长期以来,中国航信对于IT运维监控体系建设就非常重视。早在1999年,公司就开始启动开放系统的构建和监控体系,2003年引入集中监控机制。从2004年起,公司开始系统地实施基于ITIL(IT Infrastructure Library,即信息技术基础架构库)最佳实践的ITSM(IT服务管理)体系,并引入访问控制管理等管理理念。自2004年持续演进至今,已经部署了事件管理、问题管理、变更管理、配置管理、容量管理、业务连续性管理、服务级别管理、成本管理、供应商管理等9个管理模块和流程。
2008年,中国航信作为北京奥运会保障的重点单位之一,圆满完成了奥运航空运输信息服务保障。这其中,中国航信运行中心保障了航空旅游业最核心的信息系统,实现了奥运保障期间零停机的目标,在奥运保障项目中发挥了重要作用。项目的艰巨性和复杂性让中国航信意识到服务管理资源整合的迫切性和重要性。
对此,中国航信相关负责人指出,随着自身业务的发展和IT基础设施的不断扩张,IT管理正在从侧重资源管理向侧重于业务和服务水平的IT服务管理演进;相应的,IT监控也从资源监控向业务监控转变,构建一个强健的IT运维监控管理体系,将对其公司整体信息化建设起到至关重要的影响和推动。
面向业务
为了更好地满足当前及未来业务发展需求,创建更加完善的IT运维监控管理体系,经过长达6个月的技术论证和测试,中国航信最终决定选择IBM Tivoli Netcool lT服务管理解决方案来构建新一代的ITOMS系统(即IT运维监控管理体系,IT Operations Monitoring & Management System,简称ITOMS)。
作为一个以展现业务健康状况为中心,面向业务的、分层次的监控管理体系,中国航信ITOMS系统经历了一个循序渐进、不断发展的过程。2009年10月,中国航信开放系统集中监控功能完善项目的完成,标志着中国航信ITOMS在历经三代发展后,成为一个真正“面向业务”的监控体系。
该ITOMS项目于2008年10月开始正式启动,分两个阶段实施。新系统中增加了知识库管理系统、统一的事件中心、报表与分析中心、业务影响视图等新功能,在不改变原有基础监控平台功能的前提下,实现了系统与配置管理、事故管理等管理组件更有效的结合。
“中国航信开放系统集中监控功能完善项目的完成,标志着中国航信ITOMS在历经三代发展后,成为一个真正‘面向业务’的监控体系。事件管理、配置管理和运维知识库的整合是中国航信ITOMS渐进式发展进程中的关键一步。它让中国航信的IT运维监控管理体系实现了‘以业务为中心’的转型。” 中国航信副总裁兼运行中心总经理荣刚指出,中国航信一直将IT运维的安全性和可靠性作为IT服务水平持续改进的关键目标。中国航信拥有30年的IT运维管理经验,目前已经形成了具有自身特色的IT服务管理模式。
他表示,基于新的ITOMS系统,中国航信解决了原各种软件产品信息格式展现方式不统一、报警信息与业务信息脱节等问题,建立了以开放平台运维知识库系统为核心的IT运维监控管理体系:在一个平台上,把监控、安全、存储、备份等10多种运维管理软件所产生的报警信息进行统一处理、统一规则、综合呈现,极大地提高了事件管理的水平,为IT服务管理的进一步升级转变建立起IT管理支撑。
统一展现
在中国航信运行中心运行部经理沈强看来,就复杂、超大规模IT系统的运维而言,统一的事件信息展现平台是十分必要的。该平台以一致的方式来展示源自各种IT运维管理系统的事件信息,它还必须能够与配置管理平台和知识库平台紧密融合,以帮助值班人员快速定位和解决问题。而围绕企业的关键业务,该平台需要借助动态的业务影响视图来实时展现整个业务的服务水平。
目前,利用基于IBM Tivoli Netcool的ITOMS,中国航信在整个IT服务周期中充分实现了可视化、可控化和自动化管理。
可视化方面,所有业务视图从实施前的手工绘制实现了实时动态更新,同时创建了可反映业业务整体健康状况的业务影响视图,可全面展现包括事件信息以及与之相关的配置、业务、知识等信息;
可控化方面,在ITOMS系统中,监控屏幕数由实施前的至少16个统一为1个;平均事件相应时间由实施前的300秒缩短至实施后的30秒;平均事件处理时间缩短2分钟;实施后事件信息拥有统一的规范格式,改变了16种软件各自为政的状态;实施后监控平台和SD(service desk ,服务台)记录的事件平台状态自动保持同步,无需值班人员手工处理。
自动化方面,经过规则过滤、压缩后,关注事件量由实施前的每天几万件减少为几十件;事故管理能力得到提升:实施前手工创建事故单,内容不容易规范,准确性无法得到保证;实施后,经过值班人员审核后自动创建事故单,保证格式统一,确保信息内容准确可靠。
在总结中国航信IT 监控管理项目实施成功经经验时,沈强表示:“首先,ITOMS系统的实施涉及到企业变革,得到了上层领导对项目高度重视;第二,所选的产品要好。我们选择Tivoli Netcool这个产品,主要是因为其具有先进的IT服务管理理念,其技术上的维护量也比较小,并且能够帮助我们整合这十多种资源;第三,IBM在IT行业所积累的经验对项目的顺利实施有非常大的帮助。”
IT 监控管理项目实施成功要素:
@此类项目涉及到企业整体系统,必须得到企业高层的一致重视;
@选对产品。产品应该具有先进的IT服务管理念以及较低的后期维护成本;
@选对合作伙伴。选择在该领域具有丰富实施经验的方案商。
