DevSuite合作中石化武汉乙烯:建立运维服务系统
(1)客户介绍
武汉大乙烯是中国石油化工集团公司投资建设的大型化工企业。随着基础设施建设的逐步完成,投产日期日益临近,信息技术对武汉大乙烯的业务正常运行愈来愈重要,业务部门用户对信息技术及信息系统的依赖性愈来愈高。这种依赖性,已经逐步转化为对IT 部门越来越高的服务要求。
(2)项目背景
武汉大乙烯项目IT 部门目前规划编制十几个人,计划维护的信息系统多达35 个,所有系统在2012 年年底前全部上线。大量系统集中上线,大量IT 运维工作需要管理,如何及时、有效、充分地利用分散在各个IT 运维相关系统平台中的运维数据信息,提高IT 运维的整体效率与质量?如何为IT 运维团队提供统一的工作入口,全方位展示IT 运维的整体情况?应对这些挑战,是现阶段首要考虑的问题。
由于IT 运维工作的特点,对IT 运维团队的人员管理是其核心,其余相关系统都是用于为IT 运维人员提供信息和提升效率的,因此武汉大乙烯IT 部门提出了以IT 运维平台为核心整合运维数据,建设统一运维门户的思路,以全方位管理IT 运维情况。
- 主动管理IT服务:通过 IT 服务管理体系建设咨询,梳理及明确组织和岗位职责,评估资源配置方式,建立及优化流程,为信息管理部建立主动事件响应能力,提升事件解决效率,更为主动地管理IT 服务,建立持续改进的基础;
- 固化咨询成果:通过 ServiceWise IT 运营管理软件平台将相关咨询成果固化、推广,实现平顺落地;
- 建设IT服务管理体系:通过 IT 服务管理体系建设,提升信息管理部形象,提升用户满意度,取得用户部门的理解和支持,有效支撑及保障武汉乙烯业务的快速拓展;
- 梳理IT相关职能:提供改善服务响应和用户满意度所需的信息技术职能组织结构和转型建议。提供服务台、事件及知识库等流程所涉及各角色的职责、工作接口,建立相应服务绩效的目标,评估所需资源配置及获取方式( 即评估建立自身能力以及外包所需资源、能力和成本,最终明确资源获取方式)。从而使对业务部门提交的故障申报和服务请求,能够有统一接口、基于事件严重程度的服务标准、对事件响应过程进行持续跟踪,从而确保事件能够按照服务标准的要求被受理、响应、处理及反馈;
- 建立高效运维管理模式:建立适合武汉乙烯快速响应,高效解决的运维管理模式,明确相关组织职能划分、建立岗位职责说明及工作目标,从而使IT 运维在建立专业分工的基础上,各专职部门可以对所负责领域积累相应知识及使用人员技能能够更为专精,提升各职能的工作效率和效能;
- 优化运维管理流程:包括服务级别管理(包含服务目录)、事件及服务请求管理、问题管理、变更与发布管理、配置管理与外包模式。据此可以在日常工作中,统一工作规范,明确相应职责。从而建立稳定的服务能力,并在此基础上,通过过程改进机制,持续提升服务绩效;
- 建立针对关键用户的服务目录及服务级别目标:基于服务级别目标及目标分解,明确各相关流程的有效性指标,标准化响应时间和信息管理部内部解决时间指标;
- 提升IT运维知识水平:通过 IT 服务管理的相关培训,进一步提升信息管理部IT 运维相关知识、理论素养和水平;
- 落地IT服务管理体系建设成果:通过 TechExcel ServiceWise 软件建立符合武汉乙烯发展规划的IT 运维管理平台,实现IT 服务管理体系建设成果的落地。以ServiceWise 平台为核心建立统一运维门户,综合利用各个IT 运维相关系统平台的功能和数据,为武汉乙烯提供高质量的IT 运维服务。
(3)解决方案
在武汉大乙烯ServiceWise IT 运维中心之上建立起整个IT 的“表现层”,集中展示IT 基础设施的各方面运行状况。
建立联动的统一运维门户
核心价值
建立集监控、服务、展示为一体的IT 运维服务系统,全面保障基础设施及应用系统的安全、稳定、高效运行。通过IT 运维中心集中展示各类监控与运维信息,并与网络(NOC)、云资源管理(COC)、安全(SOC)、机房环境(EOC)4 大监控中心和统一呼叫中心(CCC)全面集成,形成联动的统一运维门户。
统一运维门户的实现价值点:
- IT 运维中心负责IT 运维工程师团队的资源调度管理,面向服务对象(业务部门)提供符合服务目录SLA 要求的IT 运维服务;员工自助服务门户建立IT 部门统一的对外形象,在企业内部推广自助服务模式,降低运维团队的工作量。
- 统一呼叫中心是一线服务台与服务对象的交互界面;通过CTI 国际标准接口与IT 运维中心集成,统一呼叫中心通知IT 运维中心建立并追踪呼叫事件,IT 运维中心为统一呼叫中心提供与电话号码关联的用户信息与历史运维数据,提高一线服务台解决率。
- 4 大监控中心负责监视已经发生或即将发生的告警事件;通过集成接口将告警事件及时传递给IT 运维中心,尽快调度合适的工程师前往处理,避免影响范围更大的IT 事故发生。
- 4 大监控中心收集各自管理范围内的基础设施数据,传递给IT 运维中心的资产库,为“支撑体系”提供基础数据。
- 6 大系统通过LDAP 统一身份认证服务器紧密集成,共享用户身份数据,开通单点登录,操作者在各系统间操作无需重复登录,提高工作效率。
事件管理平台
为了规范武汉乙烯生产和运行环境中的事件管理,加强科技部门内部各部门间的协调配合,尽快解决故障或提供服务支持,为业务 提供稳定、高效、高质的IT 服务,从而建立了事件管理流程。
事件管理平台助力武汉乙烯实现以下目标:
① . 在成本允许的范围内尽快恢复IT 服务
- 快速响应服务请求
- 快速处理故障申报
- 沟通事件解决状态,提升客户满意度
② . 进行事件的有效控制
- 单一联系点
- 按规范记录事件
- 对事件进行有效分类
- 对事件进行分级管理
- 监视事件处理全生命周期并结束事件
- 定期服务流程回顾
③ . 提供有效的IT 服务管理信息
- 故障处理情况
- 服务支持效率
- 服务质量管理报告
武汉乙烯事件管理流程
武汉乙烯事件管理列表
武汉乙烯事件管理流程涵盖了事件记录与分类、一线解决、二线解决、三线解决、协调第三方解决等环节。对于重大事件,应直接 走重大事件流程,协调相关资源进行处理。
问题管理平台
为了管理武汉乙烯IT生产运行环境中的问题,找出问题的根本原因,并加以解决,防止相关事件的再次发生,从而为客户提供稳定的IT服务。TechExcel为武汉乙烯工程建立了完整的问题管理流程,从而实现:
- 查明事件或问题产生的根本原因,制定解决方案和防止事件再次发生的预防措施;
- 实施主动性的问题管理,在事件发生之前发现和解决可 能导致事件产生的潜在问题;
- 根据问题分类分级,科学合理地利用 IT 资源,降低 IT 支持成本;
- 通过问题管理,提高 IT 服务质量和服务的可用性,提高 客户服务满意度。
变更管理平台
变更管理涵盖了变更的发起与分类、评估与审批、实施、复核、关闭等环节,以及预授权变更和紧急变更等子流程。
- 正确引导和管理变更请求;
- 正确评估变更的风险,并制定风险的应对措施;
- 变更和变更实施得到正确记录,并提供审核统计;
- 减少或者消除变更对系统和服务带来的风险和影响;
- 控制变更过程,使变更高效完成,对服务质量影响最小。
武汉乙烯变更管理流程
发布管理平台
TechExcel 部署的发布管理流程为武汉乙烯所管理的IT 环境营造了一个更有效的发布环境,保证了正确的、经过批准和测试的软硬 件版本被发布实施,从而降低发布风险,保证业务的持续稳定,提高用户满意度。同时,为变更管理、配置管理等其他管理流程提 供相关信息和支持,使整个IT 基础设施更稳定。
发布管理范围包括武汉乙烯分公司开发、维护的涉及所有发布类型的信息系统软硬件的发布。发布类型具体如下:
- 常规发布:多属计划内发布,是指常态的、按照计划定期发布的已授权发布负责人实施的发布,此发布情况每月监控;版本发布、 配置基线发布;
- 重大发布:多属非计划内发布,如新产品 / 项目发布、重大硬件发布等;
- 紧急发布:系统故障、缺陷影响关键业务或重要领导交办的因紧急变更引起的发布。
配置管理平台
配置管理提供了统一、一致的流程来管理武汉乙烯的IT 资源(包括业务系统),从而实现:
- 所有配置项(即 CI)被识别和记录下来;
- 配置项当前和历史状态得到跟踪及汇报;
- 配置项记录的完整性及准确性得到维护和确认;
- IT 生产环境的稳定性。
此流程为配置管理的日常执行流程,主要指变更管理流程发起的对配置信息的修改。
此流程为配置管理的管理规划主流程,主要提供配置管理规划、配置项识别与标识、验证与审计、配置管理回顾等活动。流程始于配置管理的规划,结束于配置管理工作的回顾。
(4)价值体现
TechExcel ServiceWise 平台是以流程为核心、给予ITIL 标准的IT 服务管理工具,ServiceWise IT 运维系统平台为武汉乙烯项目建立了集监控、服务、展示为一体的IT 运维服务系统,全面保障基础设施及应用系统的安全、稳定、高效运行,并且综合利用各 个IT 运维相关系统平台的功能和数据,为其提供高质量的IT 运维服务。建立整个IT“表现层”