1. 概述

1.1. 目标

事件管理流程的主要功能是减少或消除存在或可能存在于信息技术服务中的干扰因素给信息技术服务带来的干扰,以确保用户可以尽快恢复自己的正常工作。事件管理流程的目标包括:

在成本允许的范围内尽快恢复IT服务,在给用户和公司正常业务活动带来最小影响的情况下,尽快恢复到SLA中定义的正常服务级别。

  1. 快速响应服务请求(电话/Web/邮件等);
  2. 用户在线获得帮助;
  3. 沟通事件解决的状态;
  4. 进行事件控制;
  5. 按规范记录事件;
  6. 监视、分析和诊断事件,必要时进行事件升级;
  7. 为其他流程提供合适的信息以改进相关处理流程;

1.2. 范围

1.2.1. 流程适用范围

本流程适用于XX网络工程有限公司(以下简称“公司”)各相关部门。

1.2.2. 流程管理范围

事件管理流程涉及财务(资金)管理、营销管理、安全研发管理、协同办公、人力资源管理、物资管理、项目管理和综合管理及其与之相关的网络平台、防火墙、数据库等IT研发环境中产生的常规、非常规事件,以及客户环境中桌面硬件、计算机辅助设备的服务和故障请求,解答用户围绕这些生产环境提出的问题以及咨询。

事件管理流程不涉及尚处于开发或测试中的系统和应用。

2. 角色和职责

事件管理流程涉及的角色包括:事件管理流程负责人、事件经理、一线支持、二线支持、服务专员等。事件管理流程负责人和事件经理可以由同一人担任。各角色职责如下:

2.1. 事件管理流程负责人

事件管理流程负责人从宏观上对流程运行情况进行监控,确保事件管理流程在各部门间被正确的执行。当流程不能够适应公司实际情况时,流程负责人必须启动分析研究,找到解决方案并进行改进,实现流程的稳定运行和可持续提高。具体职责包括:

  1. 确定管理流程的衡量指标;
  2. 确保事件流程能够取得管理层的参与和支持;
  3. 确保事件流程符合公司实际状况和公司 IT发展战略;
  4. 总体上管理和监控流程,建立事件流程实施、评估和持续优化机制;
  5. 确保事件流程实用、有效、正确地执行,当流程不能够适应公司的情况时,必须及时的对此进行分析、找出缺陷、进行改进(假如增加或合并流程的角色),从而实现可持续提高;
  6. 保持与其他流程负责人的定期沟通。

2.2. 事件经理

  1. 负责对事件的解决协调资源,保证故障的最终排除;
  2. 当事件优先级为紧急或者事件将超过规定的时限,负责按照升级方法对事件进行处理确保有效协调资源,促进支持工程师快速恢复正常服务;
  3. 确保和问题管理流程经理的有效合作;
  4. 确保正确和广泛地收集和分析事件数据,发现IT和业务相关的问题。
  5. 负责流程运行质量的监控管理,向公司负责,

2.3. 一线支持

  1. 在指定的响应时间内响应所有服务热线电话、邮件、传真等事件报告;
  2. 完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等;
  3. 为事件进行适当的分类、为事件分配优先级等属性;
  4. 将紧急事件分派给合适的二线支持人员;
  5. 对非紧急事件,首先尝试使用工具、初步诊断、分析相关信息等方式解决问题;
  6. 如果不能解决这个事件,应当将事件分配给最合适的二线支持小组/人员来处理;
  7. 检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件处理进展;
  8. 与用户确认事件解决方案,关闭事件;
  9. 负责24×7的值班。

2.4. 二线支持

  1. 接收派单(事件处理请求),解决相关事件。
  2. 按照标准要求填写处理过程。
  3. 负责联络专家。

2.5. 服务专员

接受客户服务请求,初步处理客户提交的事件,并反馈结果给用户,关闭工单。

3. 输入

编号输入项来源周期
  1.  
通过纸质文件、邮件、电话和传真等提出的事件。用户日常运维
  1.  
通过日常维护提出的事件。运维支持人员日常运维
  1.  
问题管理给出解决方案和应急措施问题管理流程日常运维
  1.  
变更管理给出的变更通知变更管理流程日常运维

4. 输出

编号输出项去向周期
  1.  
问题问题管理流程日常运维
  1.  
事件和事件处理过程及结果的记录(报表)事件经理日常运维

5. 相关定义和说明

5.1. 事件的分类

为便于事件的合理分配以及有效汇总、统计和分析事件记录,并为问题、变更管理打好分类基础,事件应得到合理分类。其中一级分类为办公系统终端、基础设施、网络、主机、安全系统、基础应用、业务应用。

当影响范围为全体或紧急程度为特急时,此类事件可认为是重大事件,需按照紧急事件流程进行处理。

5.2. 事件的优先级定义

公司事件管理流程中,事件影响范围用于衡量事件所影响业务及用户范围,分为8个等级。事件紧急程度用于衡量事件需要及时解决响应的程度,分为4个等级,根据事件管理流程按照事件影响范围和紧急程度,按照事件优先级的特定计算公式,事件被分为四个优先级:一般(1)、中(2)、高(3)、特高(4)。

5.3. 技术升级时间表

file:///C:\Users\19805\AppData\Local\Temp\ksohtml718552\wps1.png   支持

团队

升级

file:///C:\Users\19805\AppData\Local\Temp\ksohtml718552\wps2.png时限

事件

级别

一线支持(服务专员)升级到

二线支持

二线支持

升级到

专家支持      

升级到

问题流程            

紧急(5级)
高(4级)2个小时3个小时 
中(3级)8个小时12个小时 
较低(2级)24个小时最终期限前8个小时 
低(1级)48小时最终期限前8个小时超过最终时间

5.4. 行政升级时间表

紧急(5级)升级阀值   /
报告范围   
高(4级)升级阀值2个小时3个小时超过最终时间
报告范围服务专员/一线,被分派工单的二线被分派工单的服务台/一线/二线,事件经理事件经理及管理层

中(3级)

 

升级阀值8个小时12个小时超过最终时间
报告范围服务专员/一线,被分派工单的二线被分派工单的一线/二线,事件经理事件经理及管理层
较低(2级)升级阀值24个小时最终期限前8个小时最终期限前2小时超过最终时间
报告范围服务专员/一线,被分派工单的二线被分派工单的一线/二线被分派工单的一线/二线,事件经理事件经理及管理层
低(1级)升级阀值48小时最终期限前8个小时最终期限前2小时超过最终时间
报告范围服务专员/一线,被分派工单的二线被分派工单的一线/二线被分派工单的一线/二线,事件经理事件经理及管理层

5.5. 事件的状态

事件处理流程中事件的相关状态定义见下表。

事件的状态            定义
已登记已由服务专员登记
分派事件已由一线发出,未被接受
返回事件分配不当,返回服务专员
一线处理中已分派到一线处理中
二线处理中已分派到二线并接受
RFC已通过RFC提交解决方案
完成一线/二线已解决事件
结束事件已关闭(服务专员)

6. 事件管理流程描述

6.1. 普通事件流程

序号

步骤

名称

责任人说明
1事件接受与记录服务专员
  • 服务专员对来自用户和系统自动产生的事件进行详细记录,其中包括故障/告警/服务请求
2分类与支持,调度分派服务专员
  • 在接收到事件后进行分类记录
  • 尝试直接解决用户提出的请求
  • 无法解决则进行调度分派
3分析处理一线人员
  • 技术部一线支持人员接受事件,进行调查诊断,尝试解决
  • 事件解决后,记录事件解决方案
4二线调查诊断二线人员
  • 二线支持人员接受事件,进行调查诊断,尝试解决
  • 事件解决后,记录事件解决方案
  • 如果二线支持认为需要三线进行处理,即升级为问题
  • 二线支持人员接受到来自服务专员的紧急事件后,根据事件优先级别标准再次确认事件是否为紧急事件
  • 如果优先级确实紧急,则通知相应的管理层,并立即升级到事件经理,紧急事件处理子流程
6解决和恢复

一线支持

二线支持

  • 在事件得到解决后,各线支持人员负责详细记录事件解决过程及方案并更新事件信息
7反馈客户/关闭

一线支持

二线支持

  • 服务专员与用户确认事件是否已得到解决,如果解决,事件以成功解决或变通方法解决而关闭;否则,事件以不成功关闭,重新开事件记录,并与原记录作关联,分派到原处理人员继续处理
  • 服务专员在关闭事件的同时必须确认事件单记录的业务恢复时间是否准确
  • 其它由一线或二线人员自行创建的事件单,则由开单人负责关闭
8审核并提交进入知识库事件经理
  • 对已关闭的工单进行审核并挑选加入知识库
9紧急事件处理流程事件经理
  • 事件经理负责协调紧急事件的处理,具体过程见紧急事件处理子流程

6.2. 紧急事件流程

序号步骤名称说明
1召集应急小组,协调应急会议
  • 1. 事件经理主持应急会议,并组织讨论、协调各方资源,分析紧急事件处理方案;
  • 2. 与此同时,事件经理还需将紧急事件上报上级公司信息部门。
2判断是否属于应急预案中的事件?
  • 应急小组和相关厂商根据紧急事件现象和影响程度,判断是否需要启动相应系统的应急预案;
  • 如果没有应急预案,则进入4组织相关专家共同分析紧急事件,制定处理方案并处理;
  • 如果有应急预案,则进入3按照应急预案处理。
3按照应急预案处理
  • 根据各系统制定的应急预案中的实施步骤,处理紧急事件。
4组织相关厂商共同分析,制定处理方案并处理
  • 应急小组负责组织相关厂商共同分析紧急事件,制定相应的处理方案;
  • 处理方案在实施前应得到应急小组和相关领导的认可;
  • 事件处理过程中如果需要中断业务或对系统的IT组件产生变更,则需要按照紧急变更管理流程的定义和要求,提出紧急变更请求。
5紧急事件解除确认?
  • 在紧急事件处理方案实施后,应急小组、相关专家和相关部门对紧急事件是否解除进行确认;
  • 紧急事件如果没有解除,则重新进入4组织相关专家共同分析紧急事件,制定处理方案并处理;
  • 如果解除,则进入6紧急事件善后处理和总结分析。
6善后处理和通报
  • 紧急事件解除后,应向申告方、公司相关领导简要报告紧急事件处理过程,解决方法,事件解除时间,业务恢复情况;
  • 对于影响度为高的紧急事件,必须提交《重大事件报告》;
  • 紧急事件的处理人需要创建一个新问题,将紧急事件处理过程的详细信息记录到问题单中,提交到问题经理,由问题经理组织相关专家进行问题根源的分析。

7. 表单和模板

名称版本负责人说明
事件记录V1.0沈XX 
事件管理报告V1.0沈XX对流程运行情况的报告

8. 关键绩效指标(KPI)

事件管理的可选指标包括:

绩效指标目标值衡量方式频度负责人
事件总数 统计  
事件的平均解决时间4小时统计每日 
按优先级计算的平均解决时间 统计每日 
一线解决率50%统计每日 
超时未解决的事件数量 统计每日 
超时事件解决率10%统计每日 
事件一次解决率80%统计每日 
事件成功关闭数量比率98%统计每日 
正确转交的事件数量比率95%统计每日 

9. 流程质量控制

 

Tags:
Created by superadmin on 2024/10/30, 20:32
     
深圳市艾拓先锋企业管理咨询有限公司