Changes for page 27 某地铁信息化基础架构平台建设IT服务标准化管理咨询ITIL事件管理流程设计说明书
Last modified by superadmin on 2024/11/01, 21:20
Change comment:
There is no comment for this version
Summary
Details
- Page properties
-
- Content
-
... ... @@ -18,7 +18,12 @@ 18 18 ** 故障处理情况 19 19 ** 支持效率 20 20 21 +(% class="wikigeneratedid" %) 22 += = 21 21 24 +(% class="wikigeneratedid" %) 25 += = 26 + 22 22 = **2. 流程范围** = 23 23 24 24 事件管理流程包括: ... ... @@ -33,9 +33,6 @@ 33 33 * 监控系统触发的告警事件 34 34 * 日常运维过程中发现的所有故障 35 35 36 - 37 - 38 - 39 39 = **3. 流程主要内容** = 40 40 41 41 事件管理流程主要活动包括以下几个方面: ... ... @@ -70,9 +70,9 @@ 70 70 71 71 当事件处理超过预期时限,将自动通知处理人员和相应管理层,以引起相关人员和管理人员的重视和参与。 72 72 73 -== 75 +== == 74 74 75 -== 77 +== == 76 76 77 77 = **4. 流程执行原则** = 78 78 ... ... @@ -80,7 +80,7 @@ 80 80 81 81 事件管理流程的执行原则包含了以下7个方面: 82 82 83 -== 85 +== == 84 84 85 85 == 4.1 常规原则 == 86 86 ... ... @@ -90,6 +90,8 @@ 90 90 * 事件经理应该每月产生事件管理报表。对反复发生的事件和变通方法解决的事件,举行定期的事件管理会议对这些事件进行评估,决定是否发起问题单以从根本上解决某些事件; 91 91 * 事件经理每半年对流程进行回顾,回顾内容包括流程关键衡量指标和流程执行效率,以改进事件管理流程。 92 92 95 +(% class="wikigeneratedid" %) 96 +== == 93 93 94 94 == 4.2 流程关联原则 == 95 95 ... ... @@ -104,11 +104,15 @@ 104 104 ** 事件处理过程中,可以通过配置管理查询相关的配置项信息以及该配置项历史上发生的事件、问题或变更,来帮助故障的定位; 105 105 ** 事件处理过程中,如果可以将故障定位到某个配置项,则必须将事件单与该配置项关联。 106 106 111 +(% class="wikigeneratedid" %) 112 +== == 107 107 108 108 == 4.3 所有权原则 == 109 109 110 110 * 所有权原则用来确保每个事件在任何时段都有适当的人员负责,协调员和事件经理必须确保事件得到有效跟踪与解决,并统一由质控员负责对事件单进行验证后关闭。 111 111 118 +(% class="wikigeneratedid" %) 119 +== == 112 112 113 113 == 4.4 重分派原则 == 114 114 ... ... @@ -116,6 +116,8 @@ 116 116 ** 协调员可以将事件单重新分配给远程员或其他二线支持人员; 117 117 ** 事件重分派时要求协调员进行重分派原因的沟通。 118 118 127 +(% class="wikigeneratedid" %) 128 +== == 119 119 120 120 == 4.5 重复事件原则 == 121 121 ... ... @@ -124,6 +124,8 @@ 124 124 * 重复的事件信息必须被标识,并且不计入事件流程的关键衡量指标; 125 125 * 由远程员或二线支持人员负责标识重复事件。 126 126 137 +(% class="wikigeneratedid" %) 138 +== == 127 127 128 128 == 4.6 补单原则 == 129 129 ... ... @@ -130,6 +130,8 @@ 130 130 * 紧急事件在处理完成后必须补录事件单,记录详细解决过程及方案; 131 131 * 重大事件也要在处理完成后,总结回顾处理过程,在事件单补录详细的处理信息、解决方案及相关改进点。 132 132 145 +(% class="wikigeneratedid" %) 146 +== == 133 133 134 134 == 4.7 关闭原则 == 135 135 ... ... @@ -141,6 +141,8 @@ 141 141 * 已关闭的事件单不允许重开。如果事件重复发生,则创建一个新的事件单; 142 142 * 对于已解决事件单,如果在确认时如无法联系用户,由质控员判断并决定是否关闭交互并关闭该事件。 143 143 158 +(% class="wikigeneratedid" %) 159 +== == 144 144 145 145 == 4.8 升级原则 == 146 146 ... ... @@ -152,8 +152,8 @@ 152 152 * 远程员和二线支持人员在必要时通知协调员,将事件升级为紧急事件; 153 153 * 只有协调员和事件经理才能变更事件的优先级。 154 154 171 +== == 155 155 156 -== == 157 157 158 158 = **5. 流程详述** = 159 159 ... ... @@ -201,6 +201,8 @@ 201 201 二线支持 202 202 ))) 203 203 220 +(% class="wikigeneratedid" %) 221 +== == 204 204 205 205 == 5.2 分派事件单 == 206 206 ... ... @@ -216,8 +216,6 @@ 216 216 |8.2.1.3|拒绝事件|如发现事件单信息不完整,可退回服务台完善。|事件单信息|拒绝事件单|IT运维部|协调员 217 217 |8.2.1.4|分派事件|根据实际情况分派事件单给一线或二线处理|事件单信息|分派事件|IT运维部|协调员 218 218 219 - 220 - 221 221 == 5.3 调查和诊断 == 222 222 223 223 ... ... @@ -226,18 +226,16 @@ 226 226 227 227 流程活动: 228 228 229 -|序号|活动|(% style="width:6 11px" %)说明|(% style="width:133px" %)输入|(% style="width:151px" %)输出|(% style="width:102px" %)负责部门|(% style="width:185px" %)角色230 -|8.2.2.1|是否接受|(% style="width:6 11px" %)是否接受事件单的分派?|(% style="width:133px" %)待办事件单|(% style="width:151px" %)无|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持231 -|8.2.2.2|收集信息及调查原因|(% style="width:6 11px" %)收集事件的相关信息,检查事件单是否与其他问题单变更单有关联, |(% style="width:133px" %)事件单信息|(% style="width:151px" %)更新的事件单|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持232 -|8.2.2.3|由变更引起?|(% style="width:6 11px" %)判断是否与其他正在处理的变更单相关|(% style="width:133px" %)更新的事件单|(% style="width:151px" %)无|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持233 -|8.2.2.4|关联相关变更|(% style="width:6 11px" %)如果相关,需要把事件单与其关联|(% style="width:133px" %)事件单|(% style="width:151px" %)关联的变更单|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持234 -|8.2.2.5|与未决问题匹配?|(% style="width:6 11px" %)判断是否与其他正在处理的问题单相关|(% style="width:133px" %)更新的事件单|(% style="width:151px" %)无|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持235 -|8.2.2.6|关联相关问题|(% style="width:6 11px" %)如果相关,需要把事件单与其关联|(% style="width:133px" %)事件单|(% style="width:151px" %)关联的问题单|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持236 -|8.2.2.7|是否超时?|(% style="width:6 11px" %)系统会实时自动判断事件单在支持人员处理的过程中是否超时,如超时会分派给协调员处理|(% style="width:133px" %)更新的事件单|(% style="width:151px" %)协调员待办事件单|(% style="width:102px" %)IT运维部|(% style="width:185px" %)系统237 -|8.2.2.8|是否能自行解决?|(% style="width:6 11px" %)在充分调研后,尽快判断是否能自行解决事件,如不能处理需要转派回协调员|(% style="width:133px" %)更新的事件单|(% style="width:151px" %)接受或拒绝事件单|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持245 +|序号|(% style="width:188px" %)活动|(% style="width:680px" %)说明|(% style="width:133px" %)输入|(% style="width:151px" %)输出|(% style="width:102px" %)负责部门|(% style="width:185px" %)角色 246 +|8.2.2.1|(% style="width:188px" %)是否接受|(% style="width:680px" %)是否接受事件单的分派?|(% style="width:133px" %)待办事件单|(% style="width:151px" %)无|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持 247 +|8.2.2.2|(% style="width:188px" %)收集信息及调查原因|(% style="width:680px" %)收集事件的相关信息,检查事件单是否与其他问题单变更单有关联, |(% style="width:133px" %)事件单信息|(% style="width:151px" %)更新的事件单|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持 248 +|8.2.2.3|(% style="width:188px" %)由变更引起?|(% style="width:680px" %)判断是否与其他正在处理的变更单相关|(% style="width:133px" %)更新的事件单|(% style="width:151px" %)无|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持 249 +|8.2.2.4|(% style="width:188px" %)关联相关变更|(% style="width:680px" %)如果相关,需要把事件单与其关联|(% style="width:133px" %)事件单|(% style="width:151px" %)关联的变更单|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持 250 +|8.2.2.5|(% style="width:188px" %)与未决问题匹配?|(% style="width:680px" %)判断是否与其他正在处理的问题单相关|(% style="width:133px" %)更新的事件单|(% style="width:151px" %)无|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持 251 +|8.2.2.6|(% style="width:188px" %)关联相关问题|(% style="width:680px" %)如果相关,需要把事件单与其关联|(% style="width:133px" %)事件单|(% style="width:151px" %)关联的问题单|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持 252 +|8.2.2.7|(% style="width:188px" %)是否超时?|(% style="width:680px" %)系统会实时自动判断事件单在支持人员处理的过程中是否超时,如超时会分派给协调员处理|(% style="width:133px" %)更新的事件单|(% style="width:151px" %)协调员待办事件单|(% style="width:102px" %)IT运维部|(% style="width:185px" %)系统 253 +|8.2.2.8|(% style="width:188px" %)是否能自行解决?|(% style="width:680px" %)在充分调研后,尽快判断是否能自行解决事件,如不能处理需要转派回协调员|(% style="width:133px" %)更新的事件单|(% style="width:151px" %)接受或拒绝事件单|(% style="width:102px" %)IT运维部|(% style="width:185px" %)一线二线支持 238 238 239 - 240 - 241 241 == 5.4 记录解决方案 == 242 242 243 243 ... ... @@ -254,6 +254,8 @@ 254 254 |8.2.3.5|发起请求?|判断是否要发起请求|更新的事件单|请求单|IT运维部|一线二线支持 255 255 |8.2.3.6|记录解决方案|记录初步的故障解决方案|更新的事件单|解决方案|IT运维部|一线二线支持 256 256 271 +(% class="wikigeneratedid" %) 272 +== == 257 257 258 258 == 5.5 实施解决方案 == 259 259 ... ... @@ -270,6 +270,8 @@ 270 270 |8.2.4.4|是否需要升级?|判断是否要对错误升级|实施解决方案|无|IT运维部|一线二线支持 271 271 |8.2.4.5|重分派给其他人或支持组|针对权限不足或者处理过程发生错误的情况,都应及时把事件单转回协调员处理|实施解决方案|转派的事件单|IT运维部|一线二线支持 272 272 289 +(% class="wikigeneratedid" %) 290 +== == 273 273 274 274 == 5.6 关闭事件单 == 275 275 ... ... @@ -285,6 +285,8 @@ 285 285 |8.2.5.3|事件由监控系统引起?|事件单关闭后,系统会自动判断事件单是否来自监控系统告警|关闭的事件单|事件解决状态|IT运维部|系统 286 286 |8.2.5.4|事件由日常运维引起?|事件单关闭后,系统会自动判断事件单是否来自日常运维单,如果是则返回事件单状态给日常工单。|关闭的事件单|事件解决状态|IT运维部|系统 287 287 306 +(% class="wikigeneratedid" %) 307 +== == 288 288 289 289 == 5.7 紧急/重大事件处理子流程 == 290 290 ... ... @@ -325,16 +325,16 @@ 325 325 326 326 流程活动: 327 327 328 -|序号|活动|(% style="width: 894px" %)说明|(% style="width:240px" %)角色329 -|8.2.6.1|召集应急工作组,讨论决策|(% style="width: 894px" %)事件经理主持会议,并组织讨论、分析紧急/重大事件的级别和处理方案|(% style="width:240px" %)(((348 +|(% style="width:73px" %)序号|(% style="width:291px" %)活动|(% style="width:940px" %)说明|(% style="width:240px" %)角色 349 +|(% style="width:73px" %)8.2.6.1|(% style="width:291px" %)召集应急工作组,讨论决策|(% style="width:940px" %)事件经理主持会议,并组织讨论、分析紧急/重大事件的级别和处理方案|(% style="width:240px" %)((( 330 330 事件经理 331 331 332 332 重大事故评定委员会 333 333 ))) 334 -|8.2.6.2|是否有应急预案?|(% style="width: 894px" %)根据紧急事件现象和所属系统,检查是否有相应系统的应急预案?|(% style="width:240px" %)重大事故评定委员会335 -|8.2.6.3|按照应急预案处理|(% style="width: 894px" %)根据各系统制定的应急预案中的实施步骤,处理紧急事件|(% style="width:240px" %)重大事故评定委员会336 -|8.2.6.4|是否II级或I级事件?|(% style="width: 894px" %)判断事件级别,确定是否需要归口业务部门参与处理。|(% style="width:240px" %)重大事故评定委员会337 -|8.2.6.5|组织信管部人员共同分析、制定恢复计划并实施方案|(% style="width: 894px" %)(((354 +|(% style="width:73px" %)8.2.6.2|(% style="width:291px" %)是否有应急预案?|(% style="width:940px" %)根据紧急事件现象和所属系统,检查是否有相应系统的应急预案?|(% style="width:240px" %)重大事故评定委员会 355 +|(% style="width:73px" %)8.2.6.3|(% style="width:291px" %)按照应急预案处理|(% style="width:940px" %)根据各系统制定的应急预案中的实施步骤,处理紧急事件|(% style="width:240px" %)重大事故评定委员会 356 +|(% style="width:73px" %)8.2.6.4|(% style="width:291px" %)是否II级或I级事件?|(% style="width:940px" %)判断事件级别,确定是否需要归口业务部门参与处理。|(% style="width:240px" %)重大事故评定委员会 357 +|(% style="width:73px" %)8.2.6.5|(% style="width:291px" %)组织信管部人员共同分析、制定恢复计划并实施方案|(% style="width:940px" %)((( 338 338 如III级、IV级事件,重大事故评定委员会负责组织管部与相关供应商共同分析紧急事件,制定相应的恢复计划和处理方案,处理方案在实施前应得到重大事故评定委员会和相关领导的认可; 339 339 340 340 事件处理过程中如果需要中断业务或对系统的IT组件产生变更,则需要按照紧急变更管理流程的定义和要求,提出紧急变更请求 ... ... @@ -343,7 +343,7 @@ 343 343 344 344 信管部归口人 345 345 ))) 346 -|8.2.6.6|组织信管部及归口业务部门人员共同分析、制定恢复计划并实施方案|(% style="width: 894px" %)(((366 +|(% style="width:73px" %)8.2.6.6|(% style="width:291px" %)组织信管部及归口业务部门人员共同分析、制定恢复计划并实施方案|(% style="width:940px" %)((( 347 347 如II级、I级事件,重大事故评定委员会负责组织信管部、归口业务部门与相关供应商共同分析紧急事件,制定相应的恢复计划和处理方案,处理方案在实施前应得到重大事故评定委员会和相关领导的认可; 348 348 349 349 事件处理过程中如果需要中断业务或对系统的IT组件产生变更,则需要按照紧急变更管理流程的定义和要求,提出紧急变更请求 ... ... @@ -354,12 +354,12 @@ 354 354 355 355 归口业务部门 356 356 ))) 357 -|8.2.6.7|事件解除?|(% style="width: 894px" %)确定故障是否已排除,如已解除,转善后处理流程;如未解除,则需要由事件经理继续协调研究解决方案。|(% style="width:240px" %)(((377 +|(% style="width:73px" %)8.2.6.7|(% style="width:291px" %)事件解除?|(% style="width:940px" %)确定故障是否已排除,如已解除,转善后处理流程;如未解除,则需要由事件经理继续协调研究解决方案。|(% style="width:240px" %)((( 358 358 事件经理 359 359 360 360 重大事故评定委员会 361 361 ))) 362 -|8.2.6.8|善后处理和通报|(% style="width: 894px" %)(((382 +|(% style="width:73px" %)8.2.6.8|(% style="width:291px" %)善后处理和通报|(% style="width:940px" %)((( 363 363 事件解决后,信管部和重大事故评定委员会应向用户、公司相关领导报告事件处理过程,解决方法,事件解除时间,业务恢复情况。 364 364 365 365 事件处理人在流程平台确定事件解决时间,填写解决方案。 ... ... @@ -371,9 +371,6 @@ 371 371 信管部归口人 372 372 ))) 373 373 374 - 375 - 376 - 377 377 = **6. 关键角色、职责定义** = 378 378 379 379 |角色|职责|建议人员或岗位 ... ... @@ -429,9 +429,6 @@ 429 429 )))|IT运维部 430 430 |质控员|合并至交互流程质控员| 431 431 432 - 433 - 434 - 435 435 = **7. 流程相关定义** = 436 436 437 437 == 7.1 事件单信息项 == ... ... @@ -520,8 +520,6 @@ 520 520 |23|关闭代码|此项是在服务台质控员在回访时,同用户确定的最终结果 521 521 |24|解决方案|提供对突发事件解决方案的说明。 522 522 523 - 524 - 525 525 == 7.2 事件影响度 == 526 526 527 527 |(% rowspan="2" %)**影响度**|(% rowspan="2" %)**定义**|(% colspan="5" %)**判断依据** ... ... @@ -547,8 +547,6 @@ 547 547 |(% rowspan="2" %)4-微小|(% rowspan="2" %)微小故障指的是不会影响业务连续性的故障。例如键盘鼠标损坏,无法连接INTERNET等故障。|N/A|N/A|二周内|桌面|五个或以上用户 548 548 |N/A|N/A|5分钟内|基础架构预警信号|一个或以上 549 549 550 - 551 - 552 552 == 7.3 事件紧急度 == 553 553 554 554 |紧急度编码|紧急时间标准|描述 ... ... @@ -557,8 +557,6 @@ 557 557 |3-一般|48小时|服务需48小时内提供(恢复) 558 558 |4-略微紧急|72小时|服务需72小时内提供(恢复) 559 559 560 - 561 - 562 562 == 7.4 事件优先级 == 563 563 564 564 |(% colspan="2" rowspan="2" %)优先级|(% colspan="4" %)影响度 ... ... @@ -568,8 +568,6 @@ 568 568 |3-一般|2|3|3-中|4 569 569 |4-略微紧急|3|3|4|4-低 570 570 571 - 572 - 573 573 == 7.5 事件来源 == 574 574 575 575 给事件分级是事件管理的一个关键要素,事件的分级决定处理这个事件的顺序及所提供的资源。 ... ... @@ -579,8 +579,6 @@ 579 579 |2|监控告警|监控工具发现的告警事件 580 580 |3|日常运维发现|IT运维部日常运维检查产生事件 581 581 582 - 583 - 584 584 == 7.6 事件性质 == 585 585 586 586 |类别|信息项|说明 ... ... @@ -602,8 +602,6 @@ 602 602 |突发事件|安全|安全事件/ 消息 603 603 |突发事件|安全|病毒警报 604 604 605 - 606 - 607 607 == 7.7 事件分类 == 608 608 609 609 |类别|子类|一级模块 ... ... @@ -685,8 +685,6 @@ 685 685 |网络| | 686 686 |其他| | 687 687 688 - 689 - 690 690 == 7.8 事件关闭代码 == 691 691 692 692 |编号|代码|描述 ... ... @@ -697,9 +697,6 @@ 697 697 对于该类事件,需要重新开单,并分配给原来处理该事件的人员进行处理。 698 698 ))) 699 699 700 - 701 - 702 - 703 703 = **8. 与其他流程的关系** = 704 704 705 705 ... ... @@ -782,19 +782,15 @@ 782 782 比率:(数量1-数量2 ) / 数量1 × 100 % 783 783 ))) 784 784 785 - 786 - 787 - 788 788 = **10. 功能性需求** = 789 789 790 790 * ITSM平台与监控平台集成,监控系统生成的告警事件自动在ITSM平台生成事件单,并由协调员分派处理人员; 791 791 * 分派和转派事件单、创建变更单或请求单等人员转换的节点需要有短信通知提醒; 792 792 787 += = 793 793 794 -= 789 += = 795 795 796 -= = 797 - 798 798 = **11. 流程质量控制** = 799 799 800 800 ... ... @@ -810,15 +810,11 @@ 810 810 |4|(% style="width:126px" %)执行改进计划|(% style="width:1049px" %)调动资源,组织相关人员执行被批准的改进计划|(% style="width:330px" %)流程经理、流程执行人员 811 811 |5|(% style="width:126px" %)回顾|(% style="width:1049px" %)对改进后的结果进行回顾,评估改进计划是否成功,存在哪些待改进项;依据PDCA方法论再次执行步骤1对现有流程进行评估,对流程进行持续改进,起到对流程质量控制的作用|(% style="width:330px" %)流程经理、流程执行人员 812 812 813 - 814 814 * 需要调整的既有文件及调整要求 815 815 816 816 |**序号**|**既有文件名**|**调整内容** 817 817 |1|《大面积报障定义》| 818 818 819 - 820 - 821 - 822 822 = **附录 评审修改记录** = 823 823 824 824 ... ... @@ -867,5 +867,4 @@ 867 867 年 月 日 年 月 日 868 868 ))) 869 869 870 - 871 871