从版本< 9.1 >
由superadmin编辑
在2024/10/13, 16:06上
到版本
由superadmin编辑
在2024/10/13, 16:09上
< >
修改评论 该版本没有评论

Summary

Details

Icon Page properties
标题
... ... @@ -1,0 +1,1 @@
1 +20 某市商品交易所问题管理流程设计说明书
... ... @@ -1,0 +1,1 @@
1 +G 参考资料.ITIL实施项目资料.ITIL实施项目流程设计方案集.问题管理.WebHome
Content
... ... @@ -1,0 +1,702 @@
1 +[[返回本章节索引 >>http://itil4hub.cn/bin/view/G%20%E5%8F%82%E8%80%83%E8%B5%84%E6%96%99/ITIL%E5%AE%9E%E6%96%BD%E9%A1%B9%E7%9B%AE%E8%B5%84%E6%96%99/ITIL%E5%AE%9E%E6%96%BD%E9%A1%B9%E7%9B%AE%E6%B5%81%E7%A8%8B%E8%AE%BE%E8%AE%A1%E6%96%B9%E6%A1%88%E9%9B%86/%E9%97%AE%E9%A2%98%E7%AE%A1%E7%90%86/]] 阅读下一章
2 +
3 +
4 +
5 +文档信息
6 +
7 +|项目名称:|(% colspan="3" %)XX商品交易所IT服务管理项目
8 +|项目经理:| |文档版本编号:|
9 +|项目阶段:| |文档提交日期:|
10 +| 起草人:|邝XX|文档起草日期:|
11 +|复审人:| |复审日期:|
12 +
13 +分发名单
14 +
15 +| 来自 (From)|日期|电话/ 传真
16 +| | |
17 +
18 +| 给 (To)|操作*|截止日期|电话/ 传真
19 +| | | |
20 +
21 + //*操作类型:批准,复审,通知,存档,所需行动,参加会议,其它 (请指明 )//
22 +
23 +
24 +版本历史信息
25 +
26 +|版本编号|版本日期|创建/修改人|说明|文件名
27 +|V0.1|2011-9-12|邝XX|创建|XX商品交易所-问题管理流程设计说明书 _V0.1.docx
28 +|V0.9|2011-12-5|邝XX| |XX商品交易所-问题管理流程设计说明书 _V0.9.docx
29 +|(((
30 +V1.0
31 +)))|(((
32 +2012-6-14
33 +)))|(((
34 +孙XX
35 +)))|(((
36 +定稿
37 +)))|(((
38 +XX商品交易所-问题管理流程设计说明书 _V1.0.docx
39 +)))
40 +|(((
41 +V1.1
42 +)))|(((
43 +2012-11-15
44 +)))|(((
45 +林XX、邝XX
46 +)))|(((
47 +根据平台实现更新流程基本信息
48 +)))|(((
49 +XX商品交易所-问题管理流程设计说明书 _V1.1.docx
50 +)))
51 +
52 +(% class="wikigeneratedid" %)
53 += =
54 +
55 +(% class="wikigeneratedid" %)
56 += =
57 +
58 += 1综述 =
59 +
60 +== 1.1文档简介 ==
61 +
62 +本文档是XX公司和XX商品交易所技术运维中心(以下简称XXX技术运维中心)共同制定的问题管理流程的设计文档。通过该文档,可以帮助XXX技术运维中心的解决IT环境的问题,为XXX技术运维中心业务的快速发展提供更优质的IT服务。
63 +
64 +本文档的内容是XX公司依据目前XXX技术运维中心IT服务状况而制定的问题管理流程的说明,以后进一步的更新将由XXX技术运维中心负责。
65 +
66 +
67 +== 1.2适用范围与对象 ==
68 +
69 +本文档作为本次项目的问题管理流程详细设计的交付物,读者对象为与问题管理流程相关的所有技术与管理人员。
70 +
71 +
72 +== 1.3重要参考资料 ==
73 +
74 +ITIL(IT Infrastructure Library )V3.0。
75 +
76 +《XXX事件、变更级别说明》。
77 +
78 +
79 +== 1.4相关术语 ==
80 +
81 +* ITIL(IT Infrastructure Library )
82 +
83 +是英国政府在1987年制定的有关IT服务管理的方法论,现已成为事实上的IT管理标准。
84 +
85 +* ISO20000
86 +
87 +国际标准组织ISO/IEC在2005年底发布的全球IT服务管理标准,包括服务实施、控制、发布、解决、关系管理5个域13个流程,强调持续改进过程。ISO20000可以提供针对企业或部门的国际标准认证。
88 +
89 +* 服务台(Service Desk)
90 +
91 +服务台从根本上来说是提供了用户和IT部门的唯一接口。此项功能常通过集中方式提供服务。服务台的根本目的是提供初始支持,并通过变通方法、解决方案或升级到一线、二线支持等手段帮助用户恢复到正常工作状态。
92 +
93 +* 事件管理( Incident Management)
94 +
95 +ITIL流程之一,事件管理负责解决所有的IT事件、问题和用户请求。它的目的是尽快恢复被中断或受到影响的IT服务,所以它的特点往往是以解决表征现象为目的,而不在于查找根本原因。
96 +
97 +* 问题管理(Problem Management)
98 +
99 +ITIL流程之一,问题管理负责解决重大紧急事件或具有相同症状的一组事件。它的目的是找出事件的根本原因,并通过解除根本原因从而使类似事件不再发生。同时问题管理流程也负责预防事件的发生。
100 +
101 +* 配置管理(Configuration Management)
102 +
103 +ITIL 流程之一,配置管理负责描述,跟踪和汇报IT基础架构中每一个设备或系统的管理流程。这些设备和系统被称为配置项(CI)。每一个CI必须有效管理,跟踪和控制以支持公司的IT服务和基础设施成功运行。
104 +
105 +* 配置管理数据库(CMDB - Configuration Management Database)
106 +
107 +是在配置管理流程中用于记录企业所有IT相关配置项信息及其相互关系而建立的数据库。
108 +
109 +* 变更管理(Change Management)
110 +
111 +ITIL流程之一,变更管理通过控制和管理服务相关的变更, 使变更对生产环境可能的影响和风险降到最小,从而提高IT环境的整体稳定性。
112 +
113 +* 服务水平管理(Service Level Management)
114 +
115 +服务级别管理流程通过签订和维护服务水平协议(SLA)的方式,确保以协定的质量和成本向客户交付既定的服务。同时该流程维护、监控和持续改进协定的服务级别。
116 +
117 +* 日常运维管理(Operation and maintenance management)
118 +
119 +日常运维管理用来支持运行维护人员需要定期重复或临时发起的,需要人工参与执行或检查的日常任务,使日常运维工作规范化,并最大程度实现自动化。
120 +
121 +* 知识管理(Knowledge management)
122 +
123 +为日常使用、培训和丰富组织文化而设计的进行收集、组织、结构化和分发知识活动的集合,在整个服务生命周期中,通过提供充足、可信、可靠的知识,提升服务和组织决策的质量和效率。
124 +
125 +
126 +
127 += 2问题管理流程介绍 =
128 +
129 +== 2.1流程目的 ==
130 +
131 +问题管理目标是通过主动的识别和分析故障的起因,找到问题的根源并发起消除错误的行动,管理各种问题,最小化对业务的负面影响,并防止与这些错误相关故障的复发。同时提高大商所技术运维中心的问题分析和解决能力,降低问题响应和处理时间,提高IT服务的质量、连续性和客户的满意度。
132 +
133 +
134 +== 2.2流程主要内容 ==
135 +
136 +问题管理流程着重于消除事件或减少事件发生,确定事件的根本原因。主要活动包括分析事件、找出问题、分派问题、确定根本原因以及找出解决方案、回顾及关闭,以消除事件或在其发生时降低对用户或业务的影响。其主要内容如下:
137 +
138 +* 分析事件 
139 +
140 +定期分析事件,找出潜在问题。
141 +
142 +* 生成问题记录
143 +
144 +在系统中生成问题记录并把所有相关事件与此记录关联起来。
145 +
146 +* 分派 
147 +
148 +根据问题内容将问题记录分派给适当的技术小组或技术人员。
149 +
150 +* 根本原因分析 
151 +
152 +被分派的小组人员将调查问题以期找出其原因,制定解决方案、变通方法或提出预防性措施,以消除产生原因,或在重发时使其影响力最小化。 记录必须被更新以反映它是已定位原因状态,并且把任何变通方法、避免或最小化负面影响的动作行为也记录下来。
153 +
154 +* 开发、确认、提出实施解决方案
155 +
156 + 对问题的解决方案进行评估、测试,提出变更请求(RFC)或实施具体的解决方案。
157 +
158 +* 回顾
159 +
160 +对问题的解决方案进行回顾,确认解决方案达到了预期的效果。
161 +
162 +* 总结及关闭 
163 +
164 +确认问题的信息记录填写完整,并关闭问题记录。
165 +
166 +
167 +== 2.3 业务价值 ==
168 +
169 +问题管理流程有助于确定永久解决方案,进而减少故障数量和解决时间:
170 +
171 +1. 利于提升IT服务的可用性;
172 +1. 为服务台提供了故障解决方案和应急措施,提高服务台的一次解决率和工作效率;
173 +1. 减少救火或解决重复故障的成本。
174 +
175 +(% class="wikigeneratedid" %)
176 += =
177 +
178 +(% class="wikigeneratedid" %)
179 += =
180 +
181 += 3问题管理的策略与原则 =
182 +
183 +== 3.1常规原则 ==
184 +
185 +* 建立独立问题管理流程,应该与事件管理流程相对独立,当故障消除,服务恢复后,关闭事件单。如需进一步分析事件根本原因,应转入问题管理流程。
186 +* 应该每半年对问题管理流程的流程关键衡量指标、流程执行效率、流程支撑工具有效性等进行回顾,以改进和优化流程。
187 +* 应该每月定期回顾和产生问题管理报表,对没有解决的问题,应该举行定期的问题管理会议对这些问题进行评估。
188 +
189 +== ==
190 +
191 +== 3.2创建原则 ==
192 +
193 +* 重大事件在处理结束后,由事件经理提交问题单,进入问题管理流程做进一步分析;
194 +* 其它事件在恢复服务后仍需后续分析处理的,应结束事件单,创建问题单;
195 +* 维护中发现的潜在故障,尚未影响业务的,应建立问题单;
196 +* 事件管理流程定期提供事件分析报表,标识可能问题。
197 +
198 +== ==
199 +
200 +== 3.3问题关闭原则 ==
201 +
202 +问题单在实施了解决方案之后,需要经过一段时间的回顾,由问题处理专家和问题经理一起来回顾解决方案是否达到了预期的效果,如果成功的实施,则提交给问题经理,由问题经理确认问题信息记录完整,关闭问题。
203 +
204 +== ==
205 +
206 +== 3.4流程关联原则 ==
207 +
208 +* 和事件管理的关联
209 +** 事件在恢复服务后,需要进一步分析的都应该创建问题单(问题单必须和事件单建立关联)
210 +* 和变更管理的关联
211 +** 问题处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提交变更请求单(变更单必须和问题单建立关联),变更完成后,继续问题单的处理
212 +* 和配置管理的关联
213 +** 问题处理过程中,可以通过配置管理查询相关的配置项信息
214 +** 问题处理过程中,如果可以将根本原因定位到某个配置项,则必须将问题单与该配置项关联
215 +
216 +(% class="wikigeneratedid" %)
217 += =
218 +
219 +(% class="wikigeneratedid" %)
220 += =
221 +
222 += 4问题管理的人员角色和职责 =
223 +
224 +XXX问题管理流程设计的角色包含问题提交人、问题经理、问题管理委员会、问题处理专家。
225 +
226 +== ==
227 +
228 +== 4.1问题管理流程负责人 ==
229 +
230 +流程负责人通过从宏观上监控流程,来确保问题流程被正确地执行。当流程不能够适应大商所的情况时,流程负责人必须及时对此进行分析、找出缺陷、进行改进,从而实现可持续提高。
231 +
232 +**职责:**
233 +
234 +1. 确保问题管理流程能够取得管理层的参与和支持;
235 +1. 总体上管理和监控流程,对问题管理流程的规划、实施、监督、改进负责;
236 +1. 保持与其他流程负责人的定期沟通;
237 +1. 定期召开部门级别的流程回顾会议(如每个季度1次);
238 +1. 进行流程优化的发起,负责决定优化活动的负责人,并检查跟踪执行情况。
239 +
240 +**技能要求:**
241 +
242 +1. 深刻理解问题管理流程;
243 +1. 能够很好地理解业务对于问题管理的需求;
244 +1. 有决策权,能够确保问题管理流程设计要求在问题执行中得到贯彻和执行;
245 +1. 具有良好的沟通技能,能够取得公司高层的支持,获得所需资源。
246 +
247 +== ==
248 +
249 +== 4.2问题提交人 ==
250 +
251 +问题提交人是问题的发起人;可能的人员包括一、二线支持维护人员,事件、问题流程经理。
252 +
253 +**职责:**
254 +
255 +1. 从日常维护、巡检中发现问题
256 +1. 故障消除、服务恢复后,需要进一步分析的事件转入问题流程
257 +1. 主动分析历史事件中存在的潜在问题
258 +1. 记录、提交问题
259 +
260 +**技能要求:**
261 +
262 +1. 具备较强的技术专业知识;
263 +1. 明确事件管理与问题管理的区别;
264 +
265 +(% class="wikigeneratedid" %)
266 +== ==
267 +
268 +== 4.3问题经理 ==
269 +
270 +问题经理负责协调日常的问题管理工作,包括对问题的审核、监控、所需资源的协调、定期产生报表等。
271 +
272 +**职责:**
273 +
274 +1. 定期组织相关人员对事件记录进行分析,发现潜在问题
275 +1. 确认、审核问题
276 +1. 监视问题的诊断、分析和处理过程
277 +1. 必要时协调所需资源
278 +1. 定期制定问题报表,提供正确决策信息
279 +
280 +**技能要求:**
281 +
282 +1. 具有较好的沟通和口头表达能力
283 +1. 熟悉技术平台和技术环境
284 +1. 较强的分析事件趋势的能力
285 +1. 具有较强的计划、组织、领导和控制才能,能够综合各方意见
286 +
287 +== ==
288 +
289 +== 4.4问题处理专家 ==
290 +
291 +问题处理专家为问题的诊断及解决提供技术支持。通常由各专业组技术人员承担。
292 +
293 +**职责:**
294 +
295 +1. 接受分派过来的问题
296 +1. 分析和诊断问题,确定根本原因
297 +1. 需要时协调第三方的资源来帮助诊断和处理问题
298 +1. 联系第三方技术支持并协调安排其解决问题的活动
299 +1. 问题的解决方案制定
300 +1. 问题的解决方案执行
301 +1. 问题的解决方案校验
302 +1. 问题的解决方案的知识发布
303 +
304 +**技能要求:**
305 +
306 +1. 较强的专业知识
307 +1. 较强的分析问题的能力和技巧
308 +1. 较好的沟通和表达能力
309 +
310 +== ==
311 +
312 +== 4.5问题管理委员会 ==
313 +
314 +问题管理委员会由问题经理及各个问题处理专家组成
315 +
316 +职责:
317 +
318 +1. 问题管理委员定期召开例会,对问题管理的流程、执行效率作出分析并提出改进措施
319 +1. 问题管理委员会负责制定并修订问题管理相关制度
320 +
321 +技能要求:
322 +
323 +1. 较强的专业知识
324 +1. 较强的分析问题的能力和技巧,能够对问题的有效性提出建议
325 +1. 较好的沟通和表达能力
326 +
327 += =
328 +
329 += 5技术平台相关代码定义 =
330 +
331 +== 5.1问题信息项 ==
332 +
333 +问题单包含如下信息项:
334 +
335 +|**序号**|**信息项**|** 描述**
336 +|1|问题ID|为每个问题分配一个唯一的序列号(系统自动产生)
337 +|2|阶段|
338 +|3|状态|参见“问题状态”定义
339 +|4|类别|参见“问题分类”定义
340 +|5|子类别|
341 +|6|服务|
342 +|7|受影响的配置项|记录问题的配置项代码(手工填写)
343 +|8|诊断开始时间|问题状态更新为“分析中”的时间
344 +|9|诊断结束时间|问题状态更新为“已有解决方案”的时间
345 +|10|是否是重复问题|是否与已有问题重复
346 +|11|是否是需要变通方法|是否需要通过变通的方式来解决
347 +|12|受理组|将问题分配到相应处理组
348 +|13|问题专家|将问题分配到各组问题处理专家
349 +|14|问题经理|负责该问题的问题经理
350 +|15|问题请求人|问题提交人的信息
351 +|16|问题请求日期|生成问题记录的时间(系统自动产生)
352 +|17|问题来源|参见“问题来源”定义
353 +|18|影响|该问题造成的影响程度
354 +|19|紧急程度|问题的紧急程度
355 +|20|优先级|问题的优先级
356 +|21|标题|简单描述问题(手工填写)
357 +|22|描述|详细描述问题内容(手工填写)
358 +|23|根本原因描述|对该问题发生的根本原因进行描述
359 +|24|变通方法描述|对解决该问题使用的变通方法进行描述
360 +|25|解决方案|问题解决方案的详细描述(手工填写)
361 +|26|关闭代码|问题结束代码
362 +|27|关闭时间|当问题状态更新为“结束并关闭“的时间(手工填写)
363 +|28|建议应对措施|建议对此类问题的统一应对措施
364 +|29|相关单号|记录由问题发变更时,关联的变更单号(手工填写)
365 +|30|添加附件|与问题相关的附件
366 +
367 +(% class="wikigeneratedid" %)
368 +== ==
369 +
370 +== 5.2问题来源 ==
371 +
372 +根据问题的不同来源对问题分类如下:
373 +
374 +|(% style="width:54px" %)**编号**|(% style="width:106px" %)**代码**|(% style="width:962px" %)**描述**
375 +|(% style="width:54px" %)1|(% style="width:106px" %) 事件升级|(% style="width:962px" %)(((
376 +1) 严重的事件恢复服务后,则提出的问题,以便进行事件的根本原因分析。
377 +
378 +2)对于已经产生事件,已经临时解决,由相关运维人员进行分析。如果认为最终原因仍未明确或者发现运维工作需要改进,由事件关闭人登记问题记录单。
379 +
380 +3)未解决且没有变通方法的事件,应尽快关闭转问题处理流程多方寻求变通方法以尽快恢复服务。
381 +)))
382 +|(% style="width:54px" %)2|(% style="width:106px" %)日常发现|(% style="width:962px" %)(((
383 +技术专家和日常维护人员在日常运维工作中,发现潜在问题,则由发现人提出问题以便进行根本解决。
384 +
385 +例如:技术专家在日常运维中发现,目前的数据库版本可能会存在着死锁、心跳不一致等方面的问题,此时就可以提出一个问题记录,以便分析。
386 +)))
387 +|(% style="width:54px" %)3|(% style="width:106px" %)趋势分析|(% style="width:962px" %)(((
388 +事件趋势分析;
389 +
390 +例如:在定期的会议中,对事件进行分析后发现,上周某类型的事件比平常的时候多30%,超过了规定的阀值,或存在某事件长期未关闭,这表明系统有可能存在着一些潜在的隐患,此时就可以提出一个问题记录,以找出问题的原因并解决。
391 +)))
392 +
393 +(% class="wikigeneratedid" %)
394 +== ==
395 +
396 +== 5.3问题状态 ==
397 +
398 +为了记录问题处理的生命周期,需要设置不同的状态加以描述,如下所示:
399 +
400 +|**编号**|**代码**|**描述**
401 +|1|已登记|问题登录到系统中
402 +|2|已分派|问题已经分派给相应的问题分析专家
403 +|3|分析中|问题分析专家正在分析问题过程中
404 +|4|已定位原因|问题根本原因已找出
405 +|5|已有解决方案|解决方案已找到
406 +|6|已实施|已经实施解决方案
407 +|7|已关闭|问题结束
408 +
409 +(% class="wikigeneratedid" %)
410 +== ==
411 +
412 +== 5.4问题分类 ==
413 +
414 +同事件分类
415 +
416 +
417 +== 5.5问题结束代码 ==
418 +
419 +为了表明问题的不同解决方式,定义如下结束代码:
420 +
421 +|**序号**|**代码**|**描述**
422 +|1|根本解决|找出问题的根本原因,得到解决方案,并成功解决
423 +|2|变通方法|未找出根本原因或没有根本解决方案,但有临时解决方案作为变通方法
424 +|3|无法解决|问题长期无法解决,定期清理时关闭并置结束代码为“无法解决”
425 +|4|消失|问题无法再现
426 +|5|取消|问题重复,或问题经理经过分析认为系统运行正常不存在问题,问题经理置“取消”状态
427 +
428 +(% class="wikigeneratedid" %)
429 +== ==
430 +
431 +== 5.6未根本解决原因 ==
432 +
433 +当问题结束关闭代码选择为“ 变通方法”或“无法解决”时必须选择未解决原因,说明其理由。
434 +
435 +
436 +|**编号**|**代码**|**说明**
437 +|1|未找到原因|找不到问题的根本原因
438 +|2|技术限制|找到问题的根本原因,也有解决方案,但由于系统技术限制,该方案无法实施
439 +|3|业务限制|找到问题的根本原因,也有解决方案,但由于业务或法规法规限制,该方案无法实施
440 +|4|成本限制|找到问题的根本原因,也有解决方案,但由于成本限制,该方案无法实施
441 +
442 +
443 +
444 += 6问题管理流程概要设计 =
445 +
446 +
447 +问题管理概要设计流程图如下:
448 +
449 +[[image:1728806514937-559.png]]
450 +
451 +
452 +问题管理概要流程描述如下:
453 +
454 +|**序号**|**步骤名称**|**责任人**|**说明**
455 +|200.1|问题确定与记录|问题提交人|(((
456 +对事件研究、维护提出以及趋势分析发现的潜在问题,在系统中进行记录,并对问题信息进行描述
457 +
458 +问题提交人创建的问题,直接分派给问题经理
459 +)))
460 +|200.2|问题确认与分派|问题管理委员会/问题经理|(((
461 +问题提交人提交上来的问题,问题经理应对其进行审核确认,确定问题是否需要继续处理。如果问题确认无效,则关闭问题,并通知请求者
462 +
463 +问题经理创建或审核的问题,组建问题管理委员会;分析问题。
464 +)))
465 +|200.3|分析并诊断问题/提供变通方法|问题处理专家|(((
466 +问题处理专家接受问题,更新问题状态并记录实际开始诊断时间
467 +
468 +如需其他问题处理专家协助分析、诊断,则通知问题经理,由问题经理协调资源,成立问题分析小组,举行问题根本原因分析研讨会议,并确定问题的潜在原因,提供或更新问题变通方法,以降低问题在根本解决前对业务产生的影响
469 +
470 +将问题产生根本原因及变通方法及时更新到问题记录中
471 +
472 +将问题根本原因及变通方法通知问题经理
473 +
474 +如果预计无法找到问题的根本原因,及时通报问题经理
475 +)))
476 +|200.4|开发、确认实施解决方案|问题处理专家|(((
477 +对于已经找到根本原因的问题,需要确定解决方案,以便永久的解决
478 +
479 +问题处理专家或厂商推荐并测试根本性解决方案,并确保这些方案彻底解决问题,更新问题记录中的实际诊断结束时间
480 +
481 +问题处理专家判断实施上述解决方案/变通方法是否需要通过其他流程(如变更流程等)
482 +
483 +如需要,提交到相应的流程,并和该流程人员保持沟通,了解问题的解决状况;
484 +
485 +如不需要变更,计划并组织实施解决方案以解决问题。
486 +
487 +如果问题处理专家预计在无法找到根本解决方案或虽有解决方案但目前无法实施(如实施的代价太大),通报问题经理
488 +)))
489 +|200.5|问题监控|问题经理/问题管理委员会|(((
490 +问题经理和问题管理委员会负责问题分析、诊断、解决过程中的跟踪和监控:
491 +
492 +在问题找到根本原因或解决方案之后,根据需要,向服务台或问题请求人员通报该问题的解决情况,以帮助和提高问题的解决率
493 +
494 +对于问题处理专家认为无法找到根本原因或虽有解决方案,但目前无法实施(如实施的代价太大等),问题经理协调问题处理专家进行分析判断,决定该问题是继续诊断、解决还是关闭该问题
495 +)))
496 +|200.6|问题回顾|问题经理/问题管理委员会|(((
497 +问题管理委员会和问题经理对问题进行回顾,确认问题是否被正确的解决,如果没有解决,转到200.3分析并诊断问题/提供变通方法
498 +
499 +整理问题处理经验,提交到知识管理模块。
500 +)))
501 +|200.7|问题关闭|问题经理/问题管理委员会|对问题记录的信息项进行总结,更新问题记录并关闭问题
502 +
503 +
504 += 7问题管理流程详细设计 =
505 +
506 +== 7.1问题确定与记录(200.1) ==
507 +
508 +[[image:1728806550559-900.png]]
509 +
510 +
511 +|**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明**
512 +| |事件升级|事件管理人员|事件记录|问题记录|(((
513 +* 包括频发事件、无解决方案的事件和紧急事件
514 +)))
515 +| |趋势分析|问题经理|事件记录|问题记录|(((
516 +* 问题经理对一段时间以内的事件进行趋势分析得出的问题
517 +)))
518 +| |日常发现|技术专家和日常运维人员|无|问题记录|(((
519 +* 技术专家和日常维护人员在日常的IT运维工作中提出的问题
520 +)))
521 +|200.1.1|问题信息记录|问题提交人| |问题记录|(((
522 +* 根据各个来源的信息填写并提交问题记录单
523 +)))
524 +
525 +(% class="wikigeneratedid" %)
526 +== ==
527 +
528 +== 7.2问题识别与确认(200.2) ==
529 +
530 +[[image:1728806579314-661.png]]
531 +
532 +
533 +|**序号**|(% style="width:114px" %)**步骤名称**|(% style="width:93px" %)**责任人**|(% style="width:81px" %)**输入**|(% style="width:105px" %)**输出**|(% style="width:664px" %)**说明**
534 +|200.2.1|(% style="width:114px" %)审核问题记录|(% style="width:93px" %)问题经理|(% style="width:81px" %)问题记录|(% style="width:105px" %)无|(% style="width:664px" %)(((
535 +问题经理对所有的问题记录进行审核:
536 +
537 +1. 审核问题记录是不是一个真正问题,取消无效的问题记录,置问题状态为“已关闭”,问题结束代码为“取消”
538 +1. 检查问题记录信息,如问题的分类、优先级、所属业务系统等信息是否完整,如需要则将信息进行调整或补充完整
539 +1. 将问题记录与系统中的问题/已知错误数据库或知识库进行匹配,以寻找参考资料
540 +)))
541 +|200.2.2|(% style="width:114px" %)审核是否通过|(% style="width:93px" %)问题经理|(% style="width:81px" %)无|(% style="width:105px" %)审核后的问题记录|(% style="width:664px" %)(((
542 +判断审核是否通过
543 +
544 +1. 是,转到200.2.3
545 +1. 否,转到200.7取消(关闭)问题,结束代码置为“取消
546 +)))
547 +|200.2.3|(% style="width:114px" %)是否重复问题|(% style="width:93px" %)问题经理|(% style="width:81px" %)无|(% style="width:105px" %)无|(% style="width:664px" %)(((
548 +判断该问题请求是否与某个未关闭的问题重复
549 +
550 +1. 是,转到200.2.4
551 +1. 否,转到200.2.5
552 +)))
553 +|200.2.4|(% style="width:114px" %)标识重复问题|(% style="width:93px" %)问题经理|(% style="width:81px" %)无|(% style="width:105px" %)重复标记|(% style="width:664px" %)在重复问题记录上做重复标识
554 +|200.2.5|(% style="width:114px" %)分派问题|(% style="width:93px" %)问题经理|(% style="width:81px" %)问题记录|(% style="width:105px" %)分派后的问题记录|(% style="width:664px" %)(((
555 +根据问题所属类别,把问题分派给相应的问题处理专家。
556 +
557 +转到200.3
558 +)))
559 +
560 +(% class="wikigeneratedid" %)
561 +== ==
562 +
563 +== 7.3问题分析判断(200.3) ==
564 +
565 +[[image:1728806632926-150.png]]
566 +
567 +
568 +|**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明**
569 +|200.3.1|查找所有可能原因|问题处理专家|分派后的问题记录|问题可能原因|(((
570 +1. 问题处理专家对问题进行初步分析,查找所有可能的原因
571 +)))
572 +|200.3.2|定位问题根本原因|问题处理专家|问题可能原因列表|问题根本原因|(((
573 +1. 在所有可能原因中,最终确定问题的根本原因,并置问题状态为“已定位原因”
574 +)))
575 +|200.3.3|是否需要变通方法|问题处理专家|无|无|(((
576 +问题处理专家根据需要确定是否需要制订变通方法,以降低问题对业务的影响
577 +
578 +是否需要变通方法:
579 +
580 +1. 是,转入200.3.4确定问题变通方法,
581 +1. 否,转入200.4确定解决方案
582 +)))
583 +|200.3.4|确定变通方法|问题处理专家|无|变通方法|将确定的变通方法录入系统,转200.4
584 +
585 +(% class="wikigeneratedid" %)
586 +== ==
587 +
588 +== 7.4开发确认实施解决方案(200.4) ==
589 +
590 +[[image:1728806664471-771.png]]
591 +
592 +
593 +|**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明**
594 +|200.4.1|尝试找出所有解决方法|问题处理专家|问题记录|可能解决方案|(((
595 +1. 根据已定位问题的根本原因,问题处理专家尝试找出所有可能的解决方案
596 +)))
597 +|200.4.2|确认最终解决方案|问题处理专家|无|解决方案|(((
598 +1. 对所有可能的解决方案进行分析,找出最终的解决方案,并记在问题记录的解决方案中
599 +)))
600 +|200.4.3|是否需要提变更申请|问题管理专家|无|变更申请|(((
601 +问题管理专家判断是否需要发起一个变更申请来解决问题:
602 +
603 +1. 如果是,则由问题处理专家向变更管理流程提交变更申请,实施完毕后返回问题管理流程
604 +1. 如果否,则进入下一步200.5.4
605 +)))
606 +|200.4.4|实施方案|问题处理专家|无|实施方案计划|(((
607 +1. 问题处理专家制定解决方案实施计划,包括实施人员、实施时间等
608 +1. 问题处理专家组织实施解决方案,并置问题状态为“已实施”
609 +1. 如果需要协调资源,问题处理专家可以请求问题经理的协助
610 +1. 处理完毕转200.6
611 +)))
612 +
613 +(% class="wikigeneratedid" %)
614 +== ==
615 +
616 +== 7.5问题监控(200.5) ==
617 +
618 +[[image:1728806693517-874.png]]
619 +
620 +
621 +|**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明**
622 +|200.5.1|协调资源|问题经理/问题管理委员会|需要的资源|协调好的资源|问题经理/问题管理委员会,根据问题需要协调合适的资源。
623 +|200.5.2|监控解决方案实施情况|问题经理|实施的解决方案或变更|监控结果|通过对实施过程的监控及事后通过工具或对IT环境的直接观察监控解决方案的实施结果。
624 +
625 +(% class="wikigeneratedid" %)
626 +== ==
627 +
628 +== 问题回顾(200.6) ==
629 +
630 +[[image:1728806720939-209.png]]
631 +
632 +
633 +|**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明**
634 +|200.6.1|检查问题实施结果|问题经理|无|无|对比现状分析检查问题处理结果
635 +|200.6.2|问题是否已解决|问题经理|无|无|(((
636 +问题经理判断该问题是否得到根本解决
637 +
638 +1. 是,转到200.6.3
639 +1. 否,转到200.3问题分析并定位根本原因,重新由问题处理专家寻找问题的根本原因,并置问题状态重新置为“分析中”
640 +)))
641 +|200.6.3|是否生成知识|问题经理| |知识|(((
642 +判断是否根据问题处理情况生成新的知识
643 +
644 +1. 是,创建新的知识到知识管理流程
645 +1. 判断完毕,转到200.7关闭问题
646 +)))
647 +
648 +(% class="wikigeneratedid" %)
649 +== ==
650 +
651 +== 7.7问题关闭(200.7) ==
652 +
653 +[[image:1728806747405-700.png]]
654 +
655 +
656 +|**序号**|**步骤名称**|**责任人**|**输入**|**输出**|**说明**
657 +|200.7.1|问题记录审核|问题经理|问题记录|更新后的问题记录|检查问题记录的填写情况,更新到问题记录中。
658 +|200.7.2|关闭问题|问题经理|无|关闭的问题记录|选择相应的结束代码,置问题状态为“结束”,关闭问题记录
659 +
660 +
661 +(% class="wikigeneratedid" %)
662 += =
663 +
664 += 8问题管理流程关键指标 =
665 +
666 +为了控制流程的质量,必须为流程设置衡量指标。通过对指标的分析,可以有效地对流程的运行情况进行监控和改进。
667 +
668 +|**序号**|**衡量指标**|**指标说明**
669 +|1|问题总数|衡量问题工作量的指标
670 +|2|关闭的问题数量|衡量问题工作量的指标
671 +|3|问题成功解决率|衡量问题处理质量的指标
672 +|4|通过变通方法解决的问题数量|衡量问题处理质量的指标
673 +|5|事件升级问题所占比率|衡量被动管理问题比例的指标
674 +|6|趋势分析问题所占比率|衡量主动管理问题比例的指标
675 +|7|维护中提出的问题比率|衡量主动管理问题比例的指标
676 +|8|提出过变更的问题数量|衡量问题和变更关联程度的指标
677 +
678 +
679 += 9流程持续改进机制 =
680 +
681 +[[image:1728806789316-874.png]]
682 +
683 +
684 +问题流程必须经过持续地调整和优化,才能满足不断变化的业务及服务要求。流程的持续改进的具体方法,可以参考上述流程持续改进模型。
685 +
686 +* **评估及改进研讨**
687 +** 根据设定的ITSM基准线对流程的原则与目标、流程责任与授权、管理目标达成情况、与其他流程的关联及相关流程工具等方面进行评估;
688 +** 根据评估结果,通过研讨,发现已在或潜在的差距和风险,并针对这些差距和风险提出改进建议。根据改进建议的实施成本、风险和耗时等因素,对改进建议进行优先级别排序;
689 +** 改进原因还可能来自于日常服务管理工作中发现的不足;
690 +** 生成评估结果及改进建议方案。
691 +* **制定流程改进计划**
692 +** 分析改进建议的相关性,并进行有效合理的分类和组合;
693 +** 针对不同的改进建议组制定具体的改进计划,将具体的改进计划分解成更详细的改进任务和动作,定义改进时间点、责任人、改进成功条件等;
694 +* **实施具体的改进活动**
695 +** 根据改进计划的要求,实施具体的流程改进活动;
696 +** 跟踪改进活动,及时更新改进计划,并上报改进活动进展及成果;
697 +* **根据业务及服务变化,进行定期评估**
698 +** 根据业务及服务的变化,对事件管理流程进行相关性评估,以满足业务和服务需求;
699 +** 除业务及服务变化可触发流程评估外,流程负责人还应定期组织对管理流程的评估和改进;
700 +** 定期生成流程改进报告(如季度或半年度)。
701 +
702 +
深圳市艾拓先锋企业管理咨询有限公司