从版本< 14.1 >
由superadmin编辑
在2024/10/11, 20:17上
到版本
由superadmin编辑
在2024/10/11, 20:00上
< >
修改评论 上传新附件1728648035490-365.png

Summary

Details

Icon Page properties
Content
... ... @@ -3,15 +3,15 @@
3 3  
4 4  = 目录 =
5 5  
6 -==== 一、问题管理设计目标 ====
6 +=== 一、问题管理设计目标 ===
7 7  
8 -==== 二、问题管理流程 ====
8 +=== 二、问题管理流程 ===
9 9  
10 -==== 三、问题管理相关表单、规范 ====
10 +=== 三、问题管理相关表单、规范 ===
11 11  
12 -==== 四、问题管理角色、职责 ====
12 +=== 四、问题管理角色、职责 ===
13 13  
14 -==== 五、问题管理考核标准 ====
14 +=== 五、问题管理考核标准 ===
15 15  
16 16  
17 17  = 一、问题管理设计目标 =
... ... @@ -58,12 +58,12 @@
58 58  = 二、问题管理流程 =
59 59  
60 60  
61 -问题管理流程概述
61 +== 问题管理流程概述 ==
62 62  
63 63  [[image:1728638145695-907.png]]
64 64  
65 65  
66 -问题管理流程步骤概述
66 +== 问题管理流程步骤概述 ==
67 67  
68 68  |问题检测与记录|(((
69 69  * 判断事件管理创建的问题是否受理
... ... @@ -94,349 +94,9 @@
94 94  
95 95  == ==
96 96  
97 -步骤一的流程说明:问题识别与记录
97 +== 步骤一的流程说明:问题识别与记录 ==
98 98  
99 -[[image:1728647892425-490.png]]
99 +[[image:1728638291834-716.png]]
100 100  
101 -== ==
102 102  
103 -步骤二的流程说明:问题分类与分派
104 -
105 -[[image:1728647855815-599.png]]
106 -
107 -
108 -步骤三的流程说明:问题调查与诊断
109 -
110 -[[image:1728647951312-388.png]]
111 -
112 -
113 -步骤四的流程说明:问题解决
114 -
115 -[[image:1728647983097-743.png]]
116 -
117 -
118 -步骤五的流程说明:问题关闭
119 -
120 -[[image:1728648010831-375.png]]
121 -
122 -
123 -步骤六的流程说明:问题跟踪与监控
124 -
125 -[[image:1728648035490-365.png]]
126 -
127 -
128 -
129 -= 三、问题管理相关表单、规范 =
130 -
131 -问题管理相关表单 ~-~- 问题来源
132 -
133 -
134 -根据问题的来源不同,可以分为以下的问题来源代码:
135 -
136 -|(% style="width:50px" %)编号|(% style="width:123px" %)代码|(% style="width:948px" %)描述
137 -|(% style="width:50px" %)1|(% style="width:123px" %)紧急事件|(% style="width:948px" %)(((
138 -紧急事件恢复服务后关联提出的问题,以便进行紧急事件的根本原因分析
139 -
140 -【例如】:某日发生了一起集群无法切换的事件,导致某台主机发生故障后,没有切换到备用主机中去,从而影响了业务,紧急事件的处理人员在采取了手工切换的替代措施后,恢复了服务
141 -
142 -为了分析为什么会发生该重大事件,以及查看其他的集群是否也存在类似的问题,此时可以提出一个问题记录,以便对该紧急事件进行分析
143 -)))
144 -|(% style="width:50px" %)2|(% style="width:123px" %)未解事件|(% style="width:948px" %)(((
145 -故障无法成功解决或者使用变通方式暂时解决,需要找出根本解决方案
146 -
147 -【例如】:某应用系统内存经常爆满当机,暂时没有解决方案,只能通过重启临时解决,此时需要提出一个问题记录,找到问题的根源是开发上面的问题还是其他,再驱动根本解决。
148 -)))
149 -|(% style="width:50px" %)3|(% style="width:123px" %)运维工作|(% style="width:948px" %)(((
150 -二线支持在日常维护工作中提出的问题
151 -
152 -【例如】:维护专家在日常维护中发现,目前的数据库版本可能会存在着死锁、性能下降等方面的问题,此时就可以提出一个问题记录,以便分析
153 -)))
154 -|(% style="width:50px" %)4|(% style="width:123px" %)故障分析|(% style="width:948px" %)(((
155 -分析事件记录找出的问题
156 -
157 -【例如】:在定期的会议中,对某应用系统操作咨询类的事件进行分析后发现,上一阶段该类型的事件比平常的时候多了30%,超过了规定的阀值,这表明该应用系统操作有可能存在着一些潜在的隐患,此时就可以提出一个问题记录,以找出问题的原因并解决
158 -)))
159 -|(% style="width:50px" %)5|(% style="width:123px" %)失败变更|(% style="width:948px" %)变更失败后,可能需要生成一个问题进入后续的解决过程
160 -
161 -
162 -问题分类
163 -
164 -问题分类与事件分类同步,原因是: 问题单来源很大程度上来自事件,同步分类有助于完整转述信息 事件管理的“故障现象”和“故障根源”区别的分类方式对于描述问题同样具有很大意义。
165 -
166 -|分类|原则|上级分类
167 -|类别(Category)|分类原则以能够清晰描述技术条线,从框架角度区分事件为准,如CRM域、计费域、MSS|
168 -|子类(Type)|分类原则以能够准确定位事件所在系统、设备或者功能单元,指导事件分派到相应处理组为准,且需要兼顾服务台人员的判断能力,如OCS系统|类别
169 -|现象(Item)|分类原则以能够描述故障现象为准,如计费出错|子类
170 -|根源(Causation)|分类原则以能够描述故障根源为准,如数据错误|子类
171 -
172 -
173 -分类示例表:
174 -
175 -|类别|子类| |(((
176 176  
177 -)))
178 -|(% colspan="1" rowspan="4" %)计费域 ……|计费系统(HB)|现象|通话时长计算出错
179 -|统一充值系统(VC)|根源|账单计算出错
180 -|……| |数据错误
181 -| | |配置错误
182 -
183 -
184 -问题分派规范
185 -
186 -|**分派规范**|**描述**
187 -|规范一|基于目前管理状况,建议分派问题可以到技能组或岗位
188 -|规范二|可分派的人员组列表将根据问题分类和问题地点信息进行筛选
189 -|规范三|已分派的问题允许再次转派,组间转派到组,组内转派到人
190 -|规范四|再转派问题必须通过问题经理执行
191 -|规范五|组内转派问题不需要通过问题经理,可以直接转派
192 -|规范六|供应商等同于问题分析员,由问题经理直接分派
193 -
194 -
195 -问题严重等级规范
196 -
197 -问题的严重等级与事件管理同步,原因如下:
198 -
199 -* 问题单来源很大程度上来自事件,同步严重等级的计算方式有助于完整转述信息
200 -* 事件管理的“紧急程度”与“影响范围”交叉计算方式对于描述问题同样具有很大意义。
201 -
202 -
203 -问题严重等级(优先级)
204 -
205 -- 规则一:问题的严重等级由系统根据紧急程度和影响程度自动运算得出
206 -
207 - 计算规则如下表所示:
208 -
209 -|(% colspan="2" rowspan="2" %)**严重等级**|(% colspan="4" %)**影响程度**
210 -|**1级**(**极高)**|**2级**(**高)**|**3级**(**中)**|**4级**(**低)**
211 -|(% rowspan="3" %)**紧急程度**|**高**|极高|极高|高|中
212 -|**中**|极高|高|中|中
213 -|**低**|高|中|中|低
214 -
215 -问题紧急程度
216 -
217 -* - 规则一:问题的紧急程度划分为三级 ~-~-~-~- 高、中、低
218 -* - 规则二:问题紧急程度由用户或服务台按照“用户类型”和“分类”交叉运算得出
219 -* 规则三:没有明确用户类型的问题紧急程度默认为“中”
220 -* 规则四:投诉类事件和升级事件生成的问题紧急度默认为“高”
221 -
222 -|(% colspan="2" rowspan="2" %)**紧急程度(示例表)**|(% colspan="3" %)**用户类型**
223 -|**企业客户**|**VIP会员**|**普通会员和客户**
224 -|(% rowspan="3" %)**分类(三级)**|**计费出错**|高|中|低
225 -|**停开机出错**|高|中|低
226 -|**……**|高|中|低
227 -
228 - 问题影响程度 :
229 -
230 -* 规则一:问题影响程度由问题经理建单时主观定义
231 -* 规则二:问题的影响包括已经造成的或者可能会造成的影响
232 -* - 规则三:事件影响程度定义如下表所示
233 -
234 -|**影响程度**|**极高**|**高**|**中**|**低**
235 -|描述|(((
236 -重大的应用停机,影响很大数量的用户和业务单位。
237 -
238 -关键业务不能运行。
239 -)))|应用的使用受到重大限制;系统性能严重下降。|事件影响一小部分用户,属于一般性故障。|事件不直接影响生产,或是存在变通的方式。
240 -
241 -
242 -问题目标时间
243 -
244 -对于问题管理而言,处理的第一目标是从根本上解决问题,处理效率的考虑并不是最关键的 在这里我们使用“目标时间”来对处理效率进行衡量,主要是两点考虑:
245 -
246 -* 督促处理人员不要无限制的延误问题处理
247 -* 督促厂商的问题处理工作(厂商在问题处理中作为问题分析员角色)
248 -
249 -超过时间的问题单将执行超时上报
250 -
251 -
252 -| |**问题得到响应**|**问题单分派**|**问题得到解决**|**问题得到关闭**
253 -|**严重等级1**|8H|6H|3D|8H
254 -|**严重等级2**|1D|8H|5D|1D
255 -|**严重等级3**|2D|1D|10D|2D
256 -|**严重等级4**|3D|2D|20D|4D
257 -
258 -
259 -问题管理相关表单 ~-~- 问题状态
260 -
261 -状态代码用于鉴别事件和问题在处理过程中所处的状态。
262 -
263 -|**状态代码**|**描述**
264 -|**New(新建)**|**一个问题被记录或创建**
265 -|**Assigned (已分配)**|**一个问题已被分派给问题分析员或问题经理**
266 -|**Pending (等待中)**|**问题信息不完整,或在某些情况下阻止问题分析员对问题进行处理,进入等待**
267 -|**Work in Progress (处理中)**|**一个问题分析员接受了问题,并正在处理 **
268 -|**Resolved (已解决)**|**为一个问题找到解决方案或变通方法**
269 -|**Closed (已关闭)**|**问题已经关闭**
270 -
271 -
272 -问题流转状态说明
273 -
274 -纵向(左列)为原始状态,横向(上行)为目标状态。
275 -
276 -|**状态**|**新建**|**已分派**|**处理中**|**等待中**|**已解决**|**已关闭**
277 -|**新建 **| |**Y**|**N**|**N**|**N**|**N**
278 -|**已分派**|**N**|**Y**|**Y**|**N**|**N**|**Y**
279 -|**处理中**|**N**|**Y**| |**Y**|**Y**|**Y**
280 -|**等待中**|**N**|**Y**|**Y**| |**Y**|**Y**
281 -|**已解决**|**N**|**Y**|**N**|**N**| |**Y**
282 -|**已关闭**|**N**|**N**|**N**|**N**|**N**|
283 -
284 -
285 -问题等待代码
286 -
287 -* 当处理中的问题由于各种原因进入等待状态时,需要填写等待代码
288 -
289 -|**等待代码**|**描述**
290 -|等待进一步的信息|需要等待获取更多信息
291 -|等待变更管理处理|等待变更流程处理
292 -|由于不可抗力 |由于灾难、气候条件、交通条件等不可抗因素
293 -|等待维护性需求处理|等待维护性需求处理
294 -
295 -
296 -问题关闭规范
297 -
298 -|**关闭规范**|**描述**
299 -|规范一|问题单只能由问题经理关闭
300 -|规范二|问题单在关闭前,必须填写关闭代码
301 -|规范三|问题单不允许自动关闭
302 -|规范四|已关闭的问题单不允许重新打开
303 -
304 -|**关闭代码**|**描述**
305 -|成功解决|问题被正常解决
306 -|未发现根源|问题无法发现根源
307 -|解决失败|问题的解决方案失败,不能解决这个问题
308 -|问题撤销|问题经理撤销问题单
309 -|提交需求|问题单已提交需求管理流程处理
310 -
311 -
312 -问题通知规范
313 -
314 -|**规范**|**描述**
315 -|规范一|在创建问题单后,通知对应的问题经理
316 -|规范二|问题单分派后,通知被分派的问题分析员
317 -|规范三|问题分析员提交转派申请后,通知问题经理
318 -|规范四|问题分析员处理完成,通知问题经理
319 -
320 -
321 -问题管理相关表单 ~-~- 问题记录信息项
322 -
323 -问题记录信息项建议(包括但不限于)
324 -
325 -|序号|信息项|说明
326 -|**1**|**问题ID**|**为每个问题分配一个唯一的序列号(系统自动产生)**
327 -|**2**|**请求人信息**|**问题请求人的信息,包括:姓名、省/分公司、部门、电子邮件、办公电话、手机(手工填写)**
328 -|**3**|**登记时间**|**生成问题记录的时间(系统自动产生)**
329 -|**4**|**地点**|**记录问题发生的地点(手工填写)**
330 -|**5**|**问题来源**|**参见“问题来源”定义**
331 -|**6**|**事件影响度**|**参见“问题紧影响程度”定义**
332 -|**7**|**事件紧急度**|**参见“问题紧急程度”定义**
333 -|**8**|**问题优先级**|**参见“问题优先级”定义**
334 -|**9**|**问题分类**|**参见“问题所属系统类型”定义**
335 -|**10**|**问题标题**|**简单描述问题(手工填写)**
336 -|**11**|**问题描述**|**详细描述问题内容(手工填写)**
337 -|**12**|**问题原因**|**详细记录问题产生的根本原因(手工填写)**
338 -|**13**|**重复问题标记**|**标记为重复问题,用已有标题号标注(手工填写)**
339 -|**14**|**问题状态**|**参见“问题状态”定义**
340 -|**15**|**问题经理**|**问题经理**
341 -|**16**|**受理组**|**将问题分配到问题处理专家组(手工填写)**
342 -
343 -|序号|信息项|说明
344 -|**17**|**受理人**|**将问题分配到各问题处理专家(手工填写)**
345 -|**18**|**问题日志**|**反映问题处理过程中问题信息项的变化历史,包括分配的人员,状态等信息(系统自动产生)**
346 -|**19**|**实际开始诊断时间**|**问题状态更新为“分析中”的时间(手工填写)**
347 -|**20**|**实际诊断结束时间**|**问题状态更新为“已有解决方案”的时间(手工填写)**
348 -|**21**|**解决方案**|**问题解决方案的详细描述(手工填写)**
349 -|**22**|**问题等待代码**|**参见“问题等待代码”定义**
350 -|**23**|**问题结束代码**|**参见“问题结束代码”定义**
351 -|**24**|**备注项**|**解释问题拒绝原因,无法解决的原因等**
352 -|**25**|**关联配置项**|**记录问题的配置项代码(手工填写)**
353 -|**26**|**关联的事件单号**|**记录引发该问题的事件单号(手工填写)**
354 -|**27**|**关联的变更单号**|**记录由问题发变更时,关联的变更单号(手工填写)**
355 -|**28**|**问题关闭时间**|**当问题状态更新为“结束并关闭”的时间(手工填写)**
356 -|**29**|**附件**|**附件**
357 -
358 -
359 -= 四、问题管理角色、职责 =
360 -
361 -问题管理 ~-~- 角色、职责定义
362 -
363 -**原则:**一个人员可以担任多个角色,同一角色也可以由多人担任
364 -
365 -|**问题管理角色**|**主要职责**|**岗位映射**
366 -|**流程负责人**|**推动、推广问题管理流程,对流程的整体效果和效率负责。**|
367 -|**问题分析员**|(((
368 -**接受问题经理分派过来的问题**
369 -
370 -**分析和诊断问题,确定根本原因**
371 -
372 -**确定和测试解决方案**
373 -
374 -**提交变更请求并监控变更实施**
375 -
376 -**协助事件支持人员进行重大或紧急事件的处理**
377 -
378 -**需要时协调第三方的资源来帮助诊断和改正问题**
379 -)))|(((
380 -**企信部所有技术人员,分为不同领域的各个技能组**
381 -
382 -**各厂商,按照各自负责系统分为各个技能组**
383 -)))
384 -|**问题经理**|(((
385 -**领导问题管理小组,确保大家的积极性、技能水平**
386 -
387 -**定期组织相关人员对事件记录进行分析,发现潜在问题**
388 -
389 -**确认和审核问题**
390 -
391 -**必要时对问题进行上报**
392 -
393 -**监视问题的诊断、分析和处理过程**
394 -
395 -**必要时与帮助台及问题请求者沟通问题的相关信息**
396 -
397 -**必要时协调所需资源**
398 -
399 -**定期制定问题报表,提供正确决策信息**
400 -)))|**建议多人担任,分别为各个技术团队的负责人(如各二线处理小组负责人)**
401 -
402 -
403 -
404 -= 五、问题管理考核标准 =
405 -
406 -
407 - 问题管理 ~-~- 考核指标
408 -
409 -问题管理考核指标如下:
410 -
411 -|代码|状态|说明
412 -|(% rowspan="4" %)**流程
413 -有效性**|**问题总数**|(((
414 -**数量:在问题单中根据以下条件过滤**
415 -
416 -**1. 【重复问题标记】为空**
417 -
418 -**2. 【问题结束代码】不等于“取消”**
419 -
420 -**3. 【登记时间】在统计周期内**
421 -)))
422 -|**未解决故障问题所占比率**|(((
423 -**数量:在问题总数中,【问题来源】=“未解事件”的问题数量**
424 -
425 -**比率:数量 / 问题总数  × 100 %**
426 -)))
427 -|**故障分析问题所占比率**|(((
428 -**数量:在问题总数中,【问题来源】=“故障分析”的问题数量**
429 -
430 -**比率:数量 / 问题总数  × 100 %**
431 -)))
432 -|**关闭问题数量**|**数量:【问题关闭时间】在统计周期内,【问题状态】=“结束并关闭”的问题数量**
433 -|(% rowspan="2" %)**执行效率**|**问题成功解决率**|(((
434 -**数量:在关闭问题数量中,【关闭代码】=“成功解决”的问题个数**
435 -
436 -**比率:数量 /关闭问题数量  × 100 %**
437 -)))
438 -|**平均解决时间**|(((
439 -**完成问题数量:【结束时间】在统计周期内的问题个数**
440 -
441 -**平均解决时间:累加完成问题的(【实际结束时间】-【实际开始时间】)/ 完成问题数量**
442 -)))
深圳市艾拓先锋企业管理咨询有限公司