厘清四大流程，掌握ITIL 4问题管理的全貌

author	version	line-number	content
1	=== 一、问题识别：主动预防与被动响应并重 ===
2
3	问题管理的第一步，是准确地识别出问题本身。在ITIL 4框架下，我们将问题识别流程分为两类：主动识别和被动识别。
4
5	主动识别，通常依赖于监控数据、日志分析、性能趋势评估等技术手段，能够在问题尚未影响到用户体验之前，及早发现潜在隐患。这类识别方式，对于服务的稳定性保障具有重要价值。比如我们可以通过容量趋势图提前发现资源瓶颈，或通过历史事件的聚类分析识别高频次异常点。
6
7	被动识别，则是从已发生的事件出发，进行根因分析。常见于那些在事件管理中反复出现的问题症状。我们不能止步于事件关闭，而应借此机会深入挖掘背后的结构性问题。比如某系统频繁出现登录超时的事件，不能仅仅归结为偶发网络抖动，而应深入研究其架构、代码或外部依赖是否存在缺陷。
8
9	在课程中，我特别强调：如果只停留在处理事件层面，而忽视了问题识别，问题管理就会沦为事后修补，而不是风险防控。
10
11	[[image:https://dwgwpl34m6c.feishu.cn/space/api/box/stream/download/asynccode/?code=MzFhYzVjODkxNjQ0OTdkMDY5NDAzMjc3OTlmODBkNDFfRElEUVRJZU5vZEdneTJjaEIweWVWVm5CSUkwYUl4S3NfVG9rZW46VG5tNGJBa3ZZb2tGdFl4MFhrSmMxZUVHbkFvXzE3NDc4MTA0Mjg6MTc0NzgxNDAyOF9WNA]]
12
13
14
15	----
16
17	=== 二、问题控制：深挖根因，统筹协作解决 ===
18
19	一旦问题被识别出来，随即进入“问题控制”阶段。这个阶段的重点，是对问题进行全面分析，厘清因果链条，明确解决路径。
20
21	我们要做的第一件事，就是准确定位问题根因。这需要团队成员具备扎实的技术能力，也需要良好的协作机制。在ITIL 4 MSF课程中，我们特别提到根因分析方法（如5 Why分析法、鱼骨图分析法等）在这个阶段的实际应用。
22
23	第二件事，是制定可执行的解决方案。这不仅仅是提出一个技术建议，而是要基于影响评估、资源能力、时间成本等多种要素做出平衡。例如，某数据库性能问题的根因可能在于查询语句的设计不合理，但解决这个问题是否意味着要修改核心业务逻辑？是否存在兼容性风险？是否要启动变更流程？这些都是需要在问题控制阶段做出的理性判断。
24
25	问题控制的目标，不是找到一个理论上的“最好”方案，而是找到一个在当前环境下“最可行”的解决方式。这种现实主义思维，是问题管理落地的关键。
26
27
28	----
29
30	=== 三、错误控制：已知错误的管理与消除 ===
31
32	进入错误控制阶段，意味着问题虽然暂时未能彻底解决，但我们已经掌握了其根因，并确认了规避手段或者临时解决方案。
33
34	ITIL 4明确指出，已知错误（Known Error）不是终点，而是问题管理中的中间状态。错误控制的目标，是逐步清除这些错误所带来的风险，确保它们不会反复影响服务质量。
35
36	首先，我们需要记录和维护错误信息，构建“已知错误数据库”（KEDB）。这一机制能够在未来类似问题发生时，快速调用已有经验，提升响应速度。
37
38	其次，我们要评估错误是否需要发布规避措施，例如调整配置参数、变更操作顺序、绕开有缺陷的流程等，直至最终修复方案成熟并落地。
39
40	最后，对于某些暂时无法解决但影响范围较大的错误，应制定持续监控机制，及时识别其动态变化。错误控制不是“处理一次就完事”，而是一种持续的风险压制机制，直至错误根源被彻底消除为止。
41
42
43	----
44
45	=== 四、流程集成：形成完整的问题闭环 ===
46
47	问题管理的四个流程不仅彼此独立，更要形成有机的闭环。识别、控制、错误管理和最终的关闭标准，必须彼此连接，确保信息流通、责任明确和效果可追溯。
48
49	我们建议在每一个流程节点设定明确的输入输出标准。例如：
50
51	* (((
52	问题识别后，应形成问题记录并提交至控制阶段；
53	)))
54	* (((
55	问题控制中完成根因分析后，应产生“解决方案建议书”；
56	)))
57	* (((
58	错误控制阶段形成的KEDB条目，应定期更新，并纳入知识管理流程。
59	)))
60
61	此外，为了避免问题记录悬而未决，我们还需要设置“问题关闭标准”。一个问题何时可以标记为关闭？是修复完成还是验证通过？是否要追踪一段时间确认不再复发？这些都需要标准化管理。
62
63	在MSF课程讲义中，我们也介绍了多种工具对这些流程的支持，例如问题管理模块、知识库系统、工单流转平台等，它们共同构成了ITIL 4问题管理实践的数字化支撑体系。
64
65
66	ITIL 4大师级课程官方授权讲师长河老师原创，末经许可，不得转载

=== **一、问题识别：主动预防与被动响应并重** ===

问题管理的第一步，是准确地识别出问题本身。在ITIL 4框架下，我们将问题识别流程分为两类：主动识别和被动识别。

主动识别，通常依赖于监控数据、日志分析、性能趋势评估等技术手段，能够在问题尚未影响到用户体验之前，及早发现潜在隐患。这类识别方式，对于服务的稳定性保障具有重要价值。比如我们可以通过容量趋势图提前发现资源瓶颈，或通过历史事件的聚类分析识别高频次异常点。

6

7

被动识别，则是从已发生的事件出发，进行根因分析。常见于那些在事件管理中反复出现的问题症状。我们不能止步于事件关闭，而应借此机会深入挖掘背后的结构性问题。比如某系统频繁出现登录超时的事件，不能仅仅归结为偶发网络抖动，而应深入研究其架构、代码或外部依赖是否存在缺陷。

8

9

在课程中，我特别强调：如果只停留在处理事件层面，而忽视了问题识别，问题管理就会沦为事后修补，而不是风险防控。

10

11

[[image:https://dwgwpl34m6c.feishu.cn/space/api/box/stream/download/asynccode/?code=MzFhYzVjODkxNjQ0OTdkMDY5NDAzMjc3OTlmODBkNDFfRElEUVRJZU5vZEdneTJjaEIweWVWVm5CSUkwYUl4S3NfVG9rZW46VG5tNGJBa3ZZb2tGdFl4MFhrSmMxZUVHbkFvXzE3NDc4MTA0Mjg6MTc0NzgxNDAyOF9WNA]]

----

=== **二、问题控制：深挖根因，统筹协作解决** ===

18

19

一旦问题被识别出来，随即进入“问题控制”阶段。这个阶段的重点，是对问题进行全面分析，厘清因果链条，明确解决路径。

20

21

我们要做的第一件事，就是准确定位问题根因。这需要团队成员具备扎实的技术能力，也需要良好的协作机制。在ITIL 4 MSF课程中，我们特别提到根因分析方法（如5 Why分析法、鱼骨图分析法等）在这个阶段的实际应用。

22

23

第二件事，是制定可执行的解决方案。这不仅仅是提出一个技术建议，而是要基于影响评估、资源能力、时间成本等多种要素做出平衡。例如，某数据库性能问题的根因可能在于查询语句的设计不合理，但解决这个问题是否意味着要修改核心业务逻辑？是否存在兼容性风险？是否要启动变更流程？这些都是需要在问题控制阶段做出的理性判断。

24

25

问题控制的目标，不是找到一个理论上的“最好”方案，而是找到一个在当前环境下“最可行”的解决方式。这种现实主义思维，是问题管理落地的关键。

----

=== **三、错误控制：已知错误的管理与消除** ===

31

32