Hide last authors
superadmin 3.1 1 2026年1月29日,PeopleCert正式发布了ITIL 第5版。作为ITIL官方中国区产品大使,我将会推出系列文章帮大家解读ITIL 第5版到底有哪些重大的更新。
2
superadmin 4.1 3
superadmin 3.1 4 (% style="text-align:center" %)
5 [[image:1.png||height="272" width="449"]]
6
7
superadmin 4.1 8 从框架内容看,ITIL 第5版包含九个核心模块和一个AI扩展,形成了完整的认证体系。 新版本引入了全新的产品与服务生命周期模型(涵盖发现、设计、获取、构建、转换、运营、交付、支持八个活动),强化了价值系统的核心地位(包括指导原则、治理、价值链、实践、持续改进五大组件),并将AI治理、数据质量管理等现代议题从边缘提升到核心。
superadmin 3.1 9
10
superadmin 4.1 11 但在所有这些变化中,有一个容易被忽视却极其关键的升级:ITIL 第5版在信息和技术维度明确指出,数据质量在AI时代已经从”最好有“的加分项变成了”必须有“的硬门槛。 今天我想跟你深入聊聊,为什么数据质量突然变得如此重要,以及你该如何系统性地提升数据质量。
superadmin 3.1 12
superadmin 4.1 13
14
superadmin 3.1 15 == 一个让人痛心的AI失败案例 ==
16
superadmin 4.1 17 我见过一家中型企业,他们投资引入了一个先进的AIOps平台,承诺能够实现故障预测、智能分派、自动诊断。 平台在演示环境中表现完美,供应商的成功案例也很有说服力。
superadmin 3.1 18
superadmin 4.1 19 但系统上线三个月后,效果远不如预期。 故障预测的准确率只有30%,经常误报;智能分派把事件分给了错误的团队,导致二次转派;自动诊断推荐的解决方案大部分不适用,工程师根本不信任AI的建议。
superadmin 3.1 20
superadmin 4.1 21
superadmin 3.1 22 管理层很困惑:同果那么好,在我们这里就不行?是不是被供应商骗了?
23
24 **深入调查后才发现,问题的根源不在AI算法,而在数据质量。具体来说**:
25
superadmin 4.1 26 配置管理数据库中的配置项信息严重过时,很多服务器已经下线但记录还在,很多新增设备没有及时录入,配置项之间的依赖关系大部分是空白。 AI无法基于这些数据准确理解系统架构,自然无法预测故障影响范围。
superadmin 3.1 27
28
superadmin 4.1 29 事件记录极不规范,同一类问题在不同人手里分类完全不同,描述五花八门,有的人写得很详细,有的人只写”系统慢“三个字。 AI从这些混乱的记录中学到的只是噪音,而不是规律。
superadmin 3.1 30
superadmin 4.1 31 知识库文章质量参差不齐,有的文章内容过时但没有标记,有的文章只有问题描述没有解决方案,有的文章重复但用词不同。 AI无法从这样的知识库中提取有效信息。
32
superadmin 3.1 33 监控数据不完整,很多关键指标没有采集,采集到的数据也没有统一的命名规范,导致AI无法关联不同数据源的信息。
34
superadmin 4.1 35
superadmin 3.1 36 最终的结论让管理层很沮丧:不是AI不行,是我们的数据质量不足以支撑AI应用。在投资AI平台之前,应该先投资数据质量改进。
37
superadmin 4.1 38 这个案例深刻说明了一个道理:在AI时代,数据质量不再是可选的锦上添花,而是必需的基础能力。 没有高质量的数据,再先进的AI也是巧妇难为无米之炊。
superadmin 3.1 39
40 ITIL 第5版正是认识到了这一点,所以把数据质量提升到前所未有的高度。
41
42
superadmin 4.1 43
superadmin 3.1 44 == 为什么AI时代数据质量成了硬门槛 ==
45
46
superadmin 4.1 47 在传统IT管理中,数据质量虽然重要,但不够好也能勉强运转。 配置管理数据库不准确,工程师可以通过经验判断;事件记录不规范,资深人员可以理解;知识库不完善,可以问老员工。
superadmin 3.1 48
superadmin 4.1 49
superadmin 3.1 50 但在AI时代,这些妥协都行不通了。
51
superadmin 4.1 52 **第一个原因是AI依赖数据学习规律。**
superadmin 3.1 53
superadmin 4.1 54 传统的规则引擎是人工编写规则,数据只是用来触发规则。 但机器学习是从数据中学习规律,数据的质量直接决定了学习的效果。
superadmin 3.1 55
superadmin 4.1 56 如果训练数据中存在系统性偏差,AI就会学到错误的规律。 比如,如果历史上某类事件都被分派给了错误的团队(因为分派规则不准确),AI从这些历史数据中学到的就是错误的分派模式。
superadmin 3.1 57
superadmin 4.1 58 如果训练数据不完整,AI就无法学到完整的规律。 比如,如果只有30%的事件有详细的解决记录,AI只能从这30%的数据中学习,而这30%可能不具有代表性。
superadmin 3.1 59
superadmin 4.1 60 如果训练数据不一致,AI就无法提取稳定的特征。 比如,同一个问题在不同人手里分类不同、描述不同,AI就无法识别这是同一类问题。
superadmin 3.1 61
62
superadmin 4.1 63 **第二个原因是AI需要实时数据支撑决策。**
superadmin 3.1 64
superadmin 4.1 65 传统管理可以容忍数据的延迟更新,配置数据一个月更新一次也能用。 但AI驱动的自动化需要实时准确的数据。
superadmin 3.1 66
superadmin 4.1 67 比如,智能分派需要实时知道每个团队当前的工作负载、技能匹配度、可用性。 如果这些数据不是实时的,AI的分派决策就可能是错误的。
superadmin 3.1 68
superadmin 4.1 69 再比如,故障预测需要实时的监控数据、配置变更数据、容量数据。 如果这些数据有延迟或缺失,AI就无法及时发现异常模式。
superadmin 3.1 70
71
superadmin 4.1 72 **第三个原因是AI的可解释性依赖数据的可追溯性。**
73
74 AI做出一个决策时,你需要能够追溯它是基于什么数据、用了什么模型、得出了什么结论。 这要求数据必须是可追溯的、有血缘关系的。
75
76 比如,当AI推荐了一个解决方案但失败了,你需要追溯AI是基于哪些历史案例做出的推荐。 如果历史案例的数据不完整、不准确,你就无法判断是AI模型的问题还是训练数据的问题。
77
78
79 **第四个原因是AI治理要求数据符合合规标准。**
80
81 **ITIL** 第5版明确指出,AI治理的核心要素之一是数据治理。数据的来源、使用、存储、删除都需要符合法规要求(如GDPR)。
82
83 如果你的数据中包含未经授权的个人信息,AI使用这些数据就可能违反隐私法规。 如果你的数据无法证明来源合法,AI的决策就可能面临合规风险。
84
superadmin 3.1 85 所以ITIL 第5版明确指出:在AI时代,数据质量不是队的内部问题,而是整个组织的战略能力。没有高质量的数据,AI和自动化都是空中楼阁。
86
87
88 == 数据质量的四个核心维度 ==
89
superadmin 4.1 90
superadmin 3.1 91 那么,什么样的数据才算高质量?ITIL 第5版给出了四个核心维度:准确性、完整性、及时性、一致性。
92
superadmin 4.1 93 **准确性是指数据反映的是真实情况。**
superadmin 3.1 94
superadmin 4.1 95 配置项的属性信息是否准确?事件的分类是否正确?知识库的解决方案是否有效?
96
superadmin 3.1 97 准确性问题的常见表现包括:配置管理数据库中的服务器IP地址是错的,导致自动化脚本连接失败;事件的影响范围记录不准确,导致优先级判断错误;知识库中的解决方案过时了但没有更新,导致按照文章操作反而出问题。
98
superadmin 4.1 99 准确性的对立面不只是错误,还包括模糊和不明确。 比如,事件描述”系统慢“就是不准确的,因为它没有明确是哪个系统、慢到什么程度、什么时候开始的。
superadmin 3.1 100
101
superadmin 4.1 102 **完整性是指数据包含了所有必要的信息。**
103
104 配置项的关键属性是否都有记录?事件的解决过程是否有详细记录?知识库是否覆盖了常见问题?
105
superadmin 3.1 106 完整性问题的常见表现包括:配置项有名称但没有责任人信息,导致出问题时不知道联系谁;事件有问题描述但没有解决步骤记录,导致同类问题下次还要重新诊断;知识库只有技术文档但没有业务场景说明,导致用户找不到适用的文章。
107
superadmin 4.1 108 完整性不是要求记录所有细节,而是要求记录关键信息。 关键信息的判断标准是:这个信息的缺失是否会影响后续的决策或操作?
superadmin 3.1 109
110
superadmin 4.1 111 **及时性是指数据反映的是当前状态。**
112
113 配置信息是否及时更新?监控数据是否实时采集?知识库是否定期维护?
114
superadmin 3.1 115 及时性问题的常见表现包括:服务器已经下线了但配置管理数据库还显示在线,导致自动化任务失败;监控数据延迟10分钟采集,导致故障发现延迟;知识库文章三年没更新,里面的步骤已经不适用当前版本。
116
superadmin 4.1 117 及时性的要求因场景而异。 对于故障预测、智能分派这些实时决策,数据需要秒级或分钟级的及时性。 对于秒级或分钟级的及时性。 对于趋势分析、容量规划这些非实时分析,数据可以容忍小时级或天级的延迟。
superadmin 3.1 118
119
superadmin 4.1 120 **一致性是指不同来源、不同时间的数据能够对齐。**
121
122 同一个配置项在不同系统中的信息是否一致?同一类问题在不同人手里的分类是否一致?数据的命名和格式是否遵循统一标准?
123
superadmin 3.1 124 一致性问题的常见表现包括:同一台服务器在配置管理数据库中叫server01,在监控系统中叫srv-01,在资产系统中叫服务器1,导致无法关联数据;同一类故障在不同工程师手里分类不同,导致无法统计故障模式;时间戳在不同系统中使用不同的时区,导致事件序列混乱。
125
126 一致性不是要求所有数据使用完全相同的格式,而是要求关键字段有明确的映射关系和转换规则。
127
128
superadmin 4.1 129 ITIL 第5版特别强调,这四个维度不是孤立的,而是相互关联的。 准确性依赖及时性(过时的数据即使当时准确,现在也不准确了);完整性依赖一致性(如果命名不一致,就无法判断信息是否完整);一致性支撑准确性(统一的标准减少了人为错误)。
superadmin 3.1 130
superadmin 4.1 131
132
superadmin 3.1 133 (% style="text-align:center" %)
superadmin 4.1 134 [[image:4.jpg||height="506" width="658"]]
superadmin 3.1 135
136
137 == 数据质量问题的根源:不是技术,是管理 ==
138
139
superadmin 4.1 140 很多人认为数据质量问题是技术问题,只要买更好的工具、建更强的系统就能解决。 但ITIL 第5版明确指出,数据质量问题的根源通常不在技术,而在管理。
superadmin 3.1 141
superadmin 4.1 142 **第一个根源是缺乏明确的数据责任。**
superadmin 3.1 143
superadmin 4.1 144 谁负责维护配置管理数据库的准确性?谁负责确保事件记录的完整性?谁负责更新知识库?
145
146 在很多组织中,这些责任是模糊的。 大家都觉得”应该有人做“,但没有明确的责任人。 结果就是,数据录入时随便填,发现错误时没人改,信息过时了没人更新。
147
superadmin 3.1 148 ITIL 第5版建议,组织应该建立明确的数据责任机制。每类数据应该有明确的责任人(Data Owner),负责定义数据标准、审核数据质量、协调数据更新。每个数据使用者(Data Steward)有义务确保自己使用和创建的数据符合标准。
149
150
superadmin 4.1 151 **第二个根源是缺乏数据质量标准。**
superadmin 3.1 152
superadmin 4.1 153 什么叫准确的配置信息?什么叫完整的事件记录?什么叫有效的知识库文章?
superadmin 3.1 154
superadmin 4.1 155 如果没有明确的标准,每个人的理解都不同。 有人认为事件描述三个字就够了,有人认为要写详细的故障现象和影响范围。 有人认为配置项有名称就行,有人认为还要记录责任人、业务关联、依赖关系。
superadmin 3.1 156
superadmin 4.1 157 ITIL 第5版建议,组织应该制定明确的数据质量标准。 这些标准应该包括:必填字段有哪些、字段格式是什么、数据更新频率是多少、质量验收标准是什么。 标准不需要完美,但需要明确,让每个人知道什么是合格的数据。
superadmin 3.1 158
159
superadmin 4.1 160 **第三个根源是缺乏数据质量激励。**
superadmin 3.1 161
superadmin 4.1 162 如果认真记录数据没有任何好处,而且还要花额外时间,人们自然不愿意做。 如果数据质量差也没有任何后果,人们就不会重视。
superadmin 3.1 163
superadmin 4.1 164 在很多组织中,一线人员觉得数据录入是额外负担。 他们的KPI是解决事件的数量和速度,没有数据质量的考核。 填写详细的记录会延长处理时间,影响自己的绩效。 所以他们选择草草了事。
superadmin 3.1 165
superadmin 4.1 166 ITIL 第5版建议,组织应该建立数据质量激励机制。 这不一定是金钱奖励,更重要的是让数据创建者看到数据的价值。 比如,当AI基于高质量的历史数据推荐了准确的解决方案,帮工程师快速解决了问题,工程师就会意识到认真记录的价值。 当管理层基于准确的配置数据做出了正确的容量规划决策,团队就会意识到维护配置数据的重要性。
167
168
169 **第四个根源是缺乏数据质量监控。**
170
171 如果数据质量问题不被发现,就不会被改进。 很多组织只有在AI效果差或者自动化失败时,才意识到数据质量有问题。
172
173 ITIL 第5版建议,组织应该建立主动的数据质量监控机制。 这包括:定期审计关键数据的准确性、完整性、及时性;设置数据质量指标和阈值;自动检测数据异常(比如配置项长时间未更新、事件分类分布异常);定期生成数据质量报告。
174
175
176
superadmin 3.1 177 == 如何系统性地提升数据质量 ==
178
superadmin 4.1 179
superadmin 3.1 180 说了这么多问题,你可能会问:我该从哪里开始?ITIL 第5版给出了系统性的改进路径。
181
superadmin 4.1 182 **第一步是评估当前状态。**
superadmin 3.1 183
superadmin 4.1 184 不要盲目开始改进,而是先搞清楚当前数据质量的真实情况。
185
superadmin 3.1 186 可以采用抽样的方法:随机抽取100个配置项,检查信息的准确性和完整性;随机抽取100个事件记录,评估记录的规范性和详细程度;随机抽取100篇知识库文章,检查内容的有效性和时效性。
187
188 基于抽样结果,计算数据质量指标:准确率(抽样中准确记录的比例)、完整率(抽样中完整记录的比例)、及时率(抽样中及时更新的比例)、一致率(抽样中符合标准的比例)。
189
superadmin 4.1 190 这些指标会给你一个客观的基线。 通常你会发现,数据质量比想象的差很多。 这不是为了指责任何人,而是为了看清现实。
superadmin 3.1 191
192
superadmin 4.1 193 **第二步是识别优先改进领域。**
194
195 不要试图一次性解决所有数据质量问题,而是先解决对业务影响最大、改进成本最低的问题。
196
superadmin 3.1 197 判断标准包括:业务影响(这类数据质量问题对业务的影响有多大)、改进潜力(提升数据质量的空间有多大)、改进成本(需要投入多少资源和时间)、依赖关系(这类数据是否是其他改进的前提)。
198
superadmin 4.1 199 比如,如果你计划引入智能分派,那么事件分类的准确性和团队技能信息的完整性就是优先改进领域。 如果你计划实现故障预测,那么配置依赖关系的准确性和监控数据的完整性就是优先改进领域。
superadmin 3.1 200
201
superadmin 4.1 202 **第三步是制定数据质量标准。**
203
204 针对优先改进领域,制定明确的数据质量标准。
205
superadmin 3.1 206 这些标准应该包括:必填字段列表(哪些字段是必须填写的)、字段格式规范(每个字段应该填什么内容、用什么格式)、更新频率要求(多久更新一次)、质量验收标准(什么样的数据算合格)。
207
superadmin 4.1 208 标准的制定不应该闭门造车,而应该让数据创建者和数据使用者共同参与。 数据创建者能够说明哪些标准可行、哪些标准难以执行。 数据使用者能够说明哪些信息最重要、哪些信息可以简化。
superadmin 3.1 209
210
superadmin 4.1 211 **第四步是建立数据质量机制。**
superadmin 3.1 212
superadmin 4.1 213 标准有了,还需要机制来保障执行。
superadmin 3.1 214
superadmin 4.1 215 责任机制:明确每类数据的责任人,建立数据质量问责制度。 比如,配置管理数据库的准确性由运维经理负责,每月审计一次,准确率低于80%需要说明原因和改进计划。
superadmin 3.1 216
superadmin 4.1 217 培训机制:对数据创建者进行培训,让他们理解数据标准、掌握录入方法、认识数据价值。 培训不应该只是一次性的宣讲,而应该有实操演练和持续答疑。
superadmin 3.1 218
superadmin 4.1 219 工具辅助机制:通过工具来降低数据录入的难度、减少人为错误。 比如,用下拉菜单代替自由文本输入、用自动检测代替人工核对、用模板引导代替空白表单。
superadmin 3.1 220
superadmin 4.1 221 反馈机制:让数据创建者看到数据的使用效果。 比如,当AI基于高质量数据做出了准确推荐时,给数据贡献者反馈。 当数据质量问题导致自动化失败时,也要反馈给相关人员。
superadmin 3.1 222
223
superadmin 4.1 224 **第五步是持续监控和改进。**
superadmin 3.1 225
superadmin 4.1 226 数据质量不是一次性项目,而是持续的过程。
superadmin 3.1 227
superadmin 4.1 228 建立数据质量仪表板,实时展示关键指标。 比如,配置项准确率、事件记录完整率、知识库更新及时率。 当指标低于阈值时,自动告警。
229
230 定期召开数据质量评审会议,分析数据质量趋势、讨论典型问题、制定改进措施。 不要让会议变成批评大会,而要聚焦系统性问题和改进机会。
231
232 建立数据质量持续改进机制。 每次AI效果不佳、自动化失败时,都要追溯是否有数据质量问题。 如果有,就要分析根因、改进机制、防止重复。
233
234
235
superadmin 3.1 236 == 数据质量是AI成功的基础,也是持续改进的起点 ==
237
superadmin 4.1 238
superadmin 3.1 239 ITIL 第5版把数据质量提升到如此重要的位置,传递的核心信息是:在AI和自动化时代,数据不再只是记录和报告的工具,而是驱动智能决策、支撑自动化流程、实现持续改进的核心资产。
240
superadmin 4.1 241 没有高质量的数据,AI学到的就是错误的规律;自动化执行的就是错误的操作;改进依据的就是错误的事实。 数据质量问题不会随着AI技术的进步而自动解决,反而会因为AI的应用而被放大。
superadmin 3.1 242
superadmin 4.1 243 但数据质量的提升也不是一蹴而就的。 它需要明确的责任机制、清晰的质量标准、有效的激励措施、持续的监控改进。 更重要的是,它需要组织从上到下认识到:数据质量不是技术团队的内部问题,而是整个组织的战略能力。
superadmin 3.1 244
245
superadmin 4.1 246 在AI原生的管理框架中,数据质量已经从”最好有“变成了”必须有“,从”加分项“变成了”硬门槛“。 如果你还在用传统的思路对待数据质量——觉得”差不多就行“”以后再说“”没间搞“——那么你的组织在AI时代将会寸步难行。 投资AI之前,先投资数据质量;追求自动化之前,先建立数据治理;期望智能决策之前,先确保数据准确。 这不是保守,而是务实;不是绕路,而是捷径。
superadmin 3.1 247
248
249 欢迎加长河老师微信achotsao,深入交流ITIL 第5版最新资讯。
深圳市艾拓先锋企业管理咨询有限公司