2026年1月29日,PeopleCert正式发布了ITIL 第5版。作为ITIL官方中国区产品大使,我将会推出系列文章帮大家解读ITIL 第5版到底有哪些重大的更新。

1.png

从框架内容看,ITIL 第5版包含九个核心模块和一个AI扩展,形成了完整的认证体系。 新版本引入了全新的产品与服务生命周期模型(涵盖发现、设计、获取、构建、转换、运营、交付、支持八个活动),强化了价值系统的核心地位(包括指导原则、治理、价值链、实践、持续改进五大组件),并将AI治理、数据质量管理等现代议题从边缘提升到核心。

但在所有这些变化中,有一个容易被忽视却极其关键的升级:ITIL 第5版在信息和技术维度明确指出,数据质量在AI时代已经从”最好有“的加分项变成了”必须有“的硬门槛。 今天我想跟你深入聊聊,为什么数据质量突然变得如此重要,以及你该如何系统性地提升数据质量。

一个让人痛心的AI失败案例

我见过一家中型企业,他们投资引入了一个先进的AIOps平台,承诺能够实现故障预测、智能分派、自动诊断。 平台在演示环境中表现完美,供应商的成功案例也很有说服力。

但系统上线三个月后,效果远不如预期。 故障预测的准确率只有30%,经常误报;智能分派把事件分给了错误的团队,导致二次转派;自动诊断推荐的解决方案大部分不适用,工程师根本不信任AI的建议。

管理层很困惑:同果那么好,在我们这里就不行?是不是被供应商骗了?

深入调查后才发现,问题的根源不在AI算法,而在数据质量。具体来说

配置管理数据库中的配置项信息严重过时,很多服务器已经下线但记录还在,很多新增设备没有及时录入,配置项之间的依赖关系大部分是空白。 AI无法基于这些数据准确理解系统架构,自然无法预测故障影响范围。

事件记录极不规范,同一类问题在不同人手里分类完全不同,描述五花八门,有的人写得很详细,有的人只写”系统慢“三个字。 AI从这些混乱的记录中学到的只是噪音,而不是规律。

知识库文章质量参差不齐,有的文章内容过时但没有标记,有的文章只有问题描述没有解决方案,有的文章重复但用词不同。 AI无法从这样的知识库中提取有效信息。

监控数据不完整,很多关键指标没有采集,采集到的数据也没有统一的命名规范,导致AI无法关联不同数据源的信息。

最终的结论让管理层很沮丧:不是AI不行,是我们的数据质量不足以支撑AI应用。在投资AI平台之前,应该先投资数据质量改进。

这个案例深刻说明了一个道理:在AI时代,数据质量不再是可选的锦上添花,而是必需的基础能力。 没有高质量的数据,再先进的AI也是巧妇难为无米之炊。

ITIL 第5版正是认识到了这一点,所以把数据质量提升到前所未有的高度。

为什么AI时代数据质量成了硬门槛

在传统IT管理中,数据质量虽然重要,但不够好也能勉强运转。 配置管理数据库不准确,工程师可以通过经验判断;事件记录不规范,资深人员可以理解;知识库不完善,可以问老员工。

但在AI时代,这些妥协都行不通了。

第一个原因是AI依赖数据学习规律。

传统的规则引擎是人工编写规则,数据只是用来触发规则。 但机器学习是从数据中学习规律,数据的质量直接决定了学习的效果。

如果训练数据中存在系统性偏差,AI就会学到错误的规律。 比如,如果历史上某类事件都被分派给了错误的团队(因为分派规则不准确),AI从这些历史数据中学到的就是错误的分派模式。

如果训练数据不完整,AI就无法学到完整的规律。 比如,如果只有30%的事件有详细的解决记录,AI只能从这30%的数据中学习,而这30%可能不具有代表性。

如果训练数据不一致,AI就无法提取稳定的特征。 比如,同一个问题在不同人手里分类不同、描述不同,AI就无法识别这是同一类问题。

第二个原因是AI需要实时数据支撑决策。

传统管理可以容忍数据的延迟更新,配置数据一个月更新一次也能用。 但AI驱动的自动化需要实时准确的数据。

比如,智能分派需要实时知道每个团队当前的工作负载、技能匹配度、可用性。 如果这些数据不是实时的,AI的分派决策就可能是错误的。

再比如,故障预测需要实时的监控数据、配置变更数据、容量数据。 如果这些数据有延迟或缺失,AI就无法及时发现异常模式。

第三个原因是AI的可解释性依赖数据的可追溯性。

AI做出一个决策时,你需要能够追溯它是基于什么数据、用了什么模型、得出了什么结论。 这要求数据必须是可追溯的、有血缘关系的。

比如,当AI推荐了一个解决方案但失败了,你需要追溯AI是基于哪些历史案例做出的推荐。 如果历史案例的数据不完整、不准确,你就无法判断是AI模型的问题还是训练数据的问题。

第四个原因是AI治理要求数据符合合规标准。

ITIL 第5版明确指出,AI治理的核心要素之一是数据治理。数据的来源、使用、存储、删除都需要符合法规要求(如GDPR)。

如果你的数据中包含未经授权的个人信息,AI使用这些数据就可能违反隐私法规。 如果你的数据无法证明来源合法,AI的决策就可能面临合规风险。

所以ITIL 第5版明确指出:在AI时代,数据质量不是队的内部问题,而是整个组织的战略能力。没有高质量的数据,AI和自动化都是空中楼阁。

数据质量的四个核心维度

那么,什么样的数据才算高质量?ITIL 第5版给出了四个核心维度:准确性、完整性、及时性、一致性。

准确性是指数据反映的是真实情况。

配置项的属性信息是否准确?事件的分类是否正确?知识库的解决方案是否有效?

准确性问题的常见表现包括:配置管理数据库中的服务器IP地址是错的,导致自动化脚本连接失败;事件的影响范围记录不准确,导致优先级判断错误;知识库中的解决方案过时了但没有更新,导致按照文章操作反而出问题。

准确性的对立面不只是错误,还包括模糊和不明确。 比如,事件描述”系统慢“就是不准确的,因为它没有明确是哪个系统、慢到什么程度、什么时候开始的。

完整性是指数据包含了所有必要的信息。

配置项的关键属性是否都有记录?事件的解决过程是否有详细记录?知识库是否覆盖了常见问题?

完整性问题的常见表现包括:配置项有名称但没有责任人信息,导致出问题时不知道联系谁;事件有问题描述但没有解决步骤记录,导致同类问题下次还要重新诊断;知识库只有技术文档但没有业务场景说明,导致用户找不到适用的文章。

完整性不是要求记录所有细节,而是要求记录关键信息。 关键信息的判断标准是:这个信息的缺失是否会影响后续的决策或操作?

及时性是指数据反映的是当前状态。

配置信息是否及时更新?监控数据是否实时采集?知识库是否定期维护?

及时性问题的常见表现包括:服务器已经下线了但配置管理数据库还显示在线,导致自动化任务失败;监控数据延迟10分钟采集,导致故障发现延迟;知识库文章三年没更新,里面的步骤已经不适用当前版本。

及时性的要求因场景而异。 对于故障预测、智能分派这些实时决策,数据需要秒级或分钟级的及时性。 对于秒级或分钟级的及时性。 对于趋势分析、容量规划这些非实时分析,数据可以容忍小时级或天级的延迟。

一致性是指不同来源、不同时间的数据能够对齐。

同一个配置项在不同系统中的信息是否一致?同一类问题在不同人手里的分类是否一致?数据的命名和格式是否遵循统一标准?

一致性问题的常见表现包括:同一台服务器在配置管理数据库中叫server01,在监控系统中叫srv-01,在资产系统中叫服务器1,导致无法关联数据;同一类故障在不同工程师手里分类不同,导致无法统计故障模式;时间戳在不同系统中使用不同的时区,导致事件序列混乱。

一致性不是要求所有数据使用完全相同的格式,而是要求关键字段有明确的映射关系和转换规则。

ITIL 第5版特别强调,这四个维度不是孤立的,而是相互关联的。 准确性依赖及时性(过时的数据即使当时准确,现在也不准确了);完整性依赖一致性(如果命名不一致,就无法判断信息是否完整);一致性支撑准确性(统一的标准减少了人为错误)。

4.jpg

数据质量问题的根源:不是技术,是管理

很多人认为数据质量问题是技术问题,只要买更好的工具、建更强的系统就能解决。 但ITIL 第5版明确指出,数据质量问题的根源通常不在技术,而在管理。

第一个根源是缺乏明确的数据责任。

谁负责维护配置管理数据库的准确性?谁负责确保事件记录的完整性?谁负责更新知识库?

在很多组织中,这些责任是模糊的。 大家都觉得”应该有人做“,但没有明确的责任人。 结果就是,数据录入时随便填,发现错误时没人改,信息过时了没人更新。

ITIL 第5版建议,组织应该建立明确的数据责任机制。每类数据应该有明确的责任人(Data Owner),负责定义数据标准、审核数据质量、协调数据更新。每个数据使用者(Data Steward)有义务确保自己使用和创建的数据符合标准。

第二个根源是缺乏数据质量标准。

什么叫准确的配置信息?什么叫完整的事件记录?什么叫有效的知识库文章?

如果没有明确的标准,每个人的理解都不同。 有人认为事件描述三个字就够了,有人认为要写详细的故障现象和影响范围。 有人认为配置项有名称就行,有人认为还要记录责任人、业务关联、依赖关系。

ITIL 第5版建议,组织应该制定明确的数据质量标准。 这些标准应该包括:必填字段有哪些、字段格式是什么、数据更新频率是多少、质量验收标准是什么。 标准不需要完美,但需要明确,让每个人知道什么是合格的数据。

第三个根源是缺乏数据质量激励。

如果认真记录数据没有任何好处,而且还要花额外时间,人们自然不愿意做。 如果数据质量差也没有任何后果,人们就不会重视。

在很多组织中,一线人员觉得数据录入是额外负担。 他们的KPI是解决事件的数量和速度,没有数据质量的考核。 填写详细的记录会延长处理时间,影响自己的绩效。 所以他们选择草草了事。

ITIL 第5版建议,组织应该建立数据质量激励机制。 这不一定是金钱奖励,更重要的是让数据创建者看到数据的价值。 比如,当AI基于高质量的历史数据推荐了准确的解决方案,帮工程师快速解决了问题,工程师就会意识到认真记录的价值。 当管理层基于准确的配置数据做出了正确的容量规划决策,团队就会意识到维护配置数据的重要性。

第四个根源是缺乏数据质量监控。

如果数据质量问题不被发现,就不会被改进。 很多组织只有在AI效果差或者自动化失败时,才意识到数据质量有问题。

ITIL 第5版建议,组织应该建立主动的数据质量监控机制。 这包括:定期审计关键数据的准确性、完整性、及时性;设置数据质量指标和阈值;自动检测数据异常(比如配置项长时间未更新、事件分类分布异常);定期生成数据质量报告。

如何系统性地提升数据质量

说了这么多问题,你可能会问:我该从哪里开始?ITIL 第5版给出了系统性的改进路径。

第一步是评估当前状态。

不要盲目开始改进,而是先搞清楚当前数据质量的真实情况。

可以采用抽样的方法:随机抽取100个配置项,检查信息的准确性和完整性;随机抽取100个事件记录,评估记录的规范性和详细程度;随机抽取100篇知识库文章,检查内容的有效性和时效性。

基于抽样结果,计算数据质量指标:准确率(抽样中准确记录的比例)、完整率(抽样中完整记录的比例)、及时率(抽样中及时更新的比例)、一致率(抽样中符合标准的比例)。

这些指标会给你一个客观的基线。 通常你会发现,数据质量比想象的差很多。 这不是为了指责任何人,而是为了看清现实。

第二步是识别优先改进领域。

不要试图一次性解决所有数据质量问题,而是先解决对业务影响最大、改进成本最低的问题。

判断标准包括:业务影响(这类数据质量问题对业务的影响有多大)、改进潜力(提升数据质量的空间有多大)、改进成本(需要投入多少资源和时间)、依赖关系(这类数据是否是其他改进的前提)。

比如,如果你计划引入智能分派,那么事件分类的准确性和团队技能信息的完整性就是优先改进领域。 如果你计划实现故障预测,那么配置依赖关系的准确性和监控数据的完整性就是优先改进领域。

第三步是制定数据质量标准。

针对优先改进领域,制定明确的数据质量标准。

这些标准应该包括:必填字段列表(哪些字段是必须填写的)、字段格式规范(每个字段应该填什么内容、用什么格式)、更新频率要求(多久更新一次)、质量验收标准(什么样的数据算合格)。

标准的制定不应该闭门造车,而应该让数据创建者和数据使用者共同参与。 数据创建者能够说明哪些标准可行、哪些标准难以执行。 数据使用者能够说明哪些信息最重要、哪些信息可以简化。

第四步是建立数据质量机制。

标准有了,还需要机制来保障执行。

责任机制:明确每类数据的责任人,建立数据质量问责制度。 比如,配置管理数据库的准确性由运维经理负责,每月审计一次,准确率低于80%需要说明原因和改进计划。

培训机制:对数据创建者进行培训,让他们理解数据标准、掌握录入方法、认识数据价值。 培训不应该只是一次性的宣讲,而应该有实操演练和持续答疑。

工具辅助机制:通过工具来降低数据录入的难度、减少人为错误。 比如,用下拉菜单代替自由文本输入、用自动检测代替人工核对、用模板引导代替空白表单。

反馈机制:让数据创建者看到数据的使用效果。 比如,当AI基于高质量数据做出了准确推荐时,给数据贡献者反馈。 当数据质量问题导致自动化失败时,也要反馈给相关人员。

第五步是持续监控和改进。

数据质量不是一次性项目,而是持续的过程。

建立数据质量仪表板,实时展示关键指标。 比如,配置项准确率、事件记录完整率、知识库更新及时率。 当指标低于阈值时,自动告警。

定期召开数据质量评审会议,分析数据质量趋势、讨论典型问题、制定改进措施。 不要让会议变成批评大会,而要聚焦系统性问题和改进机会。

建立数据质量持续改进机制。 每次AI效果不佳、自动化失败时,都要追溯是否有数据质量问题。 如果有,就要分析根因、改进机制、防止重复。

数据质量是AI成功的基础,也是持续改进的起点

ITIL 第5版把数据质量提升到如此重要的位置,传递的核心信息是:在AI和自动化时代,数据不再只是记录和报告的工具,而是驱动智能决策、支撑自动化流程、实现持续改进的核心资产。

没有高质量的数据,AI学到的就是错误的规律;自动化执行的就是错误的操作;改进依据的就是错误的事实。 数据质量问题不会随着AI技术的进步而自动解决,反而会因为AI的应用而被放大。

但数据质量的提升也不是一蹴而就的。 它需要明确的责任机制、清晰的质量标准、有效的激励措施、持续的监控改进。 更重要的是,它需要组织从上到下认识到:数据质量不是技术团队的内部问题,而是整个组织的战略能力。

在AI原生的管理框架中,数据质量已经从”最好有“变成了”必须有“,从”加分项“变成了”硬门槛“。 如果你还在用传统的思路对待数据质量——觉得”差不多就行“”以后再说“”没间搞“——那么你的组织在AI时代将会寸步难行。 投资AI之前,先投资数据质量;追求自动化之前,先建立数据治理;期望智能决策之前,先确保数据准确。 这不是保守,而是务实;不是绕路,而是捷径。

欢迎加长河老师微信achotsao,深入交流ITIL 第5版最新资讯。

Tags:
Created by superadmin on 2026/02/11, 09:00
     
深圳市艾拓先锋企业管理咨询有限公司