From version < 19.1 >
edited by superadmin
on 2021/02/17, 17:32
To version < 45.4 >
edited by superadmin
on 2024/03/07, 19:45
< >
Change comment: Update document after refactoring.

Summary

Details

Icon Page properties
Title
... ... @@ -1,1 +1,1 @@
1 -05 监控和事态管理(尚未发布)
1 +05 监控和事态管理实践
Content
... ... @@ -1,22 +1,15 @@
1 -{{box cssClass="floatinginfobox" title="**Contents**"}}
2 -{{toc/}}
3 -{{/box}}
1 +如有[[ITIL认证>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]、[[ITIL培训>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]或[[ITIL考试>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]需求,可[[点击了解详情>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]
4 4  
5 -(((
6 -(% class="wikigeneratedid" id="H" %)
7 -
8 -)))
9 9  
10 - 需要下载 **ITIL 4监控和事态管理实践【中文】**pdf版全文,请关注微信公众号itilxf ,并回复“监控和事态”即可。
11 -
12 -[[image:微信截图_20210206234644.png]]
13 -
14 -
15 15  **申明:**
16 16  
17 -本系列ITIL 4实践中文版本由ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与需要下载最新翻译版本请关注微信公众号:ITILXF,访问ITIL4中文知识库网站:itil4hub.cn
6 +本系列ITIL 4中文版本由长河领导的ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与需要下载最新翻译版本请关注微信公众号:ITILXF,并回复“**监控和事态管理**”即可。
18 18  
8 +{{box cssClass="floatinginfobox" title="**Contents**"}}
9 +{{toc/}}
10 +{{/box}}
19 19  
12 +
20 20  请注意,ITIL先锋论坛专家团队仅仅只是进行了这些著作的语种转换工作,我们并不拥有包括原著以及中文发行文件的任何版权,所有版权均为Axoles持有,读者在使用这些文件(含本中文翻译版本)时需完全遵守Axoles 和 TSO所申明的所有版权要求。
21 21  
22 22  
... ... @@ -40,7 +40,6 @@
40 40  * 支持监控和事态管理的信息和技术
41 41  * 合作伙伴和供应商对监控和事态管理的思考
42 42  
43 -
44 44  == **1.1** **ITIL®4 认证体系** ==
45 45  
46 46  本文件所选内容可作为以下教学大纲的一部分进行考查:
... ... @@ -62,6 +62,7 @@
62 62  
63 63  监控和事态管理实践的目的是系统地观察服务和服务组件,将其状态变化识别为事态并进行记录和报告。该实践识别基础设施、服务、业务流程和信息安全等事态,确定其优先级,建立对这些事态的适当响应,包括对可能导致潜在故障或事件的条件作出响应。
64 64  
57 +
65 65  |(((
66 66  **事态**
67 67  
... ... @@ -103,6 +103,7 @@
103 103  
104 104  监控通过多种不同的方式得以实现。配置项(CIs)可以通过轮询(即响应监控工具收集特定目标数据的请求)或通过在满足某些条件时自动通知监控工具来共享有关其自身的信息。监控工具对服务组件的询问代表着主动监控,而配置项(CIs)向监控工具发送的通知代表着被动监控。
105 105  
99 +(% style="text-align:center" %)
106 106  [[image:图片1.png]]
107 107  
108 108  
... ... @@ -117,6 +117,7 @@
117 117  
118 118  尽管监控和事态管理传统上专注于服务的技术组件,但对了解其他服务管理资源和活动(包括流程,人员和供应商)的状态也很有用。
119 119  
114 +
120 120  |(((
121 121  **指标**
122 122  
... ... @@ -194,13 +194,14 @@
194 194  
195 195  尽管有些活动和责任领域仍然与监控和事态管理实践密切相关,但它们并没有被包含其中。表2.1中列出了它们以及那些包含了它们的实践的相关引用。重要的是要记住,ITIL实践只是那些在价值流环境中被使用的工具的集合,应根据情况进行必要的组合。
196 196  
197 -|活动|实践指南
198 -|事件的管理|事件管理
199 -|事态和趋势的原因调查|问题管理
200 -|响应事态的变更管理|变更支持
201 -|与用户沟通|服务台
202 -|基于监控数据的决策支持|度量和报告
203 -|设置服务质量和性能的目标和阈值|(((
192 +(% style="width:476px" %)
193 +|(% style="width:320px" %)活动|(% style="width:153px" %)实践指南
194 +|(% style="width:320px" %)事件的管理|(% style="width:153px" %)事件管理
195 +|(% style="width:320px" %)事态和趋势的原因调查|(% style="width:153px" %)问题管理
196 +|(% style="width:320px" %)响应事态的变更管理|(% style="width:153px" %)变更支持
197 +|(% style="width:320px" %)与用户沟通|(% style="width:153px" %)服务台
198 +|(% style="width:320px" %)基于监控数据的决策支持|(% style="width:153px" %)度量和报告
199 +|(% style="width:320px" %)设置服务质量和性能的目标和阈值|(% style="width:153px" %)(((
204 204  服务级别管理
205 205  
206 206  可用性管理
... ... @@ -211,12 +211,12 @@
211 211  
212 212  连续性管理
213 213  )))
214 -|设置基础设施和应用程序组件的阈值|(((
210 +|(% style="width:320px" %)设置基础设施和应用程序组件的阈值|(% style="width:153px" %)(((
215 215  基础设施和平台管理
216 216  
217 217  软件开发和管理
218 218  )))
219 -|设定第三方服务的目标和门槛|供应商管理
215 +|(% style="width:320px" %)设定第三方服务的目标和门槛|(% style="width:153px" %)供应商管理
220 220  
221 221  表2.1其他实践指南中描述的与监控和事态管理相关的活动
222 222  
... ... @@ -232,9 +232,8 @@
232 232  * 确保及时,相关且足够的监控数据提供给相关的利益相关者
233 233  * 确保发现、解释事态,并在需要时尽快采取措施
234 234  
231 +=== **2.4.1 建立和维护描述各类事态和探测它们所需的监控功能的方法/模型** ===
235 235  
236 -=== 2.4.1 建立和维护描述各类事态和探测它们所需的监控功能的方法/模型 ===
237 -
238 238  在大多数情况下,现代技术为度量和监控服务以及服务组件操作的各个方面提供了机会,但是从业人员应认真管理监控的范围以及度量指标的频率和数量。现代监控和事态管理实践的主要挑战不是缺少数据,而是监控必须处理的数据的规模。监控和事态管理实践的重点应该是获取有意义的信息,以支持服务的操作与改进,决策和价值的创造。建立或改进监控和事态管理实践时,应考虑以下方面:
239 239  
240 240  * 识别所监控的服务和服务组件并划分优先级
... ... @@ -270,7 +270,7 @@
270 270  许多IT 监控工具和EMS本身很可能由第三方供应商提供,监控和事态管理实践和供应商管理实践将保持稳定的工作关系。
271 271  
272 272  
273 -=== 2.4.2 确保将及时,相关且足够的监控数据提供给相关的利益相关者 ===
268 +=== **2.4.2 确保将及时,相关且足够的监控数据提供给相关的利益相关者** ===
274 274  
275 275  当根据原始服务设计和与客户达成的服务级别协议(SLA)进行基准校对时,监控和事态管理的报告能够使服务提供者的实际操作性能和行为基本真实。监控和事态管理提供了直接的观察结果、基于事实的经验证据,而不是预期或期望的结果。
276 276  
... ... @@ -279,7 +279,7 @@
279 279  监控和事态管理确定了薄弱区域,因此可以采取补救行动(如果有正当的业务案例),以改进将来的服务质量。监控和事态管理还可以显示客户动作在哪里导致故障,并确定工作效率和/或培训可以在哪些地方得到改善。监控和事态管理还可以同时处理内部和外部供应商,因为他们的绩效必须得到评估和管理。
280 280  
281 281  
282 -=== 2.4.3 确保探测、解释事件,并在需要时尽快采取措施 ===
277 +=== **2.4.3 确保探测、解释事件,并在需要时尽快采取措施** ===
283 283  
284 284  仅仅为监控和事态管理定义规则还不够,事态的实际探测和处理程序才能使这些规则有价值。事态管理的效率和范围在很大程度上取决于服务架构和服务管理自动化水平。在数字化基础设施和现代应用程序中,许多用于监控和事态管理的工具是内置的,实践的重点是事态处理规则的集成和调整。
285 285  
... ... @@ -298,17 +298,18 @@
298 298  
299 299  监控和事态管理实践的关键指标已映射到其实践成功因素(PSF)。它们可以用作价值流环境中的KPI,以评估监控和事态管理实践对那些价值流的效果和效率的贡献。表2.2中给出了一些关键指标的示例。
300 300  
301 -|**实践成功因素**|**指标样例**
302 -|建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力|(((
296 +(% style="width:923px" %)
297 +|(% style="width:503px" %)**实践成功因素**|(% style="width:418px" %)**指标样例**
298 +|(% style="width:503px" %)建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力|(% style="width:418px" %)(((
303 303  * 利益相关者对监控和事态管理方法的满意度
304 304  * 组织对方法的坚持
305 305  * 未遵循或发现不切实际的方法建议/要求的百分比
306 306  )))
307 -|确保向利益相关者提供及时、相关和充分的监控数据|(((
303 +|(% style="width:503px" %)确保向利益相关者提供及时、相关和充分的监控数据|(% style="width:418px" %)(((
308 308  * 利益相关者对监控数据及其表述的满意度
309 309  * 监控数据的质量(根据商定的数据质量标准)
310 310  )))
311 -|确保检测、解释事件,并在需要时尽快采取措施|(((
307 +|(% style="width:503px" %)确保检测、解释事件,并在需要时尽快采取措施|(% style="width:418px" %)(((
312 312  * 事态管理错误的影响
313 313  * 事态交流“噪音”的数量和影响
314 314  * 因为事态管理不善而无法预防或解决的事件和问题的影响
... ... @@ -332,6 +332,7 @@
332 332  图3.1中显示了监控和事态实践对服务价值链的贡献。
333 333  
334 334  
331 +(% style="text-align:center" %)
335 335  [[image:微信截图_20210217171257.png]]
336 336  
337 337  图3.1 监控和事态管理实践对价值链活动的贡献的热力图。
... ... @@ -343,7 +343,6 @@
343 343  * 设计和转换
344 344  * 改进
345 345  
346 -
347 347  == **3.2 流程** ==
348 348  
349 349  每个实践可包含一个或多个为实现该实践的目的而可能需要的流程和活动。
... ... @@ -354,7 +354,6 @@
354 354  * **事态处理流程**
355 355  * **监控和事态管理评审 **安排和触发该流程是为了评审主要事态事后分析、有关过滤和相关性分析的更新、服务“运行状况模型”、以及用于监控自动化和操作的改进。
356 356  
357 -
358 358  === **3.2.1 监控规划** ===
359 359  
360 360  |**关键输入**|**活动**|**关键输出**
... ... @@ -398,6 +398,7 @@
398 398  
399 399  
400 400  
396 +(% style="text-align:center" %)
401 401  [[image:图片3.png]]
402 402  
403 403  图3.2 监控规划流程的工作流程
... ... @@ -404,83 +404,26 @@
404 404  
405 405  
406 406  
407 -表3.2监控规划流程的活
403 +表3.2监控规划流程的活
408 408  
409 -|**活动**|**描述**
410 -|定义监控目标|(((
411 -利用从服务设计阶段、服务验证和测试实践以及服务开发(可用性,容量和性能管理实践)和服务级别管理实践收到的信息,团队定义监控的关键目标。
405 +[[image:1642237641108-965.png]]
412 412  
413 -该讨论应覆盖功效需求到功用需求(首先涵盖最明显的功能要求,例如,在应用程序的用户案例中)。另外,从关键服务性能到更多详细信息和组件,它的颗粒度应增加。
407 +[[image:1642237710166-351.png]]
414 414  
415 -团队应列出一个优先级降序的监控列表。
416 -)))
417 -|评估可用的度量监控标准|(((
418 -然后,将监控优先级列表项映射或转换为可用度量或基于可用度量的综合度量。
409 +[[image:1642237738910-108.png]]
419 419  
420 -应该探索添加度量值。
421 -)))
422 -|定义监控对象的事态类型|团队对不同类型的事态进行定义和分类。类型可以是一般性的,例如信息性,警告性,异常性,也可以取决于功能,用户组及其优先级,再通过关键监控目标的组件或类型进行划分。
423 -|定义不同事态类型的阈值|(((
424 -团队与服务或组件开发团队一起定义不同类型事态的阈值。相同的组件指标可能是根据现有的SLA和针对服务或组件定义的可用性,容量和性能的要求,它基于服务进行了不同的处理。
425 425  
426 -另外,应该将处理吞吐量的事态纳入考量,因为尽管现代IT系统几乎可以探测到任何事态,但不是所有事态都需要进行响应。因此,从最初预防灾难到后来完善组件,通常都应将监控和事态管理进行迭代开发。
427 -)))
428 -|定义服务'运行状况模型'(端到端事态)|(((
429 -根据参与服务设计的团队的输入,构建了一个“运行状况模型”,它反映了服务及其关联的关键事态。一个服务可能有几种模型。
430 430  
431 -这些模型使监控团队可以评估服务的用户体验。例如,可以为单个银行客户交易构建模型,并度量从移动应用程序中的请求(包括所有银行数据库系统到移动应用程序中完成交易的通知)花费的时间。
413 +=== **3.2.2 事态规划** ===
432 432  
433 -服务“运行状况模型”也可以实现为服务健康和性能的报告或仪表板,并由服务所有者,参与其他实践的团队和其他利益相关者临时使用。这样,有关这些服务的信息就被干系人“拉”走了。
434 -)))
435 -|定义事态关联和规则集|(((
436 -与参与服务设计的团队一起,定义事态关联和相应的规则集。
437 -
438 -某些关联可能会使用第二个事态作为对第一个事态的检查,或者进一步过滤事态的范围。同样,已定义的关联可以帮助防止事态同时发生时可能产生的负面协同效应。
439 -
440 -规则集由多个规则组成,这些规则定义了如何处理和评估特定事态的事态消息。例如,每次磁盘日志文件到达其容量时都可能生成警告事态,但是如果已生成四个以上的警告事件,则会生成异常事态。
441 -
442 -规则本身通常嵌入监控和事态处理技术中。它们由布尔类型的算法组成,用于关联已生成的事态,以创建需要传达的其他事态。这些算法可以编入通常称为关联引擎的事态管理软件中。
443 -
444 -人工智能(AI)系统可用于定义用户,管理员,系统等的典型和非典型行为。这可能形成其他检查以过滤事态。
445 -)))
446 -|将事态与行动计划、职能部门和通知对应起来|(((
447 -对于每个事态或事态组,都定义了一个行动计划以尽量减少事态的负面影响。基于行动计划,可以定义响应事态的团队或职能部门。
448 -
449 -行动计划还可以自动执行或半自动执行,包括对某些重要操作进行人工干预。
450 -
451 -在此阶段创建的行动计划成为事态程序和自动化的基础。
452 -)))
453 -
454 -
455 -=== 3.2.2 事态规划 ===
456 -
457 457  表3.3事态处理流程的输入、活动和输出
458 458  
459 -|**关键输入**|**活动**|**关键输出**
460 -|(((
461 -* 来自监控对象,监控工具的通知
462 -* 监控计划
463 -)))|(((
464 -* 事态检测
465 -* 事态日志记录
466 -* 事态过滤和相关性检查(可能是迭代的)
467 -* 事态分类
468 -* 事态响应选择
469 -* 发送通知,执行响应规程
470 -)))|(((
471 -* 事态记录
472 -* 已更新的事态统计信息
473 -* 事态响应错误
474 -* 已启动的重大事态事后反思
475 -* 利益干系人通知
476 -* 知识文章更新
477 -* 记录的事件
478 -* 更新的报告和仪表板
479 -)))
417 +[[image:1642238606576-143.png]]
480 480  
481 -
482 482  图3.3事态处理流程的工作流程
483 483  
421 +
422 +(% style="text-align:center" %)
484 484  [[image:图片4.png]]
485 485  
486 486  
... ... @@ -487,81 +487,16 @@
487 487  
488 488  表3.4事态处理流程的活动
489 489  
490 -|**活动**|**描述**
491 -|事态检测|(((
492 -监控系统检测到的事态,或作为手动监控的结果。
429 +[[image:1642237833826-395.png]]
493 493  
494 -并非所有事态都应被检测到,监控系统带宽也应纳入考量。在现有有限的资源中应仅检测到关键事件和需要采取行动的事态。
495 -)))
496 -|事态记录|事态应该最好自动记录在监控系统中。
497 -|事态过滤和相关性检查(可能是迭代的)|(((
498 -事态应该按照规则集进行处理,以过滤和查找相关性,以实现更好的分类。
431 +[[image:1642237866153-106.png]]
499 499  
500 -该活动可能是迭代的。
501 -)))
502 -|事态分类|事态分为组或类型,如果需要选择适当的响应,则在组内进一步过滤特定的事态。
503 -|事态响应选择|在监控规划流程中应该为每个事态制定行动计划或响应规程。根据规划中定义的规则,选择事态响应和通知的团队。
504 -|发送通知,执行响应规程|响应规程执行后,将通知负责操作或监督的团队(如果响应规程是全自动的)。
505 505  
506 -|**关键输入**|**活动**|**关键输出**
507 -|(((
508 -* 更新的知识文章
509 -* 重大事态记录
510 -* 重大事件记录
511 -* 改进建议
512 -* 事态记录和统计
513 -* 服务所有者和利益相关者的信息请求
514 -)))|(((
515 -* 评审重大事态和事件
516 -* 评审过滤和相关性分析
517 -* 评审服务“运行状态模式”
518 -* 评估事态的响应程序和自动化程度
519 -* 评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具
520 -* 评审监控工具收集的统计信息
521 -)))|(((
522 -* 更新的事态响应程序
523 -* 过滤和相关分析的改进建议
524 -* 针对自动化的变更
525 -* 更新的监控标准和阈值
526 -* 更新的过滤方法
527 -* 更新的被使用的工具和技术清单
528 -* 更新的已提供的报告和统计信息清单
529 -)))
530 530  
531 -
532 532  === **3.2.3 监控和事态管理评审** ===
533 533  
534 -|活动|描述
535 -|评审重大事态和事件|(((
536 -事实上,重大事件发生通常可能意味着未检测到某些异常服务或组件行为并对其采取行动。因此,重大事态和事件为监控知识发现和改进提供了良好的基础。
437 +[[image:1642237945213-442.png]]
537 537  
538 -应审查和分析重大事态的性质、相关性,并将其分解为组件甚至配置项,并应探索相应的指标,这些指标可能有助于检测导致重大事件的重大事态或异常。
539 -
540 -应探索组件的其他或类似风险,并将已识别的事态添加到监控中。
541 -
542 -建议对监控进行更改以在未来检测类似的事态。
543 -)))
544 -|(((
545 -评审过滤和相关性分析的评审
546 -
547 -评审服务的“运行状态模式”
548 -)))|当监控检测到大量事态或检测不到事态时,应进行过滤和相关性分析。有时可以考虑采取临时措施,例如放宽阈值或事态分组。否则,应进行详细分析和详尽的规则定义,以及建议对监控进行更改。
549 -|评估事态响应程序和自动化程度|(((
550 -应评审因事态响应导致的事件和故障并提出变更建议。
551 -
552 -同样,此评审的目标应是提高事态检测和事态响应的自动化程度。也可以建议其他的自动化。
553 -)))
554 -|评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具|(((
555 -应审查内部和市场上可能提高监控效率的工具。应在监控预算内建议试用和试运行。
556 -
557 -另外,此评审应该讨论监控中使用的任何新技术或最佳实践,应该进行市场基准测试的开发,并提出对监控的改进。
558 -)))
559 -|评审监控工具收集的统计信息|(((
560 -应该审查统计信息,以提出对监控的改进,并监控服务。
561 -
562 -服务生命周期涉及的所有团队均应评审检测到的服务趋势。
563 -)))
564 -
565 565  表3.6 监控和事态管理评审流程的活动
566 566  
567 567  
... ... @@ -584,215 +584,16 @@
584 584  |**М**|**Methods and techniques expert 方法和技术专家** 与该能力相关的活动和技能包括设计和工作技术的实施,程序文档,有关流程的咨询,工作分析以及持续改进。
585 585  |**Т**|**Technical expert 技术专家** 此能力专注于技术(IT)专业知识和基于专业知识的任务。
586 586  
587 -|(% style="width:203px" %)活动|(% colspan="2" style="width:205px" %)负责角色|(% colspan="2" %)能力框架|**具体技能**
588 -|(% colspan="6" %)监控规划流程
589 -|(% style="width:203px" %)定义监控目标|(% style="width:199px" %)(((
590 -服务负责人
461 +[[image:1642237990168-323.png]]
591 591  
592 -设计人
463 +[[image:1642238024237-336.png]]
593 593  
594 -开发人员
465 +[[image:1642238202293-164.png]]
595 595  
596 -用户
467 +[[image:1642238225338-195.png]]
597 597  
598 -交付经理
469 +[[image:1642238253882-729.png]]
599 599  
600 -客户经理
601 -
602 -测试人员
603 -
604 -服务验证专家
605 -
606 -运维经理
607 -)))|(% colspan="2" %)协调员、管理员(CA)|(% colspan="2" %)(((
608 -理解利益相关者的服务价值和服务主张
609 -
610 -服务级别和用户体验方面的专业知识
611 -)))
612 -|(% style="width:203px" %)(((
613 -评估可用的度量监控标准
614 -
615 -定义监控对象的事态类型
616 -
617 -定义不同事态类型的阈值
618 -)))|(% style="width:199px" %)(((
619 -测试人员
620 -
621 -服务验证专家
622 -
623 -监控专家
624 -
625 -开发人员
626 -
627 -设计人员
628 -
629 -架构师
630 -
631 -业务经理
632 -)))|(% colspan="2" %)技术专家、方法技术专家(T M)|(% colspan="2" %)(((
633 -服务架构和设计的知识
634 -
635 -监控工具,探头探测器和传感器方面的专业知识
636 -)))
637 -|(% style="width:203px" %)(((
638 -定义服务'运行状况模型'(端到端事件)
639 -
640 -定义事件关联和规则集
641 -)))|(% style="width:199px" %)(((
642 -服务负责人
643 -
644 -用户
645 -
646 -交付经理
647 -
648 -客户经理
649 -
650 -运维经理
651 -
652 -测试人员
653 -
654 -服务验证专家
655 -
656 -监控专家
657 -
658 -开发人员
659 -
660 -设计人员
661 -
662 -架构师
663 -)))|(% colspan="2" %)技术专家、方法技术专家、管理员(T M A)|(% colspan="2" %)(((
664 -用户体验的知识
665 -
666 -功效需求和功用需求的知识
667 -
668 -服务主题和业务流程知识
669 -
670 -服务架构和设计的知识
671 -
672 -监控工具、探头探测器和传感器方面的专业知识
673 -)))
674 -|(% style="width:203px" %)建立行动计划和需要响应和通知的职能部门之间的映射关系|(% style="width:199px" %)(((
675 -服务负责人
676 -
677 -用户
678 -
679 -交付经理
680 -
681 -客户经理
682 -
683 -测试人员
684 -
685 -服务验证专家
686 -
687 -监控专家
688 -
689 -开发人员
690 -
691 -设计人员
692 -
693 -架构师
694 -)))|(% colspan="2" %)管理员、技术专家、方法技术专家(A T M)|(% colspan="2" %)(((
695 -运维和支持基础设施以及组织的知识
696 -
697 -服务架构和设计的知识
698 -
699 -监控工具以及探头探测器和传感器方面的专业知识
700 -)))
701 -|(% colspan="6" %)(((
702 -事态处理流程
703 -
704 -应尽一切努力使此流程尽可能自动化,因此将不讨论该流程的角色。
705 -)))
706 -|(% colspan="6" %)监控和事态管理评审
707 -|(% style="width:203px" %)(((
708 -评审重大事件或事态
709 -
710 -评审过滤和相关性分析
711 -
712 -评审服务“运行状况模式“
713 -)))|(% style="width:199px" %)(((
714 -服务负责人
715 -
716 -用户
717 -
718 -交付经理
719 -
720 -客服经理
721 -
722 -监控专家
723 -
724 -开发人员
725 -
726 -设计人员
727 -
728 -架构师
729 -)))|(% colspan="2" %)技术专家、方法技术专家、管理员(T M A)|(% colspan="2" %)(((
730 -服务架构和设计的知识
731 -
732 -监控工具方面的专业知识
733 -
734 -服务主题知识和业务流程知识
735 -
736 -持续改进技能
737 -)))
738 -|(% style="width:203px" %)评估事态的响应程序和自动化程度|(% style="width:199px" %)(((
739 -服务负责人
740 -
741 -交付经理
742 -
743 -监控专家
744 -
745 -开发人员
746 -
747 -设计人员
748 -
749 -架构师
750 -
751 -服务台经理
752 -
753 -运维经理
754 -)))|(% colspan="2" %)管理员、技术专家、方法技术专家、协调员(ATMC)|(% colspan="2" %)(((
755 -运维和支持基础设施以及组织的知识
756 -
757 -监控工具方面的专业知识
758 -
759 -自动化专业知识
760 -
761 -服务主题知识和业务流程知识
762 -
763 -持续改进技能
764 -)))
765 -|(% style="width:203px" %)评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具|(% style="width:199px" %)(((
766 -监控专家
767 -
768 -架构师
769 -
770 -业务分析员
771 -
772 -技术顾问
773 -)))|(% colspan="2" %)方法技术专家、技术专家、管理员(MTA)|(% colspan="2" %)(((
774 -监控工具,AI,ML方面的专业知识
775 -
776 -自动化专业知识
777 -
778 -持续改进技能
779 -)))
780 -|(% style="width:203px" %)评审监控工具收集的统计信息|(% style="width:199px" %)(((
781 -监控专家
782 -
783 -架构师
784 -
785 -业务分析员
786 -)))|(% colspan="2" %)方法技术专家、技术专家、管理员(M T A)|(% colspan="2" %)(((
787 -服务架构和设计的知识
788 -
789 -监控工具方面的专业知识
790 -
791 -服务主题知识和业务流程知识
792 -
793 -持续改进技能
794 -)))
795 -
796 796  表4.1 监控和事态管理实践活动涉及的角色
797 797  
798 798  
... ... @@ -848,169 +848,19 @@
848 848  该信息可以采用各种形式。实践的关键输入和输出在本指南的“ 价值流和流程”部分中列出。
849 849  
850 850  
851 -== 5.2  自动化和工具 ==
526 +== **5.2  自动化和工具** ==
852 852  
853 853  
854 854  在某些情况下,监控和事态管理实践的工作可以大大受益于自动化(有关何时适用的详细信息,请参见本指南的“ 价值流和流程”部分)。在这种情况下,自动化是可能且有效的,它可能涉及表5.1中概述的解决方案。
855 855  
856 -|流程活动|自动化手段|关键功能|实践的效果上的影响
857 -|(% colspan="4" %)监控规划流程
858 -|(((
859 -定义监控目标
531 +[[image:1642238337737-961.png]]
860 860  
861 -评估可用的度量监控标准
533 +[[image:1642238364744-334.png]]
862 862  
863 -定义监控对象的事态类型
864 -)))|(((
865 -可视化工具(例如思维导图,服务图表,架构可视化)
535 +[[image:1642238466365-934.png]]
866 866  
867 -服务目录工具
537 +[[image:1642238480595-735.png]]
868 868  
869 -配置管理数据库
870 -)))|(((
871 -服务结构,依赖项,配置项等的可视化
872 -
873 -提供有关服务结构的信息,以及
874 -
875 -组件/ 服务的相互依赖性
876 -
877 -提供有关
878 -
879 -服务SLA和要求的信息
880 -)))|中
881 -|(((
882 -定义不同事态类型的阈值
883 -
884 -定义服务'运行状况模型'(端到端事件)
885 -
886 -定义事态关联和规则集
887 -)))|(((
888 -监控和事态管理工具
889 -
890 -ITSM工具
891 -
892 -软件定义的基础设施工具
893 -
894 -基础设施和平台内置的监控工具
895 -
896 -服务可视化工具
897 -)))|主动和被动性监控,事态设置,数据收集,数据分析,警报,规则设置|高
898 -|建立行动计划和需要响应和通知的职能部门之间的映射关系|(((
899 -监控和事态管理工具
900 -
901 -ITSM工具
902 -
903 -软件定义的基础设施工具
904 -
905 -协作和通讯工具
906 -
907 -集成总线
908 -
909 -自动化系统
910 -
911 -用于事态关联、行为监控与分析的AI和ML工具
912 -)))|(((
913 -ITSM工具集成(例如,基于事态的事件记录)
914 -
915 -通知和通讯,任务创建。
916 -
917 -自动化脚本运行
918 -
919 -AI和ML 事态关联,正常/异常行为分析
920 -)))|高
921 -|(% colspan="4" %)事态处理流程
922 -|(((
923 -事态检测
924 -
925 -事态日志记录
926 -
927 -事态过滤和相关性检查(可能是迭代的)
928 -
929 -事态分类
930 -
931 -事态响应选择
932 -
933 -发送通知、执行响应过程
934 -)))|(((
935 -监控和事态管理工具
936 -
937 -ITSM工具
938 -
939 -软件定义的基础设施工具
940 -
941 -协作和
942 -
943 -通讯工具
944 -
945 -集成总线
946 -
947 -自动化系统
948 -
949 -报告和仪表板工具和门户
950 -)))|(((
951 -ITSM工具集成(例如,基于事态的事件记录)
952 -
953 -通知和通讯,任务创建。
954 -
955 -自动化脚本运行
956 -
957 -AI和ML 事态关联,正常/异常行为分析
958 -
959 -报告和仪表板发布
960 -)))|高
961 -|(% colspan="4" %)监控和事态管理评审
962 -|(((
963 -评审重大事件或事态
964 -
965 -评审过滤和相关性分析
966 -
967 -评审服务“运行状况模式“
968 -
969 -评估事态的响应程序和自动化程度
970 -
971 -评审用于数据分析、相关性分析、人工智能和机器学习的工具
972 -
973 -评审监控工具收集的统计信息
974 -)))|(((
975 -可视化工具(例如思维导图,服务图表,架构可视化)
976 -
977 -统计分析工具,数据库
978 -
979 -服务目录工具
980 -
981 -配置管理数据库
982 -
983 -监控和事态管理工具
984 -
985 -ITSM工具
986 -
987 -协作和通讯工具
988 -
989 -报告和仪表板工具和门户
990 -
991 -业务分析工具
992 -
993 -基准工具和
994 -
995 -知识管理工具
996 -)))|(((
997 -服务结构,依赖项,配置项等的可视化
998 -
999 -提供有关服务结构和组件/ 服务相互依赖关系的信息
1000 -
1001 -提供有关服务SLA和要求,合规性和违规的信息
1002 -
1003 -提供重大事件的信息
1004 -
1005 -报告和仪表板发布
1006 -
1007 -通知,聊天
1008 -
1009 -分析和评估
1010 -
1011 -知识共享
1012 -)))|中
1013 -
1014 1014  表5.1 监控和事态管理活动的自动化解决方案
1015 1015  
1016 1016  
... ... @@ -1039,13 +1039,13 @@
1039 1039  
1040 1040  实践指南的大部分内容都应作为组织在建立和发展自己的实践时可能考虑的领域的建议。实践指南是组织可能考虑的事情的目录,而不是答案的列表。使用ITIL 实践指南的内容时,组织应始终遵循ITIL 指导原则:
1041 1041  
1042 -1. 聚焦价值
1043 -1. 从你所处的地方开始
1044 -1. 基于反馈迭代推进
1045 -1. 协作和提升可视化程度
1046 -1. 整体性思考和工作
1047 -1. 保持简单实用
1048 -1. 优化和自动化。
567 +* 聚焦价值
568 +* 从你所处的地方开始
569 +* 基于反馈迭代推进
570 +* 协作和提升可视化程度
571 +* 整体性思考和工作
572 +* 保持简单实用
573 +* 优化和自动化。
1049 1049  
1050 1050  有关指导原则及其应用程序的更多信息,请参见以下内容的第4.3节:
1051 1051  
Icon 1642237641108-965.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +99.0 KB
Content Icon
Icon 1642237710166-351.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +109.4 KB
Content Icon
Icon 1642237738910-108.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +26.9 KB
Content Icon
Icon 1642237833826-395.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +68.3 KB
Content Icon
Icon 1642237866153-106.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +50.7 KB
Content Icon
Icon 1642237945213-442.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +117.1 KB
Content Icon
Icon 1642237990168-323.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +59.9 KB
Content Icon
Icon 1642238024237-336.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +51.8 KB
Content Icon
Icon 1642238049838-958.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +39.8 KB
Content Icon
Icon 1642238202293-164.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +45.3 KB
Content Icon
Icon 1642238225338-195.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +59.3 KB
Content Icon
Icon 1642238253882-729.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +21.9 KB
Content Icon
Icon 1642238337737-961.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +69.5 KB
Content Icon
Icon 1642238364744-334.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +39.6 KB
Content Icon
Icon 1642238421478-919.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +94.3 KB
Content Icon
Icon 1642238466365-934.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +49.1 KB
Content Icon
Icon 1642238480595-735.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +71.7 KB
Content Icon
Icon 1642238606576-143.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +33.5 KB
Content Icon
深圳市艾拓先锋企业管理咨询有限公司