Changes for page 服务管理实践 - 05 监控和事态
Last modified by superadmin on 2024/12/25, 15:38
Summary
-
- 1642237641108-965.png
- 1642237710166-351.png
- 1642237738910-108.png
- 1642237833826-395.png
- 1642237866153-106.png
- 1642237945213-442.png
- 1642237990168-323.png
- 1642238024237-336.png
- 1642238049838-958.png
- 1642238202293-164.png
- 1642238225338-195.png
- 1642238253882-729.png
- 1642238337737-961.png
- 1642238364744-334.png
- 1642238421478-919.png
- 1642238466365-934.png
- 1642238480595-735.png
- 1642238606576-143.png
Details
- Page properties
-
- Title
-
... ... @@ -1,1 +1,1 @@ 1 -05 监控和事态 管理(已发布)1 +服务管理实践 - 05 监控和事态 - Content
-
... ... @@ -1,22 +1,15 @@ 1 -{{box cssClass="floatinginfobox" title="**Contents**"}} 2 -{{toc/}} 3 -{{/box}} 1 +如有[[ITIL认证>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]、[[ITIL培训>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]或[[ITIL考试>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]需求,可[[点击了解详情>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]] 4 4 5 -((( 6 -(% class="wikigeneratedid" id="H" %) 7 - 8 -))) 9 9 10 - 需要下载 **ITIL 4监控和事态管理实践【中文】**pdf版全文,请关注微信公众号itilxf ,并回复“监控和事态”即可。 11 - 12 -[[image:微信截图_20210206234644.png]] 13 - 14 - 15 15 **申明:** 16 16 17 -本系列ITIL 4 实践中文版本由ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与,需要下载最新翻译版本请关注微信公众号:ITILXF,也可访问ITIL4中文知识库网站:itil4hub.cn。6 +本系列ITIL 4中文版本由长河领导的ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与。需要下载最新翻译版本请关注微信公众号:ITILXF,并回复“**监控和事态管理**”即可。 18 18 8 +{{box cssClass="floatinginfobox" title="**Contents**"}} 9 +{{toc/}} 10 +{{/box}} 19 19 12 + 20 20 请注意,ITIL先锋论坛专家团队仅仅只是进行了这些著作的语种转换工作,我们并不拥有包括原著以及中文发行文件的任何版权,所有版权均为Axoles持有,读者在使用这些文件(含本中文翻译版本)时需完全遵守Axoles 和 TSO所申明的所有版权要求。 21 21 22 22 ... ... @@ -40,7 +40,6 @@ 40 40 * 支持监控和事态管理的信息和技术 41 41 * 合作伙伴和供应商对监控和事态管理的思考 42 42 43 - 44 44 == **1.1** **ITIL®4 认证体系** == 45 45 46 46 本文件所选内容可作为以下教学大纲的一部分进行考查: ... ... @@ -62,6 +62,7 @@ 62 62 63 63 监控和事态管理实践的目的是系统地观察服务和服务组件,将其状态变化识别为事态并进行记录和报告。该实践识别基础设施、服务、业务流程和信息安全等事态,确定其优先级,建立对这些事态的适当响应,包括对可能导致潜在故障或事件的条件作出响应。 64 64 57 + 65 65 |((( 66 66 **事态** 67 67 ... ... @@ -103,6 +103,7 @@ 103 103 104 104 监控通过多种不同的方式得以实现。配置项(CIs)可以通过轮询(即响应监控工具收集特定目标数据的请求)或通过在满足某些条件时自动通知监控工具来共享有关其自身的信息。监控工具对服务组件的询问代表着主动监控,而配置项(CIs)向监控工具发送的通知代表着被动监控。 105 105 99 +(% style="text-align:center" %) 106 106 [[image:图片1.png]] 107 107 108 108 ... ... @@ -117,6 +117,7 @@ 117 117 118 118 尽管监控和事态管理传统上专注于服务的技术组件,但对了解其他服务管理资源和活动(包括流程,人员和供应商)的状态也很有用。 119 119 114 + 120 120 |((( 121 121 **指标** 122 122 ... ... @@ -194,13 +194,14 @@ 194 194 195 195 尽管有些活动和责任领域仍然与监控和事态管理实践密切相关,但它们并没有被包含其中。表2.1中列出了它们以及那些包含了它们的实践的相关引用。重要的是要记住,ITIL实践只是那些在价值流环境中被使用的工具的集合,应根据情况进行必要的组合。 196 196 197 -|活动|实践指南 198 -|事件的管理|事件管理 199 -|事态和趋势的原因调查|问题管理 200 -|响应事态的变更管理|变更支持 201 -|与用户沟通|服务台 202 -|基于监控数据的决策支持|度量和报告 203 -|设置服务质量和性能的目标和阈值|((( 192 +(% style="width:476px" %) 193 +|(% style="width:320px" %)活动|(% style="width:153px" %)实践指南 194 +|(% style="width:320px" %)事件的管理|(% style="width:153px" %)事件管理 195 +|(% style="width:320px" %)事态和趋势的原因调查|(% style="width:153px" %)问题管理 196 +|(% style="width:320px" %)响应事态的变更管理|(% style="width:153px" %)变更支持 197 +|(% style="width:320px" %)与用户沟通|(% style="width:153px" %)服务台 198 +|(% style="width:320px" %)基于监控数据的决策支持|(% style="width:153px" %)度量和报告 199 +|(% style="width:320px" %)设置服务质量和性能的目标和阈值|(% style="width:153px" %)((( 204 204 服务级别管理 205 205 206 206 可用性管理 ... ... @@ -211,12 +211,12 @@ 211 211 212 212 连续性管理 213 213 ))) 214 -|设置基础设施和应用程序组件的阈值|((( 210 +|(% style="width:320px" %)设置基础设施和应用程序组件的阈值|(% style="width:153px" %)((( 215 215 基础设施和平台管理 216 216 217 217 软件开发和管理 218 218 ))) 219 -|设定第三方服务的目标和门槛|供应商管理 215 +|(% style="width:320px" %)设定第三方服务的目标和门槛|(% style="width:153px" %)供应商管理 220 220 221 221 表2.1其他实践指南中描述的与监控和事态管理相关的活动 222 222 ... ... @@ -232,7 +232,7 @@ 232 232 * 确保及时,相关且足够的监控数据提供给相关的利益相关者 233 233 * 确保发现、解释事态,并在需要时尽快采取措施 234 234 235 -=== 2.4.1 建立和维护描述各类事态和探测它们所需的监控功能的方法/模型 === 231 +=== **2.4.1 建立和维护描述各类事态和探测它们所需的监控功能的方法/模型** === 236 236 237 237 在大多数情况下,现代技术为度量和监控服务以及服务组件操作的各个方面提供了机会,但是从业人员应认真管理监控的范围以及度量指标的频率和数量。现代监控和事态管理实践的主要挑战不是缺少数据,而是监控必须处理的数据的规模。监控和事态管理实践的重点应该是获取有意义的信息,以支持服务的操作与改进,决策和价值的创造。建立或改进监控和事态管理实践时,应考虑以下方面: 238 238 ... ... @@ -269,7 +269,7 @@ 269 269 许多IT 监控工具和EMS本身很可能由第三方供应商提供,监控和事态管理实践和供应商管理实践将保持稳定的工作关系。 270 270 271 271 272 -=== 2.4.2 确保将及时,相关且足够的监控数据提供给相关的利益相关者 === 268 +=== **2.4.2 确保将及时,相关且足够的监控数据提供给相关的利益相关者** === 273 273 274 274 当根据原始服务设计和与客户达成的服务级别协议(SLA)进行基准校对时,监控和事态管理的报告能够使服务提供者的实际操作性能和行为基本真实。监控和事态管理提供了直接的观察结果、基于事实的经验证据,而不是预期或期望的结果。 275 275 ... ... @@ -278,7 +278,7 @@ 278 278 监控和事态管理确定了薄弱区域,因此可以采取补救行动(如果有正当的业务案例),以改进将来的服务质量。监控和事态管理还可以显示客户动作在哪里导致故障,并确定工作效率和/或培训可以在哪些地方得到改善。监控和事态管理还可以同时处理内部和外部供应商,因为他们的绩效必须得到评估和管理。 279 279 280 280 281 -=== 2.4.3 确保探测、解释事件,并在需要时尽快采取措施 === 277 +=== **2.4.3 确保探测、解释事件,并在需要时尽快采取措施** === 282 282 283 283 仅仅为监控和事态管理定义规则还不够,事态的实际探测和处理程序才能使这些规则有价值。事态管理的效率和范围在很大程度上取决于服务架构和服务管理自动化水平。在数字化基础设施和现代应用程序中,许多用于监控和事态管理的工具是内置的,实践的重点是事态处理规则的集成和调整。 284 284 ... ... @@ -297,17 +297,18 @@ 297 297 298 298 监控和事态管理实践的关键指标已映射到其实践成功因素(PSF)。它们可以用作价值流环境中的KPI,以评估监控和事态管理实践对那些价值流的效果和效率的贡献。表2.2中给出了一些关键指标的示例。 299 299 300 -|**实践成功因素**|**指标样例** 301 -|建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力|((( 296 +(% style="width:923px" %) 297 +|(% style="width:503px" %)**实践成功因素**|(% style="width:418px" %)**指标样例** 298 +|(% style="width:503px" %)建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力|(% style="width:418px" %)((( 302 302 * 利益相关者对监控和事态管理方法的满意度 303 303 * 组织对方法的坚持 304 304 * 未遵循或发现不切实际的方法建议/要求的百分比 305 305 ))) 306 -|确保向利益相关者提供及时、相关和充分的监控数据|((( 303 +|(% style="width:503px" %)确保向利益相关者提供及时、相关和充分的监控数据|(% style="width:418px" %)((( 307 307 * 利益相关者对监控数据及其表述的满意度 308 308 * 监控数据的质量(根据商定的数据质量标准) 309 309 ))) 310 -|确保检测、解释事件,并在需要时尽快采取措施|((( 307 +|(% style="width:503px" %)确保检测、解释事件,并在需要时尽快采取措施|(% style="width:418px" %)((( 311 311 * 事态管理错误的影响 312 312 * 事态交流“噪音”的数量和影响 313 313 * 因为事态管理不善而无法预防或解决的事件和问题的影响 ... ... @@ -331,6 +331,7 @@ 331 331 图3.1中显示了监控和事态实践对服务价值链的贡献。 332 332 333 333 331 +(% style="text-align:center" %) 334 334 [[image:微信截图_20210217171257.png]] 335 335 336 336 图3.1 监控和事态管理实践对价值链活动的贡献的热力图。 ... ... @@ -395,6 +395,7 @@ 395 395 396 396 397 397 396 +(% style="text-align:center" %) 398 398 [[image:图片3.png]] 399 399 400 400 图3.2 监控规划流程的工作流程 ... ... @@ -401,81 +401,26 @@ 401 401 402 402 403 403 404 -表3.2监控规划流程的活 403 +表3.2监控规划流程的活动 405 405 406 -|**活动**|**描述** 407 -|定义监控目标|((( 408 -利用从服务设计阶段、服务验证和测试实践以及服务开发(可用性,容量和性能管理实践)和服务级别管理实践收到的信息,团队定义监控的关键目标。 405 +[[image:1642237641108-965.png]] 409 409 410 - 该讨论应覆盖功效需求到功用需求(首先涵盖最明显的功能要求,例如,在应用程序的用户案例中)。另外,从关键服务性能到更多详细信息和组件,它的颗粒度应增加。407 +[[image:1642237710166-351.png]] 411 411 412 -团队应列出一个优先级降序的监控列表。 413 -))) 414 -|评估可用的度量监控标准|((( 415 -然后,将监控优先级列表项映射或转换为可用度量或基于可用度量的综合度量。 409 +[[image:1642237738910-108.png]] 416 416 417 -应该探索添加度量值。 418 -))) 419 -|定义监控对象的事态类型|团队对不同类型的事态进行定义和分类。类型可以是一般性的,例如信息性,警告性,异常性,也可以取决于功能,用户组及其优先级,再通过关键监控目标的组件或类型进行划分。 420 -|定义不同事态类型的阈值|((( 421 -团队与服务或组件开发团队一起定义不同类型事态的阈值。相同的组件指标可能是根据现有的SLA和针对服务或组件定义的可用性,容量和性能的要求,它基于服务进行了不同的处理。 422 422 423 -另外,应该将处理吞吐量的事态纳入考量,因为尽管现代IT系统几乎可以探测到任何事态,但不是所有事态都需要进行响应。因此,从最初预防灾难到后来完善组件,通常都应将监控和事态管理进行迭代开发。 424 -))) 425 -|定义服务'运行状况模型'(端到端事态)|((( 426 -根据参与服务设计的团队的输入,构建了一个“运行状况模型”,它反映了服务及其关联的关键事态。一个服务可能有几种模型。 427 427 428 - 这些模型使监控团队可以评估服务的用户体验。例如,可以为单个银行客户交易构建模型,并度量从移动应用程序中的请求(包括所有银行数据库系统到移动应用程序中完成交易的通知)花费的时间。413 +=== **3.2.2 事态规划** === 429 429 430 -服务“运行状况模型”也可以实现为服务健康和性能的报告或仪表板,并由服务所有者,参与其他实践的团队和其他利益相关者临时使用。这样,有关这些服务的信息就被干系人“拉”走了。 431 -))) 432 -|定义事态关联和规则集|((( 433 -与参与服务设计的团队一起,定义事态关联和相应的规则集。 434 - 435 -某些关联可能会使用第二个事态作为对第一个事态的检查,或者进一步过滤事态的范围。同样,已定义的关联可以帮助防止事态同时发生时可能产生的负面协同效应。 436 - 437 -规则集由多个规则组成,这些规则定义了如何处理和评估特定事态的事态消息。例如,每次磁盘日志文件到达其容量时都可能生成警告事态,但是如果已生成四个以上的警告事件,则会生成异常事态。 438 - 439 -规则本身通常嵌入监控和事态处理技术中。它们由布尔类型的算法组成,用于关联已生成的事态,以创建需要传达的其他事态。这些算法可以编入通常称为关联引擎的事态管理软件中。 440 - 441 -人工智能(AI)系统可用于定义用户,管理员,系统等的典型和非典型行为。这可能形成其他检查以过滤事态。 442 -))) 443 -|将事态与行动计划、职能部门和通知对应起来|((( 444 -对于每个事态或事态组,都定义了一个行动计划以尽量减少事态的负面影响。基于行动计划,可以定义响应事态的团队或职能部门。 445 - 446 -行动计划还可以自动执行或半自动执行,包括对某些重要操作进行人工干预。 447 - 448 -在此阶段创建的行动计划成为事态程序和自动化的基础。 449 -))) 450 - 451 -=== 3.2.2 事态规划 === 452 - 453 453 表3.3事态处理流程的输入、活动和输出 454 454 455 -|**关键输入**|**活动**|**关键输出** 456 -|((( 457 -* 来自监控对象,监控工具的通知 458 -* 监控计划 459 -)))|((( 460 -* 事态检测 461 -* 事态日志记录 462 -* 事态过滤和相关性检查(可能是迭代的) 463 -* 事态分类 464 -* 事态响应选择 465 -* 发送通知,执行响应规程 466 -)))|((( 467 -* 事态记录 468 -* 已更新的事态统计信息 469 -* 事态响应错误 470 -* 已启动的重大事态事后反思 471 -* 利益干系人通知 472 -* 知识文章更新 473 -* 记录的事件 474 -* 更新的报告和仪表板 475 -))) 417 +[[image:1642238606576-143.png]] 476 476 477 477 图3.3事态处理流程的工作流程 478 478 421 + 422 +(% style="text-align:center" %) 479 479 [[image:图片4.png]] 480 480 481 481 ... ... @@ -482,80 +482,16 @@ 482 482 483 483 表3.4事态处理流程的活动 484 484 485 -|**活动**|**描述** 486 -|事态检测|((( 487 -监控系统检测到的事态,或作为手动监控的结果。 429 +[[image:1642237833826-395.png]] 488 488 489 -并非所有事态都应被检测到,监控系统带宽也应纳入考量。在现有有限的资源中应仅检测到关键事件和需要采取行动的事态。 490 -))) 491 -|事态记录|事态应该最好自动记录在监控系统中。 492 -|事态过滤和相关性检查(可能是迭代的)|((( 493 -事态应该按照规则集进行处理,以过滤和查找相关性,以实现更好的分类。 431 +[[image:1642237866153-106.png]] 494 494 495 -该活动可能是迭代的。 496 -))) 497 -|事态分类|事态分为组或类型,如果需要选择适当的响应,则在组内进一步过滤特定的事态。 498 -|事态响应选择|在监控规划流程中应该为每个事态制定行动计划或响应规程。根据规划中定义的规则,选择事态响应和通知的团队。 499 -|发送通知,执行响应规程|响应规程执行后,将通知负责操作或监督的团队(如果响应规程是全自动的)。 500 500 501 -|**关键输入**|**活动**|**关键输出** 502 -|((( 503 -* 更新的知识文章 504 -* 重大事态记录 505 -* 重大事件记录 506 -* 改进建议 507 -* 事态记录和统计 508 -* 服务所有者和利益相关者的信息请求 509 -)))|((( 510 -* 评审重大事态和事件 511 -* 评审过滤和相关性分析 512 -* 评审服务“运行状态模式” 513 -* 评估事态的响应程序和自动化程度 514 -* 评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具 515 -* 评审监控工具收集的统计信息 516 -)))|((( 517 -* 更新的事态响应程序 518 -* 过滤和相关分析的改进建议 519 -* 针对自动化的变更 520 -* 更新的监控标准和阈值 521 -* 更新的过滤方法 522 -* 更新的被使用的工具和技术清单 523 -* 更新的已提供的报告和统计信息清单 524 -))) 525 525 526 526 === **3.2.3 监控和事态管理评审** === 527 527 528 -|活动|描述 529 -|评审重大事态和事件|((( 530 -事实上,重大事件发生通常可能意味着未检测到某些异常服务或组件行为并对其采取行动。因此,重大事态和事件为监控知识发现和改进提供了良好的基础。 437 +[[image:1642237945213-442.png]] 531 531 532 -应审查和分析重大事态的性质、相关性,并将其分解为组件甚至配置项,并应探索相应的指标,这些指标可能有助于检测导致重大事件的重大事态或异常。 533 - 534 -应探索组件的其他或类似风险,并将已识别的事态添加到监控中。 535 - 536 -建议对监控进行更改以在未来检测类似的事态。 537 -))) 538 -|((( 539 -评审过滤和相关性分析的评审 540 - 541 -评审服务的“运行状态模式” 542 -)))|当监控检测到大量事态或检测不到事态时,应进行过滤和相关性分析。有时可以考虑采取临时措施,例如放宽阈值或事态分组。否则,应进行详细分析和详尽的规则定义,以及建议对监控进行更改。 543 -|评估事态响应程序和自动化程度|((( 544 -应评审因事态响应导致的事件和故障并提出变更建议。 545 - 546 -同样,此评审的目标应是提高事态检测和事态响应的自动化程度。也可以建议其他的自动化。 547 -))) 548 -|评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具|((( 549 -应审查内部和市场上可能提高监控效率的工具。应在监控预算内建议试用和试运行。 550 - 551 -另外,此评审应该讨论监控中使用的任何新技术或最佳实践,应该进行市场基准测试的开发,并提出对监控的改进。 552 -))) 553 -|评审监控工具收集的统计信息|((( 554 -应该审查统计信息,以提出对监控的改进,并监控服务。 555 - 556 -服务生命周期涉及的所有团队均应评审检测到的服务趋势。 557 -))) 558 - 559 559 表3.6 监控和事态管理评审流程的活动 560 560 561 561 ... ... @@ -578,215 +578,16 @@ 578 578 |**М**|**Methods and techniques expert 方法和技术专家** 与该能力相关的活动和技能包括设计和工作技术的实施,程序文档,有关流程的咨询,工作分析以及持续改进。 579 579 |**Т**|**Technical expert 技术专家** 此能力专注于技术(IT)专业知识和基于专业知识的任务。 580 580 581 -|(% style="width:203px" %)活动|(% colspan="2" style="width:205px" %)负责角色|(% colspan="2" %)能力框架|**具体技能** 582 -|(% colspan="6" %)监控规划流程 583 -|(% style="width:203px" %)定义监控目标|(% style="width:199px" %)((( 584 -服务负责人 461 +[[image:1642237990168-323.png]] 585 585 586 - 设计人463 +[[image:1642238024237-336.png]] 587 587 588 - 开发人员465 +[[image:1642238202293-164.png]] 589 589 590 - 用户467 +[[image:1642238225338-195.png]] 591 591 592 - 交付经理469 +[[image:1642238253882-729.png]] 593 593 594 -客户经理 595 - 596 -测试人员 597 - 598 -服务验证专家 599 - 600 -运维经理 601 -)))|(% colspan="2" %)协调员、管理员(CA)|(% colspan="2" %)((( 602 -理解利益相关者的服务价值和服务主张 603 - 604 -服务级别和用户体验方面的专业知识 605 -))) 606 -|(% style="width:203px" %)((( 607 -评估可用的度量监控标准 608 - 609 -定义监控对象的事态类型 610 - 611 -定义不同事态类型的阈值 612 -)))|(% style="width:199px" %)((( 613 -测试人员 614 - 615 -服务验证专家 616 - 617 -监控专家 618 - 619 -开发人员 620 - 621 -设计人员 622 - 623 -架构师 624 - 625 -业务经理 626 -)))|(% colspan="2" %)技术专家、方法技术专家(T M)|(% colspan="2" %)((( 627 -服务架构和设计的知识 628 - 629 -监控工具,探头探测器和传感器方面的专业知识 630 -))) 631 -|(% style="width:203px" %)((( 632 -定义服务'运行状况模型'(端到端事件) 633 - 634 -定义事件关联和规则集 635 -)))|(% style="width:199px" %)((( 636 -服务负责人 637 - 638 -用户 639 - 640 -交付经理 641 - 642 -客户经理 643 - 644 -运维经理 645 - 646 -测试人员 647 - 648 -服务验证专家 649 - 650 -监控专家 651 - 652 -开发人员 653 - 654 -设计人员 655 - 656 -架构师 657 -)))|(% colspan="2" %)技术专家、方法技术专家、管理员(T M A)|(% colspan="2" %)((( 658 -用户体验的知识 659 - 660 -功效需求和功用需求的知识 661 - 662 -服务主题和业务流程知识 663 - 664 -服务架构和设计的知识 665 - 666 -监控工具、探头探测器和传感器方面的专业知识 667 -))) 668 -|(% style="width:203px" %)建立行动计划和需要响应和通知的职能部门之间的映射关系|(% style="width:199px" %)((( 669 -服务负责人 670 - 671 -用户 672 - 673 -交付经理 674 - 675 -客户经理 676 - 677 -测试人员 678 - 679 -服务验证专家 680 - 681 -监控专家 682 - 683 -开发人员 684 - 685 -设计人员 686 - 687 -架构师 688 -)))|(% colspan="2" %)管理员、技术专家、方法技术专家(A T M)|(% colspan="2" %)((( 689 -运维和支持基础设施以及组织的知识 690 - 691 -服务架构和设计的知识 692 - 693 -监控工具以及探头探测器和传感器方面的专业知识 694 -))) 695 -|(% colspan="6" %)((( 696 -事态处理流程 697 - 698 -应尽一切努力使此流程尽可能自动化,因此将不讨论该流程的角色。 699 -))) 700 -|(% colspan="6" %)监控和事态管理评审 701 -|(% style="width:203px" %)((( 702 -评审重大事件或事态 703 - 704 -评审过滤和相关性分析 705 - 706 -评审服务“运行状况模式“ 707 -)))|(% style="width:199px" %)((( 708 -服务负责人 709 - 710 -用户 711 - 712 -交付经理 713 - 714 -客服经理 715 - 716 -监控专家 717 - 718 -开发人员 719 - 720 -设计人员 721 - 722 -架构师 723 -)))|(% colspan="2" %)技术专家、方法技术专家、管理员(T M A)|(% colspan="2" %)((( 724 -服务架构和设计的知识 725 - 726 -监控工具方面的专业知识 727 - 728 -服务主题知识和业务流程知识 729 - 730 -持续改进技能 731 -))) 732 -|(% style="width:203px" %)评估事态的响应程序和自动化程度|(% style="width:199px" %)((( 733 -服务负责人 734 - 735 -交付经理 736 - 737 -监控专家 738 - 739 -开发人员 740 - 741 -设计人员 742 - 743 -架构师 744 - 745 -服务台经理 746 - 747 -运维经理 748 -)))|(% colspan="2" %)管理员、技术专家、方法技术专家、协调员(ATMC)|(% colspan="2" %)((( 749 -运维和支持基础设施以及组织的知识 750 - 751 -监控工具方面的专业知识 752 - 753 -自动化专业知识 754 - 755 -服务主题知识和业务流程知识 756 - 757 -持续改进技能 758 -))) 759 -|(% style="width:203px" %)评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具|(% style="width:199px" %)((( 760 -监控专家 761 - 762 -架构师 763 - 764 -业务分析员 765 - 766 -技术顾问 767 -)))|(% colspan="2" %)方法技术专家、技术专家、管理员(MTA)|(% colspan="2" %)((( 768 -监控工具,AI,ML方面的专业知识 769 - 770 -自动化专业知识 771 - 772 -持续改进技能 773 -))) 774 -|(% style="width:203px" %)评审监控工具收集的统计信息|(% style="width:199px" %)((( 775 -监控专家 776 - 777 -架构师 778 - 779 -业务分析员 780 -)))|(% colspan="2" %)方法技术专家、技术专家、管理员(M T A)|(% colspan="2" %)((( 781 -服务架构和设计的知识 782 - 783 -监控工具方面的专业知识 784 - 785 -服务主题知识和业务流程知识 786 - 787 -持续改进技能 788 -))) 789 - 790 790 表4.1 监控和事态管理实践活动涉及的角色 791 791 792 792 ... ... @@ -842,169 +842,19 @@ 842 842 该信息可以采用各种形式。实践的关键输入和输出在本指南的“ 价值流和流程”部分中列出。 843 843 844 844 845 -== 5.2 自动化和工具 == 526 +== **5.2 自动化和工具** == 846 846 847 847 848 848 在某些情况下,监控和事态管理实践的工作可以大大受益于自动化(有关何时适用的详细信息,请参见本指南的“ 价值流和流程”部分)。在这种情况下,自动化是可能且有效的,它可能涉及表5.1中概述的解决方案。 849 849 850 -|流程活动|自动化手段|关键功能|实践的效果上的影响 851 -|(% colspan="4" %)监控规划流程 852 -|((( 853 -定义监控目标 531 +[[image:1642238337737-961.png]] 854 854 855 - 评估可用的度量监控标准533 +[[image:1642238364744-334.png]] 856 856 857 -定义监控对象的事态类型 858 -)))|((( 859 -可视化工具(例如思维导图,服务图表,架构可视化) 535 +[[image:1642238466365-934.png]] 860 860 861 - 服务目录工具537 +[[image:1642238480595-735.png]] 862 862 863 -配置管理数据库 864 -)))|((( 865 -服务结构,依赖项,配置项等的可视化 866 - 867 -提供有关服务结构的信息,以及 868 - 869 -组件/ 服务的相互依赖性 870 - 871 -提供有关 872 - 873 -服务SLA和要求的信息 874 -)))|中 875 -|((( 876 -定义不同事态类型的阈值 877 - 878 -定义服务'运行状况模型'(端到端事件) 879 - 880 -定义事态关联和规则集 881 -)))|((( 882 -监控和事态管理工具 883 - 884 -ITSM工具 885 - 886 -软件定义的基础设施工具 887 - 888 -基础设施和平台内置的监控工具 889 - 890 -服务可视化工具 891 -)))|主动和被动性监控,事态设置,数据收集,数据分析,警报,规则设置|高 892 -|建立行动计划和需要响应和通知的职能部门之间的映射关系|((( 893 -监控和事态管理工具 894 - 895 -ITSM工具 896 - 897 -软件定义的基础设施工具 898 - 899 -协作和通讯工具 900 - 901 -集成总线 902 - 903 -自动化系统 904 - 905 -用于事态关联、行为监控与分析的AI和ML工具 906 -)))|((( 907 -ITSM工具集成(例如,基于事态的事件记录) 908 - 909 -通知和通讯,任务创建。 910 - 911 -自动化脚本运行 912 - 913 -AI和ML 事态关联,正常/异常行为分析 914 -)))|高 915 -|(% colspan="4" %)事态处理流程 916 -|((( 917 -事态检测 918 - 919 -事态日志记录 920 - 921 -事态过滤和相关性检查(可能是迭代的) 922 - 923 -事态分类 924 - 925 -事态响应选择 926 - 927 -发送通知、执行响应过程 928 -)))|((( 929 -监控和事态管理工具 930 - 931 -ITSM工具 932 - 933 -软件定义的基础设施工具 934 - 935 -协作和 936 - 937 -通讯工具 938 - 939 -集成总线 940 - 941 -自动化系统 942 - 943 -报告和仪表板工具和门户 944 -)))|((( 945 -ITSM工具集成(例如,基于事态的事件记录) 946 - 947 -通知和通讯,任务创建。 948 - 949 -自动化脚本运行 950 - 951 -AI和ML 事态关联,正常/异常行为分析 952 - 953 -报告和仪表板发布 954 -)))|高 955 -|(% colspan="4" %)监控和事态管理评审 956 -|((( 957 -评审重大事件或事态 958 - 959 -评审过滤和相关性分析 960 - 961 -评审服务“运行状况模式“ 962 - 963 -评估事态的响应程序和自动化程度 964 - 965 -评审用于数据分析、相关性分析、人工智能和机器学习的工具 966 - 967 -评审监控工具收集的统计信息 968 -)))|((( 969 -可视化工具(例如思维导图,服务图表,架构可视化) 970 - 971 -统计分析工具,数据库 972 - 973 -服务目录工具 974 - 975 -配置管理数据库 976 - 977 -监控和事态管理工具 978 - 979 -ITSM工具 980 - 981 -协作和通讯工具 982 - 983 -报告和仪表板工具和门户 984 - 985 -业务分析工具 986 - 987 -基准工具和 988 - 989 -知识管理工具 990 -)))|((( 991 -服务结构,依赖项,配置项等的可视化 992 - 993 -提供有关服务结构和组件/ 服务相互依赖关系的信息 994 - 995 -提供有关服务SLA和要求,合规性和违规的信息 996 - 997 -提供重大事件的信息 998 - 999 -报告和仪表板发布 1000 - 1001 -通知,聊天 1002 - 1003 -分析和评估 1004 - 1005 -知识共享 1006 -)))|中 1007 - 1008 1008 表5.1 监控和事态管理活动的自动化解决方案 1009 1009 1010 1010 ... ... @@ -1033,13 +1033,13 @@ 1033 1033 1034 1034 实践指南的大部分内容都应作为组织在建立和发展自己的实践时可能考虑的领域的建议。实践指南是组织可能考虑的事情的目录,而不是答案的列表。使用ITIL 实践指南的内容时,组织应始终遵循ITIL 指导原则: 1035 1035 1036 - 1.聚焦价值1037 - 1.从你所处的地方开始1038 - 1.基于反馈迭代推进1039 - 1.协作和提升可视化程度1040 - 1.整体性思考和工作1041 - 1.保持简单实用1042 - 1.优化和自动化。567 +* 聚焦价值 568 +* 从你所处的地方开始 569 +* 基于反馈迭代推进 570 +* 协作和提升可视化程度 571 +* 整体性思考和工作 572 +* 保持简单实用 573 +* 优化和自动化。 1043 1043 1044 1044 有关指导原则及其应用程序的更多信息,请参见以下内容的第4.3节: 1045 1045
- 1642237641108-965.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +99.0 KB - Content
- 1642237710166-351.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +109.4 KB - Content
- 1642237738910-108.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +26.9 KB - Content
- 1642237833826-395.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +68.3 KB - Content
- 1642237866153-106.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +50.7 KB - Content
- 1642237945213-442.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +117.1 KB - Content
- 1642237990168-323.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +59.9 KB - Content
- 1642238024237-336.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +51.8 KB - Content
- 1642238049838-958.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +39.8 KB - Content
- 1642238202293-164.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +45.3 KB - Content
- 1642238225338-195.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +59.3 KB - Content
- 1642238253882-729.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +21.9 KB - Content
- 1642238337737-961.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +69.5 KB - Content
- 1642238364744-334.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +39.6 KB - Content
- 1642238421478-919.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +94.3 KB - Content
- 1642238466365-934.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +49.1 KB - Content
- 1642238480595-735.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +71.7 KB - Content
- 1642238606576-143.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +33.5 KB - Content