Changes for page 服务管理实践 - 05 监控和事态
Last modified by superadmin on 2024/12/25, 15:38
Summary
-
- 1642237641108-965.png
- 1642237710166-351.png
- 1642237738910-108.png
- 1642237833826-395.png
- 1642237866153-106.png
- 1642237945213-442.png
- 1642237990168-323.png
- 1642238024237-336.png
- 1642238049838-958.png
- 1642238202293-164.png
- 1642238225338-195.png
- 1642238253882-729.png
- 1642238337737-961.png
- 1642238364744-334.png
- 1642238421478-919.png
- 1642238466365-934.png
- 1642238480595-735.png
- 1642238606576-143.png
Details
- Page properties
-
- Title
-
... ... @@ -1,1 +1,1 @@ 1 -05 监控和事态 管理(尚未发布)1 +服务管理实践 - 05 监控和事态 - Content
-
... ... @@ -1,22 +1,17 @@ 1 -{{ box cssClass="floatinginfobox" title="**Contents**"}}2 - {{toc/}}3 -{{/ box}}1 +{{info}} 2 +**学习长河老师 ¥799元 [[ITIL4基础级认证核心考点讲解和习题辅导网课>>https://www.itil4hub.cn/bin/view/ITIL4%E8%AE%A4%E8%AF%81%E5%9F%B9%E8%AE%AD%E8%80%83%E8%AF%95%E8%B5%84%E6%96%99/ITIL4%E5%9F%BA%E7%A1%80%E8%AE%A4%E8%AF%81%E5%BF%85%E8%80%83%E7%9F%A5%E8%AF%86%E9%80%9F%E5%AD%A6%E7%BD%91%E8%AF%BE/]],领取500元考试券** 3 +{{/info}} 4 4 5 -((( 6 -(% class="wikigeneratedid" id="H" %) 7 - 8 -))) 9 9 10 - 需要下载 **ITIL 4监控和事态管理实践【中文】**pdf版全文,请关注微信公众号itilxf ,并回复“监控和事态”即可。 11 - 12 -[[image:微信截图_20210206234644.png]] 13 - 14 - 15 15 **申明:** 16 16 17 -本系列ITIL 4 实践中文版本由ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与,需要下载最新翻译版本请关注微信公众号:ITILXF,也可访问ITIL4中文知识库网站:itil4hub.cn。8 +本系列ITIL 4中文版本由长河领导的ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与。需要下载最新翻译版本请关注微信公众号:ITILXF,并回复“**监控和事态管理**”即可。 18 18 10 +{{box cssClass="floatinginfobox" title="**Contents**"}} 11 +{{toc/}} 12 +{{/box}} 19 19 14 + 20 20 请注意,ITIL先锋论坛专家团队仅仅只是进行了这些著作的语种转换工作,我们并不拥有包括原著以及中文发行文件的任何版权,所有版权均为Axoles持有,读者在使用这些文件(含本中文翻译版本)时需完全遵守Axoles 和 TSO所申明的所有版权要求。 21 21 22 22 ... ... @@ -55,11 +55,13 @@ 55 55 56 56 = **2 一般信息** = 57 57 53 + 58 58 == **2.1 目的和描述** == 59 59 60 60 61 61 监控和事态管理实践的目的是系统地观察服务和服务组件,将其状态变化识别为事态并进行记录和报告。该实践识别基础设施、服务、业务流程和信息安全等事态,确定其优先级,建立对这些事态的适当响应,包括对可能导致潜在故障或事件的条件作出响应。 62 62 59 + 63 63 |((( 64 64 **事态** 65 65 ... ... @@ -101,6 +101,7 @@ 101 101 102 102 监控通过多种不同的方式得以实现。配置项(CIs)可以通过轮询(即响应监控工具收集特定目标数据的请求)或通过在满足某些条件时自动通知监控工具来共享有关其自身的信息。监控工具对服务组件的询问代表着主动监控,而配置项(CIs)向监控工具发送的通知代表着被动监控。 103 103 101 +(% style="text-align:center" %) 104 104 [[image:图片1.png]] 105 105 106 106 ... ... @@ -115,6 +115,7 @@ 115 115 116 116 尽管监控和事态管理传统上专注于服务的技术组件,但对了解其他服务管理资源和活动(包括流程,人员和供应商)的状态也很有用。 117 117 116 + 118 118 |((( 119 119 **指标** 120 120 ... ... @@ -192,13 +192,14 @@ 192 192 193 193 尽管有些活动和责任领域仍然与监控和事态管理实践密切相关,但它们并没有被包含其中。表2.1中列出了它们以及那些包含了它们的实践的相关引用。重要的是要记住,ITIL实践只是那些在价值流环境中被使用的工具的集合,应根据情况进行必要的组合。 194 194 195 -|活动|实践指南 196 -|事件的管理|事件管理 197 -|事态和趋势的原因调查|问题管理 198 -|响应事态的变更管理|变更支持 199 -|与用户沟通|服务台 200 -|基于监控数据的决策支持|度量和报告 201 -|设置服务质量和性能的目标和阈值|((( 194 +(% style="width:476px" %) 195 +|(% style="width:320px" %)活动|(% style="width:153px" %)实践指南 196 +|(% style="width:320px" %)事件的管理|(% style="width:153px" %)事件管理 197 +|(% style="width:320px" %)事态和趋势的原因调查|(% style="width:153px" %)问题管理 198 +|(% style="width:320px" %)响应事态的变更管理|(% style="width:153px" %)变更支持 199 +|(% style="width:320px" %)与用户沟通|(% style="width:153px" %)服务台 200 +|(% style="width:320px" %)基于监控数据的决策支持|(% style="width:153px" %)度量和报告 201 +|(% style="width:320px" %)设置服务质量和性能的目标和阈值|(% style="width:153px" %)((( 202 202 服务级别管理 203 203 204 204 可用性管理 ... ... @@ -209,12 +209,12 @@ 209 209 210 210 连续性管理 211 211 ))) 212 -|设置基础设施和应用程序组件的阈值|((( 212 +|(% style="width:320px" %)设置基础设施和应用程序组件的阈值|(% style="width:153px" %)((( 213 213 基础设施和平台管理 214 214 215 215 软件开发和管理 216 216 ))) 217 -|设定第三方服务的目标和门槛|供应商管理 217 +|(% style="width:320px" %)设定第三方服务的目标和门槛|(% style="width:153px" %)供应商管理 218 218 219 219 表2.1其他实践指南中描述的与监控和事态管理相关的活动 220 220 ... ... @@ -230,7 +230,7 @@ 230 230 * 确保及时,相关且足够的监控数据提供给相关的利益相关者 231 231 * 确保发现、解释事态,并在需要时尽快采取措施 232 232 233 -=== 2.4.1 建立和维护描述各类事态和探测它们所需的监控功能的方法/模型 === 233 +=== **2.4.1 建立和维护描述各类事态和探测它们所需的监控功能的方法/模型** === 234 234 235 235 在大多数情况下,现代技术为度量和监控服务以及服务组件操作的各个方面提供了机会,但是从业人员应认真管理监控的范围以及度量指标的频率和数量。现代监控和事态管理实践的主要挑战不是缺少数据,而是监控必须处理的数据的规模。监控和事态管理实践的重点应该是获取有意义的信息,以支持服务的操作与改进,决策和价值的创造。建立或改进监控和事态管理实践时,应考虑以下方面: 236 236 ... ... @@ -267,7 +267,7 @@ 267 267 许多IT 监控工具和EMS本身很可能由第三方供应商提供,监控和事态管理实践和供应商管理实践将保持稳定的工作关系。 268 268 269 269 270 -=== 2.4.2 确保将及时,相关且足够的监控数据提供给相关的利益相关者 === 270 +=== **2.4.2 确保将及时,相关且足够的监控数据提供给相关的利益相关者** === 271 271 272 272 当根据原始服务设计和与客户达成的服务级别协议(SLA)进行基准校对时,监控和事态管理的报告能够使服务提供者的实际操作性能和行为基本真实。监控和事态管理提供了直接的观察结果、基于事实的经验证据,而不是预期或期望的结果。 273 273 ... ... @@ -276,7 +276,7 @@ 276 276 监控和事态管理确定了薄弱区域,因此可以采取补救行动(如果有正当的业务案例),以改进将来的服务质量。监控和事态管理还可以显示客户动作在哪里导致故障,并确定工作效率和/或培训可以在哪些地方得到改善。监控和事态管理还可以同时处理内部和外部供应商,因为他们的绩效必须得到评估和管理。 277 277 278 278 279 -=== 2.4.3 确保探测、解释事件,并在需要时尽快采取措施 === 279 +=== **2.4.3 确保探测、解释事件,并在需要时尽快采取措施** === 280 280 281 281 仅仅为监控和事态管理定义规则还不够,事态的实际探测和处理程序才能使这些规则有价值。事态管理的效率和范围在很大程度上取决于服务架构和服务管理自动化水平。在数字化基础设施和现代应用程序中,许多用于监控和事态管理的工具是内置的,实践的重点是事态处理规则的集成和调整。 282 282 ... ... @@ -295,17 +295,18 @@ 295 295 296 296 监控和事态管理实践的关键指标已映射到其实践成功因素(PSF)。它们可以用作价值流环境中的KPI,以评估监控和事态管理实践对那些价值流的效果和效率的贡献。表2.2中给出了一些关键指标的示例。 297 297 298 -|**实践成功因素**|**指标样例** 299 -|建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力|((( 298 +(% style="width:923px" %) 299 +|(% style="width:503px" %)**实践成功因素**|(% style="width:418px" %)**指标样例** 300 +|(% style="width:503px" %)建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力|(% style="width:418px" %)((( 300 300 * 利益相关者对监控和事态管理方法的满意度 301 301 * 组织对方法的坚持 302 302 * 未遵循或发现不切实际的方法建议/要求的百分比 303 303 ))) 304 -|确保向利益相关者提供及时、相关和充分的监控数据|((( 305 +|(% style="width:503px" %)确保向利益相关者提供及时、相关和充分的监控数据|(% style="width:418px" %)((( 305 305 * 利益相关者对监控数据及其表述的满意度 306 306 * 监控数据的质量(根据商定的数据质量标准) 307 307 ))) 308 -|确保检测、解释事件,并在需要时尽快采取措施|((( 309 +|(% style="width:503px" %)确保检测、解释事件,并在需要时尽快采取措施|(% style="width:418px" %)((( 309 309 * 事态管理错误的影响 310 310 * 事态交流“噪音”的数量和影响 311 311 * 因为事态管理不善而无法预防或解决的事件和问题的影响 ... ... @@ -328,13 +328,13 @@ 328 328 329 329 图3.1中显示了监控和事态实践对服务价值链的贡献。 330 330 331 -[[image:file:///C:\Users\19805\AppData\Local\Temp\ksohtml15296\wps8.png]] 332 332 333 -图3.1 监控和事态管理实践对价值链活动的贡献的热力图。 334 - 333 +(% style="text-align:center" %) 335 335 [[image:微信截图_20210217171257.png]] 336 336 336 +图3.1 监控和事态管理实践对价值链活动的贡献的热力图。 337 337 338 + 338 338 监控和事态管理实践贡献的主要价值链活动是: 339 339 340 340 * 交付和支持 ... ... @@ -393,183 +393,66 @@ 393 393 表3.1 监控规划流程的输入、活动和输出 394 394 395 395 397 + 398 +(% style="text-align:center" %) 396 396 [[image:图片3.png]] 397 397 398 398 图3.2 监控规划流程的工作流程 399 399 400 400 401 -表3.2监控规划流程的活 402 402 403 -|**活动**|**描述** 404 -|定义监控目标|((( 405 -利用从服务设计阶段、服务验证和测试实践以及服务开发(可用性,容量和性能管理实践)和服务级别管理实践收到的信息,团队定义监控的关键目标。 405 +表3.2监控规划流程的活动 406 406 407 - 该讨论应覆盖功效需求到功用需求(首先涵盖最明显的功能要求,例如,在应用程序的用户案例中)。另外,从关键服务性能到更多详细信息和组件,它的颗粒度应增加。407 +[[image:1642237641108-965.png]] 408 408 409 -团队应列出一个优先级降序的监控列表。 410 -))) 411 -|评估可用的度量监控标准|((( 412 -然后,将监控优先级列表项映射或转换为可用度量或基于可用度量的综合度量。 409 +[[image:1642237710166-351.png]] 413 413 414 -应该探索添加度量值。 415 -))) 416 -|定义监控对象的事态类型|团队对不同类型的事态进行定义和分类。类型可以是一般性的,例如信息性,警告性,异常性,也可以取决于功能,用户组及其优先级,再通过关键监控目标的组件或类型进行划分。 417 -|定义不同事态类型的阈值|((( 418 -团队与服务或组件开发团队一起定义不同类型事态的阈值。相同的组件指标可能是根据现有的SLA和针对服务或组件定义的可用性,容量和性能的要求,它基于服务进行了不同的处理。 411 +[[image:1642237738910-108.png]] 419 419 420 -另外,应该将处理吞吐量的事态纳入考量,因为尽管现代IT系统几乎可以探测到任何事态,但不是所有事态都需要进行响应。因此,从最初预防灾难到后来完善组件,通常都应将监控和事态管理进行迭代开发。 421 -))) 422 -|定义服务'运行状况模型'(端到端事态)|((( 423 -根据参与服务设计的团队的输入,构建了一个“运行状况模型”,它反映了服务及其关联的关键事态。一个服务可能有几种模型。 424 424 425 -这些模型使监控团队可以评估服务的用户体验。例如,可以为单个银行客户交易构建模型,并度量从移动应用程序中的请求(包括所有银行数据库系统到移动应用程序中完成交易的通知)花费的时间。 426 426 427 -服务“运行状况模型”也可以实现为服务健康和性能的报告或仪表板,并由服务所有者,参与其他实践的团队和其他利益相关者临时使用。这样,有关这些服务的信息就被干系人“拉”走了。 428 -))) 429 -|定义事态关联和规则集|((( 430 -与参与服务设计的团队一起,定义事态关联和相应的规则集。 415 +=== **3.2.2 事态规划** === 431 431 432 -某些关联可能会使用第二个事态作为对第一个事态的检查,或者进一步过滤事态的范围。同样,已定义的关联可以帮助防止事态同时发生时可能产生的负面协同效应。 433 - 434 -规则集由多个规则组成,这些规则定义了如何处理和评估特定事态的事态消息。例如,每次磁盘日志文件到达其容量时都可能生成警告事态,但是如果已生成四个以上的警告事件,则会生成异常事态。 435 - 436 -规则本身通常嵌入监控和事态处理技术中。它们由布尔类型的算法组成,用于关联已生成的事态,以创建需要传达的其他事态。这些算法可以编入通常称为关联引擎的事态管理软件中。 437 - 438 -人工智能(AI)系统可用于定义用户,管理员,系统等的典型和非典型行为。这可能形成其他检查以过滤事态。 439 -))) 440 -|将事态与行动计划、职能部门和通知对应起来|((( 441 -对于每个事态或事态组,都定义了一个行动计划以尽量减少事态的负面影响。基于行动计划,可以定义响应事态的团队或职能部门。 442 - 443 -行动计划还可以自动执行或半自动执行,包括对某些重要操作进行人工干预。 444 - 445 -在此阶段创建的行动计划成为事态程序和自动化的基础。 446 -))) 447 - 448 -=== 3.2.2 事态规划 === 449 - 450 450 表3.3事态处理流程的输入、活动和输出 451 451 452 -|**关键输入**|**活动**|**关键输出** 453 -|((( 454 -* 来自监控对象,监控工具的通知 455 -* 监控计划 456 -)))|((( 457 -* 事态检测 458 -* 事态日志记录 459 -* 事态过滤和相关性检查(可能是迭代的) 460 -* 事态分类 461 -* 事态响应选择 462 -* 发送通知,执行响应规程 463 -)))|((( 464 -* 事态记录 465 -* 已更新的事态统计信息 466 -* 事态响应错误 467 -* 已启动的重大事态事后反思 468 -* 利益干系人通知 469 -* 知识文章更新 470 -* 记录的事件 471 -* 更新的报告和仪表板 472 -))) 419 +[[image:1642238606576-143.png]] 473 473 474 474 图3.3事态处理流程的工作流程 475 475 423 + 424 +(% style="text-align:center" %) 476 476 [[image:图片4.png]] 477 477 478 -[[image:file:///C:\Users\19805\AppData\Local\Temp\ksohtml15296\wps11.jpg]] 479 479 480 480 481 481 表3.4事态处理流程的活动 482 482 483 -|**活动**|**描述** 484 -|事态检测|((( 485 -监控系统检测到的事态,或作为手动监控的结果。 431 +[[image:1642237833826-395.png]] 486 486 487 -并非所有事态都应被检测到,监控系统带宽也应纳入考量。在现有有限的资源中应仅检测到关键事件和需要采取行动的事态。 488 -))) 489 -|事态记录|事态应该最好自动记录在监控系统中。 490 -|事态过滤和相关性检查(可能是迭代的)|((( 491 -事态应该按照规则集进行处理,以过滤和查找相关性,以实现更好的分类。 433 +[[image:1642237866153-106.png]] 492 492 493 -该活动可能是迭代的。 494 -))) 495 -|事态分类|事态分为组或类型,如果需要选择适当的响应,则在组内进一步过滤特定的事态。 496 -|事态响应选择|在监控规划流程中应该为每个事态制定行动计划或响应规程。根据规划中定义的规则,选择事态响应和通知的团队。 497 -|发送通知,执行响应规程|响应规程执行后,将通知负责操作或监督的团队(如果响应规程是全自动的)。 498 498 499 -|**关键输入**|**活动**|**关键输出** 500 -|((( 501 -* 更新的知识文章 502 -* 重大事态记录 503 -* 重大事件记录 504 -* 改进建议 505 -* 事态记录和统计 506 -* 服务所有者和利益相关者的信息请求 507 -)))|((( 508 -* 评审重大事态和事件 509 -* 评审过滤和相关性分析 510 -* 评审服务“运行状态模式” 511 -* 评估事态的响应程序和自动化程度 512 -* 评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具 513 -* 评审监控工具收集的统计信息 514 -)))|((( 515 -* 更新的事态响应程序 516 -* 过滤和相关分析的改进建议 517 -* 针对自动化的变更 518 -* 更新的监控标准和阈值 519 -* 更新的过滤方法 520 -* 更新的被使用的工具和技术清单 521 -* 更新的已提供的报告和统计信息清单 522 -))) 523 523 524 524 === **3.2.3 监控和事态管理评审** === 525 525 526 -|活动|描述 527 -|评审重大事态和事件|((( 528 -事实上,重大事件发生通常可能意味着未检测到某些异常服务或组件行为并对其采取行动。因此,重大事态和事件为监控知识发现和改进提供了良好的基础。 439 +[[image:1642237945213-442.png]] 529 529 530 - 应审查和分析重大事态的性质、相关性,并将其分解为组件甚至配置项,并应探索相应的指标,这些指标可能有助于检测导致重大事件的重大事态或异常。441 +表3.6 监控和事态管理评审流程的活动 531 531 532 -应探索组件的其他或类似风险,并将已识别的事态添加到监控中。 533 533 534 -建议对监控进行更改以在未来检测类似的事态。 535 -))) 536 -|((( 537 -评审过滤和相关性分析的评审 538 538 539 -评审服务的“运行状态模式” 540 -)))|当监控检测到大量事态或检测不到事态时,应进行过滤和相关性分析。有时可以考虑采取临时措施,例如放宽阈值或事态分组。否则,应进行详细分析和详尽的规则定义,以及建议对监控进行更改。 541 -|评估事态响应程序和自动化程度|((( 542 -应评审因事态响应导致的事件和故障并提出变更建议。 543 - 544 -同样,此评审的目标应是提高事态检测和事态响应的自动化程度。也可以建议其他的自动化。 545 -))) 546 -|评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具|((( 547 -应审查内部和市场上可能提高监控效率的工具。应在监控预算内建议试用和试运行。 548 - 549 -另外,此评审应该讨论监控中使用的任何新技术或最佳实践,应该进行市场基准测试的开发,并提出对监控的改进。 550 -))) 551 -|评审监控工具收集的统计信息|((( 552 -应该审查统计信息,以提出对监控的改进,并监控服务。 553 - 554 -服务生命周期涉及的所有团队均应评审检测到的服务趋势。 555 -))) 556 - 557 -**表3.6 监控和事态管理评审流程的活动** 558 - 559 - 560 - 561 561 ---- 562 562 563 -= 4 447 += **4 ** **组织和人员** = 564 564 565 565 566 566 == **4.1 角色,能力和责任** == 567 567 568 - **实践指南没有描述实践管理的角色,例如实践所有者,实践领导者或实践教练。实践指南着重于每个实践的专家角色。每个角色的结构和命名都可能在组织间存在差异,因此ITIL中定义的任何角色都不应被视为强制性的,甚至不被视为建议。请记住,角色不是职务头衔。一个人可以担任多个角色,同样,一个角色可以分配给多个人。**452 +实践指南没有描述实践管理的角色,例如实践所有者,实践领导者或实践教练。实践指南着重于每个实践的专家角色。每个角色的结构和命名都可能在组织间存在差异,因此ITIL中定义的任何角色都不应被视为强制性的,甚至不被视为建议。请记住,角色不是职务头衔。一个人可以担任多个角色,同样,一个角色可以分配给多个人。 569 569 570 - **流程和活动中描述了角色。每个角色可以基于以下能力框架模型进行描述:**454 +流程和活动中描述了角色。每个角色可以基于以下能力框架模型进行描述: 571 571 572 -| **能力代码**|**描述**456 +|能力代码|描述 573 573 |**L**|**Leader 领导者** 与此能力相关的活动和技能包括决策、授权、监督其他活动、激励措施和动机、以及评估结果。 574 574 |**А**|**Administrator 管理员** 与此功能相关的活动和技能包括任务的分配和优先级,记录保存,持续报告以及基本改进计划。 575 575 |**C**|**Coordinator/Communicator 协调员/沟通者** 与此能力相关的活动和技能包括多方协调,利益相关方之间的沟通以及开展提高认识行动。 ... ... @@ -576,224 +576,25 @@ 576 576 |**М**|**Methods and techniques expert 方法和技术专家** 与该能力相关的活动和技能包括设计和工作技术的实施,程序文档,有关流程的咨询,工作分析以及持续改进。 577 577 |**Т**|**Technical expert 技术专家** 此能力专注于技术(IT)专业知识和基于专业知识的任务。 578 578 579 -|(% style="width:203px" %)**活动**|(% colspan="2" style="width:205px" %)**负责角色**|(% colspan="2" %)**能力框架**|**具体技能** 580 -|(% colspan="6" %)**监控规划流程** 581 -|(% style="width:203px" %)**定义监控目标**|(% style="width:199px" %)((( 582 -**服务负责人** 463 +[[image:1642237990168-323.png]] 583 583 584 - **设计人**465 +[[image:1642238024237-336.png]] 585 585 586 - **开发人员**467 +[[image:1642238202293-164.png]] 587 587 588 - **用户**469 +[[image:1642238225338-195.png]] 589 589 590 - **交付经理**471 +[[image:1642238253882-729.png]] 591 591 592 - **客户经理**473 +表4.1 监控和事态管理实践活动涉及的角色 593 593 594 -**测试人员** 595 595 596 -**服务验证专家** 597 - 598 -**运维经理** 599 -)))|(% colspan="2" %)**协调员、管理员(CA)**|(% colspan="2" %)((( 600 -**理解利益相关者的服务价值和服务主张** 601 - 602 -**服务级别和用户体验方面的专业知识** 603 -))) 604 -|(% style="width:203px" %)((( 605 -**评估可用的度量监控标准** 606 - 607 -**定义监控对象的事态类型** 608 - 609 -**定义不同事态类型的阈值** 610 -)))|(% style="width:199px" %)((( 611 -**测试人员** 612 - 613 -**服务验证专家** 614 - 615 -**监控专家** 616 - 617 -**开发人员** 618 - 619 -**设计人员** 620 - 621 -**架构师** 622 - 623 -**业务经理** 624 -)))|(% colspan="2" %)**技术专家、方法技术专家(T M)**|(% colspan="2" %)((( 625 -**服务架构和设计的知识** 626 - 627 -**监控工具,探头探测器和传感器方面的专业知识** 628 -))) 629 -|(% style="width:203px" %)((( 630 -**定义服务'运行状况模型'(端到端事件)** 631 - 632 -**定义事件关联和规则集** 633 -)))|(% style="width:199px" %)((( 634 -**服务负责人** 635 - 636 -**用户** 637 - 638 -**交付经理** 639 - 640 -**客户经理** 641 - 642 -**运维经理** 643 - 644 -**测试人员** 645 - 646 -**服务验证专家** 647 - 648 -**监控专家** 649 - 650 -**开发人员** 651 - 652 -**设计人员** 653 - 654 -**架构师** 655 -)))|(% colspan="2" %)**技术专家、方法技术专家、管理员(T M A)**|(% colspan="2" %)((( 656 -**用户体验的知识** 657 - 658 -**功效需求和功用需求的知识** 659 - 660 -**服务主题和业务流程知识** 661 - 662 -**服务架构和设计的知识** 663 - 664 -**监控工具、探头探测器和传感器方面的专业知识** 665 -))) 666 -|(% style="width:203px" %)**建立行动计划和需要响应和通知的职能部门之间的映射关系**|(% style="width:199px" %)((( 667 -**服务负责人** 668 - 669 -**用户** 670 - 671 -**交付经理** 672 - 673 -**客户经理** 674 - 675 -**测试人员** 676 - 677 -**服务验证专家** 678 - 679 -**监控专家** 680 - 681 -**开发人员** 682 - 683 -**设计人员** 684 - 685 -**架构师** 686 -)))|(% colspan="2" %)**管理员、技术专家、方法技术专家(A T M)**|(% colspan="2" %)((( 687 -**运维和支持基础设施以及组织的知识** 688 - 689 -**服务架构和设计的知识** 690 - 691 -**监控工具以及探头探测器和传感器方面的专业知识** 692 -))) 693 -|(% colspan="6" %)((( 694 -**事态处理流程** 695 - 696 -**应尽一切努力使此流程尽可能自动化,因此将不讨论该流程的角色。** 697 -))) 698 -|(% colspan="6" %)**监控和事态管理评审** 699 -|(% style="width:203px" %)((( 700 -**评审重大事件或事态** 701 - 702 -**评审过滤和相关性分析** 703 - 704 -**评审服务“运行状况模式“** 705 -)))|(% style="width:199px" %)((( 706 -**服务负责人** 707 - 708 -**用户** 709 - 710 -**交付经理** 711 - 712 -**客服经理** 713 - 714 -**监控专家** 715 - 716 -**开发人员** 717 - 718 -**设计人员** 719 - 720 -**架构师** 721 -)))|(% colspan="2" %)**技术专家、方法技术专家、管理员(T M A)**|(% colspan="2" %)((( 722 -**服务架构和设计的知识** 723 - 724 -**监控工具方面的专业知识** 725 - 726 -**服务主题知识和业务流程知识** 727 - 728 -**持续改进技能** 729 -))) 730 -|(% style="width:203px" %)**评估事态的响应程序和自动化程度**|(% style="width:199px" %)((( 731 -**服务负责人** 732 - 733 -**交付经理** 734 - 735 -**监控专家** 736 - 737 -**开发人员** 738 - 739 -**设计人员** 740 - 741 -**架构师** 742 - 743 -**服务台经理** 744 - 745 -**运维经理** 746 -)))|(% colspan="2" %)**管理员、技术专家、方法技术专家、协调员(ATMC)**|(% colspan="2" %)((( 747 -**运维和支持基础设施以及组织的知识** 748 - 749 -**监控工具方面的专业知识** 750 - 751 -**自动化专业知识** 752 - 753 -**服务主题知识和业务流程知识** 754 - 755 -**持续改进技能** 756 -))) 757 -|(% style="width:203px" %)**评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具**|(% style="width:199px" %)((( 758 -**监控专家** 759 - 760 -**架构师** 761 - 762 -**业务分析员** 763 - 764 -**技术顾问** 765 -)))|(% colspan="2" %)**方法技术专家、技术专家、管理员(MTA)**|(% colspan="2" %)((( 766 -**监控工具,AI,ML方面的专业知识** 767 - 768 -**自动化专业知识** 769 - 770 -**持续改进技能** 771 -))) 772 -|(% style="width:203px" %)**评审监控工具收集的统计信息**|(% style="width:199px" %)((( 773 -**监控专家** 774 - 775 -**架构师** 776 - 777 -**业务分析员** 778 -)))|(% colspan="2" %)**方法技术专家、技术专家、管理员(M T A)**|(% colspan="2" %)((( 779 -**服务架构和设计的知识** 780 - 781 -**监控工具方面的专业知识** 782 - 783 -**服务主题知识和业务流程知识** 784 - 785 -**持续改进技能** 786 -))) 787 - 788 -**表4.1 监控和事态管理实践活动涉及的角色** 789 - 790 - 791 791 == **4.2 组织结构和团队** == 792 792 793 793 794 - **组织中很少有专门的监控和事态管理团队。通常,负责服务交付和运维的人员是参与监控的人员。**479 +组织中很少有专门的监控和事态管理团队。通常,负责服务交付和运维的人员是参与监控的人员。 795 795 796 - **确保在服务生命周期的设计阶段规划监控是很重要的。因此,负责监控的人员应该参与设计阶段,开发服务或组件的团队可以将服务移交给运维和建立监控。这包括架构师,软件开发团队,基础设施团队,设计人员,负责服务验证、可用性、连续性、容量和性能的团队,等等。**481 +确保在服务生命周期的设计阶段规划监控是很重要的。因此,负责监控的人员应该参与设计阶段,开发服务或组件的团队可以将服务移交给运维和建立监控。这包括架构师,软件开发团队,基础设施团队,设计人员,负责服务验证、可用性、连续性、容量和性能的团队,等等。 797 797 798 798 799 799 ... ... @@ -805,222 +805,72 @@ 805 805 == **5.1 信息交流** == 806 806 807 807 808 - **监控和事态管理实践的效果基于所使用信息的质量。该信息包括但不限于以下信息:**493 +监控和事态管理实践的效果基于所使用信息的质量。该信息包括但不限于以下信息: 809 809 810 810 1. ((( 811 - **客户和用户**496 +客户和用户 812 812 ))) 813 813 1. ((( 814 - **服务,及其架构和设计,接受标准和SLA**499 +服务,及其架构和设计,接受标准和SLA 815 815 ))) 816 816 1. ((( 817 - **合作伙伴和供应商,包括有关它们提供的服务的SLA信息**502 +合作伙伴和供应商,包括有关它们提供的服务的SLA信息 818 818 ))) 819 819 1. ((( 820 - **规范服务提供的政策和要求**505 +规范服务提供的政策和要求 821 821 ))) 822 822 1. ((( 823 - **持续的服务交付,包括:**508 +持续的服务交付,包括: 824 824 ))) 825 825 826 -* **有关当前运行的服务状态的信息**827 -* **服务功效需求和功用需求**828 -* **可用的服务指标**829 -* **服务依赖的配置项**830 -* **服务组件与其性能之间的相互依赖性**831 -* **有关重大事件的信息**832 -* **与已计划的和正在进行的变更及其对服务性能的预期影响有关的信息**833 -* **可用性,容量和性能目标**834 -* **负责服务和组件的团队**835 -* **有关服务的知识文章**511 +* 有关当前运行的服务状态的信息 512 +* 服务功效需求和功用需求 513 +* 可用的服务指标 514 +* 服务依赖的配置项 515 +* 服务组件与其性能之间的相互依赖性 516 +* 有关重大事件的信息 517 +* 与已计划的和正在进行的变更及其对服务性能的预期影响有关的信息 518 +* 可用性,容量和性能目标 519 +* 负责服务和组件的团队 520 +* 有关服务的知识文章 836 836 837 - **~6.有关服务改进状态的信息**522 + 6.有关服务改进状态的信息 838 838 839 839 840 - **该信息可以采用各种形式。实践的关键输入和输出在本指南的“ 价值流和流程”部分中列出。**525 +该信息可以采用各种形式。实践的关键输入和输出在本指南的“ 价值流和流程”部分中列出。 841 841 842 842 843 843 == **5.2 自动化和工具** == 844 844 845 845 846 - **在某些情况下,监控和事态管理实践的工作可以大大受益于自动化(有关何时适用的详细信息,请参见本指南的“ 价值流和流程”部分)。在这种情况下,自动化是可能且有效的,它可能涉及表5.1中概述的解决方案。**531 +在某些情况下,监控和事态管理实践的工作可以大大受益于自动化(有关何时适用的详细信息,请参见本指南的“ 价值流和流程”部分)。在这种情况下,自动化是可能且有效的,它可能涉及表5.1中概述的解决方案。 847 847 848 -|**流程活动**|**自动化手段**|**关键功能**|**实践的效果上的影响** 849 -|(% colspan="4" %)**监控规划流程** 850 -|((( 851 -**定义监控目标** 533 +[[image:1642238337737-961.png]] 852 852 853 - **评估可用的度量监控标准**535 +[[image:1642238364744-334.png]] 854 854 855 -**定义监控对象的事态类型** 856 -)))|((( 857 -**可视化工具(例如思维导图,服务图表,架构可视化)** 537 +[[image:1642238466365-934.png]] 858 858 859 - **服务目录工具**539 +[[image:1642238480595-735.png]] 860 860 861 -**配置管理数据库** 862 -)))|((( 863 -**服务结构,依赖项,配置项等的可视化** 541 +表5.1 监控和事态管理活动的自动化解决方案 864 864 865 -**提供有关服务结构的信息,以及** 866 866 867 -**组件/ 服务的相互依赖性** 868 868 869 -**提供有关** 870 - 871 -**服务SLA和要求的信息** 872 -)))|**中** 873 -|((( 874 -**定义不同事态类型的阈值** 875 - 876 -**定义服务'运行状况模型'(端到端事件)** 877 - 878 -**定义事态关联和规则集** 879 -)))|((( 880 -**监控和事态管理工具** 881 - 882 -**ITSM工具** 883 - 884 -**软件定义的基础设施工具** 885 - 886 -**基础设施和平台内置的监控工具** 887 - 888 -**服务可视化工具** 889 -)))|**主动和被动性监控,事态设置,数据收集,数据分析,警报,规则设置**|**高** 890 -|**建立行动计划和需要响应和通知的职能部门之间的映射关系**|((( 891 -**监控和事态管理工具** 892 - 893 -**ITSM工具** 894 - 895 -**软件定义的基础设施工具** 896 - 897 -**协作和通讯工具** 898 - 899 -**集成总线** 900 - 901 -**自动化系统** 902 - 903 -**用于事态关联、行为监控与分析的AI和ML工具** 904 -)))|((( 905 -**ITSM工具集成(例如,基于事态的事件记录)** 906 - 907 -**通知和通讯,任务创建。** 908 - 909 -**自动化脚本运行** 910 - 911 -**AI和ML 事态关联,正常/异常行为分析** 912 -)))|**高** 913 -|(% colspan="4" %)**事态处理流程** 914 -|((( 915 -**事态检测** 916 - 917 -**事态日志记录** 918 - 919 -**事态过滤和相关性检查(可能是迭代的)** 920 - 921 -**事态分类** 922 - 923 -**事态响应选择** 924 - 925 -**发送通知、执行响应过程** 926 -)))|((( 927 -**监控和事态管理工具** 928 - 929 -**ITSM工具** 930 - 931 -**软件定义的基础设施工具** 932 - 933 -**协作和** 934 - 935 -**通讯工具** 936 - 937 -**集成总线** 938 - 939 -**自动化系统** 940 - 941 -**报告和仪表板工具和门户** 942 -)))|((( 943 -**ITSM工具集成(例如,基于事态的事件记录)** 944 - 945 -**通知和通讯,任务创建。** 946 - 947 -**自动化脚本运行** 948 - 949 -**AI和ML 事态关联,正常/异常行为分析** 950 - 951 -**报告和仪表板发布** 952 -)))|**高** 953 -|(% colspan="4" %)**监控和事态管理评审** 954 -|((( 955 -**评审重大事件或事态** 956 - 957 -**评审过滤和相关性分析** 958 - 959 -**评审服务“运行状况模式“** 960 - 961 -**评估事态的响应程序和自动化程度** 962 - 963 -**评审用于数据分析、相关性分析、人工智能和机器学习的工具** 964 - 965 -**评审监控工具收集的统计信息** 966 -)))|((( 967 -**可视化工具(例如思维导图,服务图表,架构可视化)** 968 - 969 -**统计分析工具,数据库** 970 - 971 -**服务目录工具** 972 - 973 -**配置管理数据库** 974 - 975 -**监控和事态管理工具** 976 - 977 -**ITSM工具** 978 - 979 -**协作和通讯工具** 980 - 981 -**报告和仪表板工具和门户** 982 - 983 -**业务分析工具** 984 - 985 -**基准工具和** 986 - 987 -**知识管理工具** 988 -)))|((( 989 -**服务结构,依赖项,配置项等的可视化** 990 - 991 -**提供有关服务结构和组件/ 服务相互依赖关系的信息** 992 - 993 -**提供有关服务SLA和要求,合规性和违规的信息** 994 - 995 -**提供重大事件的信息** 996 - 997 -**报告和仪表板发布** 998 - 999 -**通知,聊天** 1000 - 1001 -**分析和评估** 1002 - 1003 -**知识共享** 1004 -)))|**中** 1005 - 1006 -**表5.1 监控和事态管理活动的自动化解决方案** 1007 - 1008 - 1009 - 1010 1010 ---- 1011 1011 1012 1012 = **6 合作伙伴和供应商** = 1013 1013 1014 1014 1015 - **只有很少的服务是使用自己的资源提供的。大多数(如果不是全部)依赖于其他服务,这些服务通常由组织以外的第三方提供(请参阅ITIL//®//Foundation:ITIL 4 Edition出版物中的第2.4节,了解服务关系的模型)。支持服务在供应商管理的实践指南中介绍了关系和依赖性。**550 +只有很少的服务是使用自己的资源提供的。大多数(如果不是全部)依赖于其他服务,这些服务通常由组织以外的第三方提供(请参阅ITIL//®//Foundation:ITIL 4 Edition出版物中的第2.4节,了解服务关系的模型)。支持服务在供应商管理的实践指南中介绍了关系和依赖性。 1016 1016 1017 - **通信和云服务的开发使得外部监控服务非常受欢迎。配置项像服务器,数据库实例可以安装监控代理并将信息输入云存储库。这样的解决方案使其他使用了AI和机器学习(ML)的分析变得更容易,更便宜。这种解决方案中的机器学习(ML)通过合并来自数千个监控对象的数据以及对系统和用户的正常和异常行为理解的不断修正而得到改进。**552 +通信和云服务的开发使得外部监控服务非常受欢迎。配置项像服务器,数据库实例可以安装监控代理并将信息输入云存储库。这样的解决方案使其他使用了AI和机器学习(ML)的分析变得更容易,更便宜。这种解决方案中的机器学习(ML)通过合并来自数千个监控对象的数据以及对系统和用户的正常和异常行为理解的不断修正而得到改进。 1018 1018 1019 - **另一个重要的考量是涉及到外包服务和组件监控权限的问题,因此组织会控制与服务提供者达成共识的度量标准。**554 +另一个重要的考量是涉及到外包服务和组件监控权限的问题,因此组织会控制与服务提供者达成共识的度量标准。 1020 1020 1021 - **此外,必须将外部供应商开发的所有服务设计为具有监控功能,这意味着设计的服务必须能够提供有关其性能和运行状态的信息。**556 +此外,必须将外部供应商开发的所有服务设计为具有监控功能,这意味着设计的服务必须能够提供有关其性能和运行状态的信息。 1022 1022 1023 - **当组织旨在确保监控和事态管理快速有效时,他们通常会试图同意与合作伙伴和供应商的密切合作,消除沟通,协作和决策方面的正式官僚障碍。有关更多信息,请参考供应商管理实践指南。**558 +当组织旨在确保监控和事态管理快速有效时,他们通常会试图同意与合作伙伴和供应商的密切合作,消除沟通,协作和决策方面的正式官僚障碍。有关更多信息,请参考供应商管理实践指南。 1024 1024 1025 1025 1026 1026 ... ... @@ -1029,19 +1029,19 @@ 1029 1029 = **7 重要提醒** = 1030 1030 1031 1031 1032 - **实践指南的大部分内容都应作为组织在建立和发展自己的实践时可能考虑的领域的建议。实践指南是组织可能考虑的事情的目录,而不是答案的列表。使用ITIL 实践指南的内容时,组织应始终遵循ITIL 指导原则:**567 +实践指南的大部分内容都应作为组织在建立和发展自己的实践时可能考虑的领域的建议。实践指南是组织可能考虑的事情的目录,而不是答案的列表。使用ITIL 实践指南的内容时,组织应始终遵循ITIL 指导原则: 1033 1033 1034 - 1.**聚焦价值**1035 - 1.**从你所处的地方开始**1036 - 1.**基于反馈迭代推进**1037 - 1.**协作和提升可视化程度**1038 - 1.**整体性思考和工作**1039 - 1.**保持简单实用**1040 - 1.**优化和自动化。**569 +* 聚焦价值 570 +* 从你所处的地方开始 571 +* 基于反馈迭代推进 572 +* 协作和提升可视化程度 573 +* 整体性思考和工作 574 +* 保持简单实用 575 +* 优化和自动化。 1041 1041 1042 - **有关指导原则及其应用程序的更多信息,请参见以下内容的第4.3节:**577 +有关指导原则及其应用程序的更多信息,请参见以下内容的第4.3节: 1043 1043 1044 - **//ITIL®Foundation:ITIL 4Edition//.**579 +//ITIL®Foundation:ITIL 4Edition//. 1045 1045 1046 1046 1047 1047 ... ... @@ -1050,14 +1050,14 @@ 1050 1050 = **8 致谢** = 1051 1051 1052 1052 1053 - **AXELOS Ltd非常感谢为本指南的开发做出贡献的每一个人。这些实践指南融合了ITIL社区前所未有的热情和反馈。AXELOS特别要感谢以下人员。**588 +AXELOS Ltd非常感谢为本指南的开发做出贡献的每一个人。这些实践指南融合了ITIL社区前所未有的热情和反馈。AXELOS特别要感谢以下人员。 1054 1054 1055 1055 1056 1056 == **8.1 作者** == 1057 1057 1058 - **Dennis Cotter .**593 +Dennis Cotter . 1059 1059 1060 1060 1061 1061 == **8.2 审稿人** == 1062 1062 1063 - **Roman Jouravlev.**598 +Roman Jouravlev.
- 1642237641108-965.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +99.0 KB - Content
- 1642237710166-351.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +109.4 KB - Content
- 1642237738910-108.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +26.9 KB - Content
- 1642237833826-395.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +68.3 KB - Content
- 1642237866153-106.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +50.7 KB - Content
- 1642237945213-442.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +117.1 KB - Content
- 1642237990168-323.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +59.9 KB - Content
- 1642238024237-336.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +51.8 KB - Content
- 1642238049838-958.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +39.8 KB - Content
- 1642238202293-164.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +45.3 KB - Content
- 1642238225338-195.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +59.3 KB - Content
- 1642238253882-729.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +21.9 KB - Content
- 1642238337737-961.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +69.5 KB - Content
- 1642238364744-334.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +39.6 KB - Content
- 1642238421478-919.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +94.3 KB - Content
- 1642238466365-934.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +49.1 KB - Content
- 1642238480595-735.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +71.7 KB - Content
- 1642238606576-143.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +33.5 KB - Content