Changes for page 服务管理实践 - 05 监控和事态
Last modified by superadmin on 2024/12/25, 15:38
Summary
-
- 1642237641108-965.png
- 1642237710166-351.png
- 1642237738910-108.png
- 1642237833826-395.png
- 1642237866153-106.png
- 1642237945213-442.png
- 1642237990168-323.png
- 1642238024237-336.png
- 1642238049838-958.png
- 1642238202293-164.png
- 1642238225338-195.png
- 1642238253882-729.png
- 1642238337737-961.png
- 1642238364744-334.png
- 1642238421478-919.png
- 1642238466365-934.png
- 1642238480595-735.png
- 1642238606576-143.png
Details
- Page properties
-
- Title
-
... ... @@ -1,1 +1,1 @@ 1 -05 监控和事态管理 实践1 +05 监控和事态管理(尚未发布) - Content
-
... ... @@ -40,6 +40,7 @@ 40 40 * 支持监控和事态管理的信息和技术 41 41 * 合作伙伴和供应商对监控和事态管理的思考 42 42 43 + 43 43 == **1.1** **ITIL®4 认证体系** == 44 44 45 45 本文件所选内容可作为以下教学大纲的一部分进行考查: ... ... @@ -61,7 +61,6 @@ 61 61 62 62 监控和事态管理实践的目的是系统地观察服务和服务组件,将其状态变化识别为事态并进行记录和报告。该实践识别基础设施、服务、业务流程和信息安全等事态,确定其优先级,建立对这些事态的适当响应,包括对可能导致潜在故障或事件的条件作出响应。 63 63 64 - 65 65 |((( 66 66 **事态** 67 67 ... ... @@ -103,7 +103,6 @@ 103 103 104 104 监控通过多种不同的方式得以实现。配置项(CIs)可以通过轮询(即响应监控工具收集特定目标数据的请求)或通过在满足某些条件时自动通知监控工具来共享有关其自身的信息。监控工具对服务组件的询问代表着主动监控,而配置项(CIs)向监控工具发送的通知代表着被动监控。 105 105 106 -(% style="text-align:center" %) 107 107 [[image:图片1.png]] 108 108 109 109 ... ... @@ -118,7 +118,6 @@ 118 118 119 119 尽管监控和事态管理传统上专注于服务的技术组件,但对了解其他服务管理资源和活动(包括流程,人员和供应商)的状态也很有用。 120 120 121 - 122 122 |((( 123 123 **指标** 124 124 ... ... @@ -196,14 +196,13 @@ 196 196 197 197 尽管有些活动和责任领域仍然与监控和事态管理实践密切相关,但它们并没有被包含其中。表2.1中列出了它们以及那些包含了它们的实践的相关引用。重要的是要记住,ITIL实践只是那些在价值流环境中被使用的工具的集合,应根据情况进行必要的组合。 198 198 199 -(% style="width:476px" %) 200 -|(% style="width:320px" %)活动|(% style="width:153px" %)实践指南 201 -|(% style="width:320px" %)事件的管理|(% style="width:153px" %)事件管理 202 -|(% style="width:320px" %)事态和趋势的原因调查|(% style="width:153px" %)问题管理 203 -|(% style="width:320px" %)响应事态的变更管理|(% style="width:153px" %)变更支持 204 -|(% style="width:320px" %)与用户沟通|(% style="width:153px" %)服务台 205 -|(% style="width:320px" %)基于监控数据的决策支持|(% style="width:153px" %)度量和报告 206 -|(% style="width:320px" %)设置服务质量和性能的目标和阈值|(% style="width:153px" %)((( 197 +|活动|实践指南 198 +|事件的管理|事件管理 199 +|事态和趋势的原因调查|问题管理 200 +|响应事态的变更管理|变更支持 201 +|与用户沟通|服务台 202 +|基于监控数据的决策支持|度量和报告 203 +|设置服务质量和性能的目标和阈值|((( 207 207 服务级别管理 208 208 209 209 可用性管理 ... ... @@ -214,12 +214,12 @@ 214 214 215 215 连续性管理 216 216 ))) 217 -| (% style="width:320px" %)设置基础设施和应用程序组件的阈值|(% style="width:153px" %)(((214 +|设置基础设施和应用程序组件的阈值|((( 218 218 基础设施和平台管理 219 219 220 220 软件开发和管理 221 221 ))) 222 -| (% style="width:320px" %)设定第三方服务的目标和门槛|(% style="width:153px" %)供应商管理219 +|设定第三方服务的目标和门槛|供应商管理 223 223 224 224 表2.1其他实践指南中描述的与监控和事态管理相关的活动 225 225 ... ... @@ -235,8 +235,9 @@ 235 235 * 确保及时,相关且足够的监控数据提供给相关的利益相关者 236 236 * 确保发现、解释事态,并在需要时尽快采取措施 237 237 238 -=== **2.4.1 建立和维护描述各类事态和探测它们所需的监控功能的方法/模型** === 239 239 236 +=== 2.4.1 建立和维护描述各类事态和探测它们所需的监控功能的方法/模型 === 237 + 240 240 在大多数情况下,现代技术为度量和监控服务以及服务组件操作的各个方面提供了机会,但是从业人员应认真管理监控的范围以及度量指标的频率和数量。现代监控和事态管理实践的主要挑战不是缺少数据,而是监控必须处理的数据的规模。监控和事态管理实践的重点应该是获取有意义的信息,以支持服务的操作与改进,决策和价值的创造。建立或改进监控和事态管理实践时,应考虑以下方面: 241 241 242 242 * 识别所监控的服务和服务组件并划分优先级 ... ... @@ -272,7 +272,7 @@ 272 272 许多IT 监控工具和EMS本身很可能由第三方供应商提供,监控和事态管理实践和供应商管理实践将保持稳定的工作关系。 273 273 274 274 275 -=== **2.4.2 确保将及时,相关且足够的监控数据提供给相关的利益相关者**===273 +=== 2.4.2 确保将及时,相关且足够的监控数据提供给相关的利益相关者 === 276 276 277 277 当根据原始服务设计和与客户达成的服务级别协议(SLA)进行基准校对时,监控和事态管理的报告能够使服务提供者的实际操作性能和行为基本真实。监控和事态管理提供了直接的观察结果、基于事实的经验证据,而不是预期或期望的结果。 278 278 ... ... @@ -281,7 +281,7 @@ 281 281 监控和事态管理确定了薄弱区域,因此可以采取补救行动(如果有正当的业务案例),以改进将来的服务质量。监控和事态管理还可以显示客户动作在哪里导致故障,并确定工作效率和/或培训可以在哪些地方得到改善。监控和事态管理还可以同时处理内部和外部供应商,因为他们的绩效必须得到评估和管理。 282 282 283 283 284 -=== **2.4.3 确保探测、解释事件,并在需要时尽快采取措施**===282 +=== 2.4.3 确保探测、解释事件,并在需要时尽快采取措施 === 285 285 286 286 仅仅为监控和事态管理定义规则还不够,事态的实际探测和处理程序才能使这些规则有价值。事态管理的效率和范围在很大程度上取决于服务架构和服务管理自动化水平。在数字化基础设施和现代应用程序中,许多用于监控和事态管理的工具是内置的,实践的重点是事态处理规则的集成和调整。 287 287 ... ... @@ -300,18 +300,17 @@ 300 300 301 301 监控和事态管理实践的关键指标已映射到其实践成功因素(PSF)。它们可以用作价值流环境中的KPI,以评估监控和事态管理实践对那些价值流的效果和效率的贡献。表2.2中给出了一些关键指标的示例。 302 302 303 -(% style="width:923px" %) 304 -|(% style="width:503px" %)**实践成功因素**|(% style="width:418px" %)**指标样例** 305 -|(% style="width:503px" %)建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力|(% style="width:418px" %)((( 301 +|**实践成功因素**|**指标样例** 302 +|建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力|((( 306 306 * 利益相关者对监控和事态管理方法的满意度 307 307 * 组织对方法的坚持 308 308 * 未遵循或发现不切实际的方法建议/要求的百分比 309 309 ))) 310 -| (% style="width:503px" %)确保向利益相关者提供及时、相关和充分的监控数据|(% style="width:418px" %)(((307 +|确保向利益相关者提供及时、相关和充分的监控数据|((( 311 311 * 利益相关者对监控数据及其表述的满意度 312 312 * 监控数据的质量(根据商定的数据质量标准) 313 313 ))) 314 -| (% style="width:503px" %)确保检测、解释事件,并在需要时尽快采取措施|(% style="width:418px" %)(((311 +|确保检测、解释事件,并在需要时尽快采取措施|((( 315 315 * 事态管理错误的影响 316 316 * 事态交流“噪音”的数量和影响 317 317 * 因为事态管理不善而无法预防或解决的事件和问题的影响 ... ... @@ -335,7 +335,6 @@ 335 335 图3.1中显示了监控和事态实践对服务价值链的贡献。 336 336 337 337 338 -(% style="text-align:center" %) 339 339 [[image:微信截图_20210217171257.png]] 340 340 341 341 图3.1 监控和事态管理实践对价值链活动的贡献的热力图。 ... ... @@ -347,6 +347,7 @@ 347 347 * 设计和转换 348 348 * 改进 349 349 346 + 350 350 == **3.2 流程** == 351 351 352 352 每个实践可包含一个或多个为实现该实践的目的而可能需要的流程和活动。 ... ... @@ -357,6 +357,7 @@ 357 357 * **事态处理流程** 358 358 * **监控和事态管理评审 **安排和触发该流程是为了评审主要事态事后分析、有关过滤和相关性分析的更新、服务“运行状况模型”、以及用于监控自动化和操作的改进。 359 359 357 + 360 360 === **3.2.1 监控规划** === 361 361 362 362 |**关键输入**|**活动**|**关键输出** ... ... @@ -400,7 +400,6 @@ 400 400 401 401 402 402 403 -(% style="text-align:center" %) 404 404 [[image:图片3.png]] 405 405 406 406 图3.2 监控规划流程的工作流程 ... ... @@ -407,26 +407,83 @@ 407 407 408 408 409 409 410 -表3.2监控规划流程的活 动407 +表3.2监控规划流程的活 411 411 412 -[[image:1642237641108-965.png]] 409 +|**活动**|**描述** 410 +|定义监控目标|((( 411 +利用从服务设计阶段、服务验证和测试实践以及服务开发(可用性,容量和性能管理实践)和服务级别管理实践收到的信息,团队定义监控的关键目标。 413 413 414 - [[image:1642237710166-351.png]]413 +该讨论应覆盖功效需求到功用需求(首先涵盖最明显的功能要求,例如,在应用程序的用户案例中)。另外,从关键服务性能到更多详细信息和组件,它的颗粒度应增加。 415 415 416 -[[image:1642237738910-108.png]] 415 +团队应列出一个优先级降序的监控列表。 416 +))) 417 +|评估可用的度量监控标准|((( 418 +然后,将监控优先级列表项映射或转换为可用度量或基于可用度量的综合度量。 417 417 420 +应该探索添加度量值。 421 +))) 422 +|定义监控对象的事态类型|团队对不同类型的事态进行定义和分类。类型可以是一般性的,例如信息性,警告性,异常性,也可以取决于功能,用户组及其优先级,再通过关键监控目标的组件或类型进行划分。 423 +|定义不同事态类型的阈值|((( 424 +团队与服务或组件开发团队一起定义不同类型事态的阈值。相同的组件指标可能是根据现有的SLA和针对服务或组件定义的可用性,容量和性能的要求,它基于服务进行了不同的处理。 418 418 426 +另外,应该将处理吞吐量的事态纳入考量,因为尽管现代IT系统几乎可以探测到任何事态,但不是所有事态都需要进行响应。因此,从最初预防灾难到后来完善组件,通常都应将监控和事态管理进行迭代开发。 427 +))) 428 +|定义服务'运行状况模型'(端到端事态)|((( 429 +根据参与服务设计的团队的输入,构建了一个“运行状况模型”,它反映了服务及其关联的关键事态。一个服务可能有几种模型。 419 419 420 - === **3.2.2 事态规划** ===431 +这些模型使监控团队可以评估服务的用户体验。例如,可以为单个银行客户交易构建模型,并度量从移动应用程序中的请求(包括所有银行数据库系统到移动应用程序中完成交易的通知)花费的时间。 421 421 433 +服务“运行状况模型”也可以实现为服务健康和性能的报告或仪表板,并由服务所有者,参与其他实践的团队和其他利益相关者临时使用。这样,有关这些服务的信息就被干系人“拉”走了。 434 +))) 435 +|定义事态关联和规则集|((( 436 +与参与服务设计的团队一起,定义事态关联和相应的规则集。 437 + 438 +某些关联可能会使用第二个事态作为对第一个事态的检查,或者进一步过滤事态的范围。同样,已定义的关联可以帮助防止事态同时发生时可能产生的负面协同效应。 439 + 440 +规则集由多个规则组成,这些规则定义了如何处理和评估特定事态的事态消息。例如,每次磁盘日志文件到达其容量时都可能生成警告事态,但是如果已生成四个以上的警告事件,则会生成异常事态。 441 + 442 +规则本身通常嵌入监控和事态处理技术中。它们由布尔类型的算法组成,用于关联已生成的事态,以创建需要传达的其他事态。这些算法可以编入通常称为关联引擎的事态管理软件中。 443 + 444 +人工智能(AI)系统可用于定义用户,管理员,系统等的典型和非典型行为。这可能形成其他检查以过滤事态。 445 +))) 446 +|将事态与行动计划、职能部门和通知对应起来|((( 447 +对于每个事态或事态组,都定义了一个行动计划以尽量减少事态的负面影响。基于行动计划,可以定义响应事态的团队或职能部门。 448 + 449 +行动计划还可以自动执行或半自动执行,包括对某些重要操作进行人工干预。 450 + 451 +在此阶段创建的行动计划成为事态程序和自动化的基础。 452 +))) 453 + 454 + 455 +=== 3.2.2 事态规划 === 456 + 422 422 表3.3事态处理流程的输入、活动和输出 423 423 424 -[[image:1642238606576-143.png]] 459 +|**关键输入**|**活动**|**关键输出** 460 +|((( 461 +* 来自监控对象,监控工具的通知 462 +* 监控计划 463 +)))|((( 464 +* 事态检测 465 +* 事态日志记录 466 +* 事态过滤和相关性检查(可能是迭代的) 467 +* 事态分类 468 +* 事态响应选择 469 +* 发送通知,执行响应规程 470 +)))|((( 471 +* 事态记录 472 +* 已更新的事态统计信息 473 +* 事态响应错误 474 +* 已启动的重大事态事后反思 475 +* 利益干系人通知 476 +* 知识文章更新 477 +* 记录的事件 478 +* 更新的报告和仪表板 479 +))) 425 425 481 + 426 426 图3.3事态处理流程的工作流程 427 427 428 - 429 -(% style="text-align:center" %) 430 430 [[image:图片4.png]] 431 431 432 432 ... ... @@ -433,16 +433,81 @@ 433 433 434 434 表3.4事态处理流程的活动 435 435 436 -[[image:1642237833826-395.png]] 490 +|**活动**|**描述** 491 +|事态检测|((( 492 +监控系统检测到的事态,或作为手动监控的结果。 437 437 438 -[[image:1642237866153-106.png]] 494 +并非所有事态都应被检测到,监控系统带宽也应纳入考量。在现有有限的资源中应仅检测到关键事件和需要采取行动的事态。 495 +))) 496 +|事态记录|事态应该最好自动记录在监控系统中。 497 +|事态过滤和相关性检查(可能是迭代的)|((( 498 +事态应该按照规则集进行处理,以过滤和查找相关性,以实现更好的分类。 439 439 500 +该活动可能是迭代的。 501 +))) 502 +|事态分类|事态分为组或类型,如果需要选择适当的响应,则在组内进一步过滤特定的事态。 503 +|事态响应选择|在监控规划流程中应该为每个事态制定行动计划或响应规程。根据规划中定义的规则,选择事态响应和通知的团队。 504 +|发送通知,执行响应规程|响应规程执行后,将通知负责操作或监督的团队(如果响应规程是全自动的)。 440 440 506 +|**关键输入**|**活动**|**关键输出** 507 +|((( 508 +* 更新的知识文章 509 +* 重大事态记录 510 +* 重大事件记录 511 +* 改进建议 512 +* 事态记录和统计 513 +* 服务所有者和利益相关者的信息请求 514 +)))|((( 515 +* 评审重大事态和事件 516 +* 评审过滤和相关性分析 517 +* 评审服务“运行状态模式” 518 +* 评估事态的响应程序和自动化程度 519 +* 评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具 520 +* 评审监控工具收集的统计信息 521 +)))|((( 522 +* 更新的事态响应程序 523 +* 过滤和相关分析的改进建议 524 +* 针对自动化的变更 525 +* 更新的监控标准和阈值 526 +* 更新的过滤方法 527 +* 更新的被使用的工具和技术清单 528 +* 更新的已提供的报告和统计信息清单 529 +))) 441 441 531 + 442 442 === **3.2.3 监控和事态管理评审** === 443 443 444 -[[image:1642237945213-442.png]] 534 +|活动|描述 535 +|评审重大事态和事件|((( 536 +事实上,重大事件发生通常可能意味着未检测到某些异常服务或组件行为并对其采取行动。因此,重大事态和事件为监控知识发现和改进提供了良好的基础。 445 445 538 +应审查和分析重大事态的性质、相关性,并将其分解为组件甚至配置项,并应探索相应的指标,这些指标可能有助于检测导致重大事件的重大事态或异常。 539 + 540 +应探索组件的其他或类似风险,并将已识别的事态添加到监控中。 541 + 542 +建议对监控进行更改以在未来检测类似的事态。 543 +))) 544 +|((( 545 +评审过滤和相关性分析的评审 546 + 547 +评审服务的“运行状态模式” 548 +)))|当监控检测到大量事态或检测不到事态时,应进行过滤和相关性分析。有时可以考虑采取临时措施,例如放宽阈值或事态分组。否则,应进行详细分析和详尽的规则定义,以及建议对监控进行更改。 549 +|评估事态响应程序和自动化程度|((( 550 +应评审因事态响应导致的事件和故障并提出变更建议。 551 + 552 +同样,此评审的目标应是提高事态检测和事态响应的自动化程度。也可以建议其他的自动化。 553 +))) 554 +|评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具|((( 555 +应审查内部和市场上可能提高监控效率的工具。应在监控预算内建议试用和试运行。 556 + 557 +另外,此评审应该讨论监控中使用的任何新技术或最佳实践,应该进行市场基准测试的开发,并提出对监控的改进。 558 +))) 559 +|评审监控工具收集的统计信息|((( 560 +应该审查统计信息,以提出对监控的改进,并监控服务。 561 + 562 +服务生命周期涉及的所有团队均应评审检测到的服务趋势。 563 +))) 564 + 446 446 表3.6 监控和事态管理评审流程的活动 447 447 448 448 ... ... @@ -465,16 +465,215 @@ 465 465 |**М**|**Methods and techniques expert 方法和技术专家** 与该能力相关的活动和技能包括设计和工作技术的实施,程序文档,有关流程的咨询,工作分析以及持续改进。 466 466 |**Т**|**Technical expert 技术专家** 此能力专注于技术(IT)专业知识和基于专业知识的任务。 467 467 468 -[[image:1642237990168-323.png]] 587 +|(% style="width:203px" %)活动|(% colspan="2" style="width:205px" %)负责角色|(% colspan="2" %)能力框架|**具体技能** 588 +|(% colspan="6" %)监控规划流程 589 +|(% style="width:203px" %)定义监控目标|(% style="width:199px" %)((( 590 +服务负责人 469 469 470 - [[image:1642238024237-336.png]]592 +设计人 471 471 472 - [[image:1642238202293-164.png]]594 +开发人员 473 473 474 - [[image:1642238225338-195.png]]596 +用户 475 475 476 - [[image:1642238253882-729.png]]598 +交付经理 477 477 600 +客户经理 601 + 602 +测试人员 603 + 604 +服务验证专家 605 + 606 +运维经理 607 +)))|(% colspan="2" %)协调员、管理员(CA)|(% colspan="2" %)((( 608 +理解利益相关者的服务价值和服务主张 609 + 610 +服务级别和用户体验方面的专业知识 611 +))) 612 +|(% style="width:203px" %)((( 613 +评估可用的度量监控标准 614 + 615 +定义监控对象的事态类型 616 + 617 +定义不同事态类型的阈值 618 +)))|(% style="width:199px" %)((( 619 +测试人员 620 + 621 +服务验证专家 622 + 623 +监控专家 624 + 625 +开发人员 626 + 627 +设计人员 628 + 629 +架构师 630 + 631 +业务经理 632 +)))|(% colspan="2" %)技术专家、方法技术专家(T M)|(% colspan="2" %)((( 633 +服务架构和设计的知识 634 + 635 +监控工具,探头探测器和传感器方面的专业知识 636 +))) 637 +|(% style="width:203px" %)((( 638 +定义服务'运行状况模型'(端到端事件) 639 + 640 +定义事件关联和规则集 641 +)))|(% style="width:199px" %)((( 642 +服务负责人 643 + 644 +用户 645 + 646 +交付经理 647 + 648 +客户经理 649 + 650 +运维经理 651 + 652 +测试人员 653 + 654 +服务验证专家 655 + 656 +监控专家 657 + 658 +开发人员 659 + 660 +设计人员 661 + 662 +架构师 663 +)))|(% colspan="2" %)技术专家、方法技术专家、管理员(T M A)|(% colspan="2" %)((( 664 +用户体验的知识 665 + 666 +功效需求和功用需求的知识 667 + 668 +服务主题和业务流程知识 669 + 670 +服务架构和设计的知识 671 + 672 +监控工具、探头探测器和传感器方面的专业知识 673 +))) 674 +|(% style="width:203px" %)建立行动计划和需要响应和通知的职能部门之间的映射关系|(% style="width:199px" %)((( 675 +服务负责人 676 + 677 +用户 678 + 679 +交付经理 680 + 681 +客户经理 682 + 683 +测试人员 684 + 685 +服务验证专家 686 + 687 +监控专家 688 + 689 +开发人员 690 + 691 +设计人员 692 + 693 +架构师 694 +)))|(% colspan="2" %)管理员、技术专家、方法技术专家(A T M)|(% colspan="2" %)((( 695 +运维和支持基础设施以及组织的知识 696 + 697 +服务架构和设计的知识 698 + 699 +监控工具以及探头探测器和传感器方面的专业知识 700 +))) 701 +|(% colspan="6" %)((( 702 +事态处理流程 703 + 704 +应尽一切努力使此流程尽可能自动化,因此将不讨论该流程的角色。 705 +))) 706 +|(% colspan="6" %)监控和事态管理评审 707 +|(% style="width:203px" %)((( 708 +评审重大事件或事态 709 + 710 +评审过滤和相关性分析 711 + 712 +评审服务“运行状况模式“ 713 +)))|(% style="width:199px" %)((( 714 +服务负责人 715 + 716 +用户 717 + 718 +交付经理 719 + 720 +客服经理 721 + 722 +监控专家 723 + 724 +开发人员 725 + 726 +设计人员 727 + 728 +架构师 729 +)))|(% colspan="2" %)技术专家、方法技术专家、管理员(T M A)|(% colspan="2" %)((( 730 +服务架构和设计的知识 731 + 732 +监控工具方面的专业知识 733 + 734 +服务主题知识和业务流程知识 735 + 736 +持续改进技能 737 +))) 738 +|(% style="width:203px" %)评估事态的响应程序和自动化程度|(% style="width:199px" %)((( 739 +服务负责人 740 + 741 +交付经理 742 + 743 +监控专家 744 + 745 +开发人员 746 + 747 +设计人员 748 + 749 +架构师 750 + 751 +服务台经理 752 + 753 +运维经理 754 +)))|(% colspan="2" %)管理员、技术专家、方法技术专家、协调员(ATMC)|(% colspan="2" %)((( 755 +运维和支持基础设施以及组织的知识 756 + 757 +监控工具方面的专业知识 758 + 759 +自动化专业知识 760 + 761 +服务主题知识和业务流程知识 762 + 763 +持续改进技能 764 +))) 765 +|(% style="width:203px" %)评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具|(% style="width:199px" %)((( 766 +监控专家 767 + 768 +架构师 769 + 770 +业务分析员 771 + 772 +技术顾问 773 +)))|(% colspan="2" %)方法技术专家、技术专家、管理员(MTA)|(% colspan="2" %)((( 774 +监控工具,AI,ML方面的专业知识 775 + 776 +自动化专业知识 777 + 778 +持续改进技能 779 +))) 780 +|(% style="width:203px" %)评审监控工具收集的统计信息|(% style="width:199px" %)((( 781 +监控专家 782 + 783 +架构师 784 + 785 +业务分析员 786 +)))|(% colspan="2" %)方法技术专家、技术专家、管理员(M T A)|(% colspan="2" %)((( 787 +服务架构和设计的知识 788 + 789 +监控工具方面的专业知识 790 + 791 +服务主题知识和业务流程知识 792 + 793 +持续改进技能 794 +))) 795 + 478 478 表4.1 监控和事态管理实践活动涉及的角色 479 479 480 480 ... ... @@ -530,19 +530,169 @@ 530 530 该信息可以采用各种形式。实践的关键输入和输出在本指南的“ 价值流和流程”部分中列出。 531 531 532 532 533 -== **5.2 自动化和工具**==851 +== 5.2 自动化和工具 == 534 534 535 535 536 536 在某些情况下,监控和事态管理实践的工作可以大大受益于自动化(有关何时适用的详细信息,请参见本指南的“ 价值流和流程”部分)。在这种情况下,自动化是可能且有效的,它可能涉及表5.1中概述的解决方案。 537 537 538 -[[image:1642238337737-961.png]] 856 +|流程活动|自动化手段|关键功能|实践的效果上的影响 857 +|(% colspan="4" %)监控规划流程 858 +|((( 859 +定义监控目标 539 539 540 - [[image:1642238364744-334.png]]861 +评估可用的度量监控标准 541 541 542 -[[image:1642238466365-934.png]] 863 +定义监控对象的事态类型 864 +)))|((( 865 +可视化工具(例如思维导图,服务图表,架构可视化) 543 543 544 - [[image:1642238480595-735.png]]867 +服务目录工具 545 545 869 +配置管理数据库 870 +)))|((( 871 +服务结构,依赖项,配置项等的可视化 872 + 873 +提供有关服务结构的信息,以及 874 + 875 +组件/ 服务的相互依赖性 876 + 877 +提供有关 878 + 879 +服务SLA和要求的信息 880 +)))|中 881 +|((( 882 +定义不同事态类型的阈值 883 + 884 +定义服务'运行状况模型'(端到端事件) 885 + 886 +定义事态关联和规则集 887 +)))|((( 888 +监控和事态管理工具 889 + 890 +ITSM工具 891 + 892 +软件定义的基础设施工具 893 + 894 +基础设施和平台内置的监控工具 895 + 896 +服务可视化工具 897 +)))|主动和被动性监控,事态设置,数据收集,数据分析,警报,规则设置|高 898 +|建立行动计划和需要响应和通知的职能部门之间的映射关系|((( 899 +监控和事态管理工具 900 + 901 +ITSM工具 902 + 903 +软件定义的基础设施工具 904 + 905 +协作和通讯工具 906 + 907 +集成总线 908 + 909 +自动化系统 910 + 911 +用于事态关联、行为监控与分析的AI和ML工具 912 +)))|((( 913 +ITSM工具集成(例如,基于事态的事件记录) 914 + 915 +通知和通讯,任务创建。 916 + 917 +自动化脚本运行 918 + 919 +AI和ML 事态关联,正常/异常行为分析 920 +)))|高 921 +|(% colspan="4" %)事态处理流程 922 +|((( 923 +事态检测 924 + 925 +事态日志记录 926 + 927 +事态过滤和相关性检查(可能是迭代的) 928 + 929 +事态分类 930 + 931 +事态响应选择 932 + 933 +发送通知、执行响应过程 934 +)))|((( 935 +监控和事态管理工具 936 + 937 +ITSM工具 938 + 939 +软件定义的基础设施工具 940 + 941 +协作和 942 + 943 +通讯工具 944 + 945 +集成总线 946 + 947 +自动化系统 948 + 949 +报告和仪表板工具和门户 950 +)))|((( 951 +ITSM工具集成(例如,基于事态的事件记录) 952 + 953 +通知和通讯,任务创建。 954 + 955 +自动化脚本运行 956 + 957 +AI和ML 事态关联,正常/异常行为分析 958 + 959 +报告和仪表板发布 960 +)))|高 961 +|(% colspan="4" %)监控和事态管理评审 962 +|((( 963 +评审重大事件或事态 964 + 965 +评审过滤和相关性分析 966 + 967 +评审服务“运行状况模式“ 968 + 969 +评估事态的响应程序和自动化程度 970 + 971 +评审用于数据分析、相关性分析、人工智能和机器学习的工具 972 + 973 +评审监控工具收集的统计信息 974 +)))|((( 975 +可视化工具(例如思维导图,服务图表,架构可视化) 976 + 977 +统计分析工具,数据库 978 + 979 +服务目录工具 980 + 981 +配置管理数据库 982 + 983 +监控和事态管理工具 984 + 985 +ITSM工具 986 + 987 +协作和通讯工具 988 + 989 +报告和仪表板工具和门户 990 + 991 +业务分析工具 992 + 993 +基准工具和 994 + 995 +知识管理工具 996 +)))|((( 997 +服务结构,依赖项,配置项等的可视化 998 + 999 +提供有关服务结构和组件/ 服务相互依赖关系的信息 1000 + 1001 +提供有关服务SLA和要求,合规性和违规的信息 1002 + 1003 +提供重大事件的信息 1004 + 1005 +报告和仪表板发布 1006 + 1007 +通知,聊天 1008 + 1009 +分析和评估 1010 + 1011 +知识共享 1012 +)))|中 1013 + 546 546 表5.1 监控和事态管理活动的自动化解决方案 547 547 548 548 ... ... @@ -571,13 +571,13 @@ 571 571 572 572 实践指南的大部分内容都应作为组织在建立和发展自己的实践时可能考虑的领域的建议。实践指南是组织可能考虑的事情的目录,而不是答案的列表。使用ITIL 实践指南的内容时,组织应始终遵循ITIL 指导原则: 573 573 574 - *聚焦价值575 - *从你所处的地方开始576 - *基于反馈迭代推进577 - *协作和提升可视化程度578 - *整体性思考和工作579 - *保持简单实用580 - *优化和自动化。1042 +1. 聚焦价值 1043 +1. 从你所处的地方开始 1044 +1. 基于反馈迭代推进 1045 +1. 协作和提升可视化程度 1046 +1. 整体性思考和工作 1047 +1. 保持简单实用 1048 +1. 优化和自动化。 581 581 582 582 有关指导原则及其应用程序的更多信息,请参见以下内容的第4.3节: 583 583
- 1642237641108-965.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -99.0 KB - Content
- 1642237710166-351.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -109.4 KB - Content
- 1642237738910-108.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -26.9 KB - Content
- 1642237833826-395.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -68.3 KB - Content
- 1642237866153-106.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -50.7 KB - Content
- 1642237945213-442.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -117.1 KB - Content
- 1642237990168-323.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -59.9 KB - Content
- 1642238024237-336.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -51.8 KB - Content
- 1642238049838-958.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -39.8 KB - Content
- 1642238202293-164.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -45.3 KB - Content
- 1642238225338-195.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -59.3 KB - Content
- 1642238253882-729.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -21.9 KB - Content
- 1642238337737-961.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -69.5 KB - Content
- 1642238364744-334.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -39.6 KB - Content
- 1642238421478-919.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -94.3 KB - Content
- 1642238466365-934.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -49.1 KB - Content
- 1642238480595-735.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -71.7 KB - Content
- 1642238606576-143.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -33.5 KB - Content