Changes for page 服务管理实践 - 05 监控和事态
Last modified by superadmin on 2024/12/25, 15:38
Summary
-
- 1642237641108-965.png
- 1642237710166-351.png
- 1642237738910-108.png
- 1642237833826-395.png
- 1642237866153-106.png
- 1642237945213-442.png
- 1642237990168-323.png
- 1642238024237-336.png
- 1642238049838-958.png
- 1642238202293-164.png
- 1642238225338-195.png
- 1642238253882-729.png
- 1642238337737-961.png
- 1642238364744-334.png
- 1642238421478-919.png
- 1642238466365-934.png
- 1642238480595-735.png
- 1642238606576-143.png
Details
- Page properties
-
- Title
-
... ... @@ -1,1 +1,1 @@ 1 -05 监控和事态管理 实践1 +05 监控和事态管理(已发布) - Parent
-
... ... @@ -1,1 +1,1 @@ 1 - 00 服务管理实践.WebHome1 +Main.WebHome - Content
-
... ... @@ -1,15 +1,22 @@ 1 -如有[[ITIL认证>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]、[[ITIL培训>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]或[[ITIL考试>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]需求,可[[点击了解详情>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]] 1 +{{box cssClass="floatinginfobox" title="**Contents**"}} 2 +{{toc/}} 3 +{{/box}} 2 2 5 +((( 6 +(% class="wikigeneratedid" id="H" %) 7 + 8 +))) 3 3 4 -** 申明:**10 + 需要下载 **ITIL 4监控和事态管理实践【中文】**pdf版全文,请关注微信公众号itilxf ,并回复“监控和事态”即可。 5 5 6 - 本系列ITIL 4中文版本由长河领导的ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与。需要下载最新翻译版本请关注微信公众号:ITILXF,并回复“**监控和事态管理**”即可。12 +[[image:微信截图_20210206234644.png]] 7 7 8 -{{box cssClass="floatinginfobox" title="**Contents**"}} 9 -{{toc/}} 10 -{{/box}} 11 11 15 +**申明:** 12 12 17 +本系列ITIL 4实践中文版本由ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与,需要下载最新翻译版本请关注微信公众号:ITILXF,也可访问ITIL4中文知识库网站:itil4hub.cn。 18 + 19 + 13 13 请注意,ITIL先锋论坛专家团队仅仅只是进行了这些著作的语种转换工作,我们并不拥有包括原著以及中文发行文件的任何版权,所有版权均为Axoles持有,读者在使用这些文件(含本中文翻译版本)时需完全遵守Axoles 和 TSO所申明的所有版权要求。 14 14 15 15 ... ... @@ -33,6 +33,8 @@ 33 33 * 支持监控和事态管理的信息和技术 34 34 * 合作伙伴和供应商对监控和事态管理的思考 35 35 43 + 44 + 36 36 == **1.1** **ITIL®4 认证体系** == 37 37 38 38 本文件所选内容可作为以下教学大纲的一部分进行考查: ... ... @@ -126,6 +126,7 @@ 126 126 * 第三方服务绩效指标(基于商定的服务级别) 127 127 * 操作、流程和价值流绩效指标 128 128 138 + 129 129 |((( 130 130 **阈值** 131 131 ... ... @@ -147,6 +147,7 @@ 147 147 * 一小时内出现X个以上磁盘错误 148 148 * CPU利用率达到或超过N%三次,任何两个连续事态之间的间隔小于Z秒 149 149 160 + 150 150 |((( 151 151 **警报** 152 152 ... ... @@ -189,14 +189,13 @@ 189 189 190 190 尽管有些活动和责任领域仍然与监控和事态管理实践密切相关,但它们并没有被包含其中。表2.1中列出了它们以及那些包含了它们的实践的相关引用。重要的是要记住,ITIL实践只是那些在价值流环境中被使用的工具的集合,应根据情况进行必要的组合。 191 191 192 -(% style="width:476px" %) 193 -|(% style="width:320px" %)活动|(% style="width:153px" %)实践指南 194 -|(% style="width:320px" %)事件的管理|(% style="width:153px" %)事件管理 195 -|(% style="width:320px" %)事态和趋势的原因调查|(% style="width:153px" %)问题管理 196 -|(% style="width:320px" %)响应事态的变更管理|(% style="width:153px" %)变更支持 197 -|(% style="width:320px" %)与用户沟通|(% style="width:153px" %)服务台 198 -|(% style="width:320px" %)基于监控数据的决策支持|(% style="width:153px" %)度量和报告 199 -|(% style="width:320px" %)设置服务质量和性能的目标和阈值|(% style="width:153px" %)((( 203 +|活动|实践指南 204 +|事件的管理|事件管理 205 +|事态和趋势的原因调查|问题管理 206 +|响应事态的变更管理|变更支持 207 +|与用户沟通|服务台 208 +|基于监控数据的决策支持|度量和报告 209 +|设置服务质量和性能的目标和阈值|((( 200 200 服务级别管理 201 201 202 202 可用性管理 ... ... @@ -207,12 +207,12 @@ 207 207 208 208 连续性管理 209 209 ))) 210 -| (% style="width:320px" %)设置基础设施和应用程序组件的阈值|(% style="width:153px" %)(((220 +|设置基础设施和应用程序组件的阈值|((( 211 211 基础设施和平台管理 212 212 213 213 软件开发和管理 214 214 ))) 215 -| (% style="width:320px" %)设定第三方服务的目标和门槛|(% style="width:153px" %)供应商管理225 +|设定第三方服务的目标和门槛|供应商管理 216 216 217 217 表2.1其他实践指南中描述的与监控和事态管理相关的活动 218 218 ... ... @@ -228,8 +228,10 @@ 228 228 * 确保及时,相关且足够的监控数据提供给相关的利益相关者 229 229 * 确保发现、解释事态,并在需要时尽快采取措施 230 230 231 -=== **2.4.1 建立和维护描述各类事态和探测它们所需的监控功能的方法/模型** === 232 232 242 + 243 +=== 2.4.1 建立和维护描述各类事态和探测它们所需的监控功能的方法/模型 === 244 + 233 233 在大多数情况下,现代技术为度量和监控服务以及服务组件操作的各个方面提供了机会,但是从业人员应认真管理监控的范围以及度量指标的频率和数量。现代监控和事态管理实践的主要挑战不是缺少数据,而是监控必须处理的数据的规模。监控和事态管理实践的重点应该是获取有意义的信息,以支持服务的操作与改进,决策和价值的创造。建立或改进监控和事态管理实践时,应考虑以下方面: 234 234 235 235 * 识别所监控的服务和服务组件并划分优先级 ... ... @@ -265,7 +265,7 @@ 265 265 许多IT 监控工具和EMS本身很可能由第三方供应商提供,监控和事态管理实践和供应商管理实践将保持稳定的工作关系。 266 266 267 267 268 -=== **2.4.2 确保将及时,相关且足够的监控数据提供给相关的利益相关者**===280 +=== 2.4.2 确保将及时,相关且足够的监控数据提供给相关的利益相关者 === 269 269 270 270 当根据原始服务设计和与客户达成的服务级别协议(SLA)进行基准校对时,监控和事态管理的报告能够使服务提供者的实际操作性能和行为基本真实。监控和事态管理提供了直接的观察结果、基于事实的经验证据,而不是预期或期望的结果。 271 271 ... ... @@ -274,7 +274,7 @@ 274 274 监控和事态管理确定了薄弱区域,因此可以采取补救行动(如果有正当的业务案例),以改进将来的服务质量。监控和事态管理还可以显示客户动作在哪里导致故障,并确定工作效率和/或培训可以在哪些地方得到改善。监控和事态管理还可以同时处理内部和外部供应商,因为他们的绩效必须得到评估和管理。 275 275 276 276 277 -=== **2.4.3 确保探测、解释事件,并在需要时尽快采取措施**===289 +=== 2.4.3 确保探测、解释事件,并在需要时尽快采取措施 === 278 278 279 279 仅仅为监控和事态管理定义规则还不够,事态的实际探测和处理程序才能使这些规则有价值。事态管理的效率和范围在很大程度上取决于服务架构和服务管理自动化水平。在数字化基础设施和现代应用程序中,许多用于监控和事态管理的工具是内置的,实践的重点是事态处理规则的集成和调整。 280 280 ... ... @@ -293,18 +293,17 @@ 293 293 294 294 监控和事态管理实践的关键指标已映射到其实践成功因素(PSF)。它们可以用作价值流环境中的KPI,以评估监控和事态管理实践对那些价值流的效果和效率的贡献。表2.2中给出了一些关键指标的示例。 295 295 296 -(% style="width:923px" %) 297 -|(% style="width:503px" %)**实践成功因素**|(% style="width:418px" %)**指标样例** 298 -|(% style="width:503px" %)建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力|(% style="width:418px" %)((( 308 +|**实践成功因素**|**指标样例** 309 +|建立和维护描述各类事态的方法/模型以及检测这些事态所需要的监控能力|((( 299 299 * 利益相关者对监控和事态管理方法的满意度 300 300 * 组织对方法的坚持 301 301 * 未遵循或发现不切实际的方法建议/要求的百分比 302 302 ))) 303 -| (% style="width:503px" %)确保向利益相关者提供及时、相关和充分的监控数据|(% style="width:418px" %)(((314 +|确保向利益相关者提供及时、相关和充分的监控数据|((( 304 304 * 利益相关者对监控数据及其表述的满意度 305 305 * 监控数据的质量(根据商定的数据质量标准) 306 306 ))) 307 -| (% style="width:503px" %)确保检测、解释事件,并在需要时尽快采取措施|(% style="width:418px" %)(((318 +|确保检测、解释事件,并在需要时尽快采取措施|((( 308 308 * 事态管理错误的影响 309 309 * 事态交流“噪音”的数量和影响 310 310 * 因为事态管理不善而无法预防或解决的事件和问题的影响 ... ... @@ -340,6 +340,8 @@ 340 340 * 设计和转换 341 341 * 改进 342 342 354 + 355 + 343 343 == **3.2 流程** == 344 344 345 345 每个实践可包含一个或多个为实现该实践的目的而可能需要的流程和活动。 ... ... @@ -350,6 +350,8 @@ 350 350 * **事态处理流程** 351 351 * **监控和事态管理评审 **安排和触发该流程是为了评审主要事态事后分析、有关过滤和相关性分析的更新、服务“运行状况模型”、以及用于监控自动化和操作的改进。 352 352 366 + 367 + 353 353 === **3.2.1 监控规划** === 354 354 355 355 |**关键输入**|**活动**|**关键输出** ... ... @@ -393,7 +393,6 @@ 393 393 394 394 395 395 396 -(% style="text-align:center" %) 397 397 [[image:图片3.png]] 398 398 399 399 图3.2 监控规划流程的工作流程 ... ... @@ -400,25 +400,84 @@ 400 400 401 401 402 402 403 -表3.2监控规划流程的活 动417 +表3.2监控规划流程的活 404 404 405 -[[image:1642237641108-965.png]] 419 +|**活动**|**描述** 420 +|定义监控目标|((( 421 +利用从服务设计阶段、服务验证和测试实践以及服务开发(可用性,容量和性能管理实践)和服务级别管理实践收到的信息,团队定义监控的关键目标。 406 406 407 - [[image:1642237710166-351.png]]423 +该讨论应覆盖功效需求到功用需求(首先涵盖最明显的功能要求,例如,在应用程序的用户案例中)。另外,从关键服务性能到更多详细信息和组件,它的颗粒度应增加。 408 408 409 -[[image:1642237738910-108.png]] 425 +团队应列出一个优先级降序的监控列表。 426 +))) 427 +|评估可用的度量监控标准|((( 428 +然后,将监控优先级列表项映射或转换为可用度量或基于可用度量的综合度量。 410 410 430 +应该探索添加度量值。 431 +))) 432 +|定义监控对象的事态类型|团队对不同类型的事态进行定义和分类。类型可以是一般性的,例如信息性,警告性,异常性,也可以取决于功能,用户组及其优先级,再通过关键监控目标的组件或类型进行划分。 433 +|定义不同事态类型的阈值|((( 434 +团队与服务或组件开发团队一起定义不同类型事态的阈值。相同的组件指标可能是根据现有的SLA和针对服务或组件定义的可用性,容量和性能的要求,它基于服务进行了不同的处理。 411 411 436 +另外,应该将处理吞吐量的事态纳入考量,因为尽管现代IT系统几乎可以探测到任何事态,但不是所有事态都需要进行响应。因此,从最初预防灾难到后来完善组件,通常都应将监控和事态管理进行迭代开发。 437 +))) 438 +|定义服务'运行状况模型'(端到端事态)|((( 439 +根据参与服务设计的团队的输入,构建了一个“运行状况模型”,它反映了服务及其关联的关键事态。一个服务可能有几种模型。 412 412 413 - === **3.2.2 事态规划** ===441 +这些模型使监控团队可以评估服务的用户体验。例如,可以为单个银行客户交易构建模型,并度量从移动应用程序中的请求(包括所有银行数据库系统到移动应用程序中完成交易的通知)花费的时间。 414 414 443 +服务“运行状况模型”也可以实现为服务健康和性能的报告或仪表板,并由服务所有者,参与其他实践的团队和其他利益相关者临时使用。这样,有关这些服务的信息就被干系人“拉”走了。 444 +))) 445 +|定义事态关联和规则集|((( 446 +与参与服务设计的团队一起,定义事态关联和相应的规则集。 447 + 448 +某些关联可能会使用第二个事态作为对第一个事态的检查,或者进一步过滤事态的范围。同样,已定义的关联可以帮助防止事态同时发生时可能产生的负面协同效应。 449 + 450 +规则集由多个规则组成,这些规则定义了如何处理和评估特定事态的事态消息。例如,每次磁盘日志文件到达其容量时都可能生成警告事态,但是如果已生成四个以上的警告事件,则会生成异常事态。 451 + 452 +规则本身通常嵌入监控和事态处理技术中。它们由布尔类型的算法组成,用于关联已生成的事态,以创建需要传达的其他事态。这些算法可以编入通常称为关联引擎的事态管理软件中。 453 + 454 +人工智能(AI)系统可用于定义用户,管理员,系统等的典型和非典型行为。这可能形成其他检查以过滤事态。 455 +))) 456 +|将事态与行动计划、职能部门和通知对应起来|((( 457 +对于每个事态或事态组,都定义了一个行动计划以尽量减少事态的负面影响。基于行动计划,可以定义响应事态的团队或职能部门。 458 + 459 +行动计划还可以自动执行或半自动执行,包括对某些重要操作进行人工干预。 460 + 461 +在此阶段创建的行动计划成为事态程序和自动化的基础。 462 +))) 463 + 464 + 465 +=== 3.2.2 事态规划 === 466 + 415 415 表3.3事态处理流程的输入、活动和输出 416 416 417 -[[image:1642238606576-143.png]] 469 +|**关键输入**|**活动**|**关键输出** 470 +|((( 471 +* 来自监控对象,监控工具的通知 472 +* 监控计划 473 +)))|((( 474 +* 事态检测 475 +* 事态日志记录 476 +* 事态过滤和相关性检查(可能是迭代的) 477 +* 事态分类 478 +* 事态响应选择 479 +* 发送通知,执行响应规程 480 +)))|((( 481 +* 事态记录 482 +* 已更新的事态统计信息 483 +* 事态响应错误 484 +* 已启动的重大事态事后反思 485 +* 利益干系人通知 486 +* 知识文章更新 487 +* 记录的事件 488 +* 更新的报告和仪表板 489 +))) 418 418 419 -图3.3事态处理流程的工作流程 420 420 421 421 493 +图3.3事态处理流程的工作流程 494 + 422 422 (% style="text-align:center" %) 423 423 [[image:图片4.png]] 424 424 ... ... @@ -426,16 +426,82 @@ 426 426 427 427 表3.4事态处理流程的活动 428 428 429 -[[image:1642237833826-395.png]] 502 +|**活动**|**描述** 503 +|事态检测|((( 504 +监控系统检测到的事态,或作为手动监控的结果。 430 430 431 -[[image:1642237866153-106.png]] 506 +并非所有事态都应被检测到,监控系统带宽也应纳入考量。在现有有限的资源中应仅检测到关键事件和需要采取行动的事态。 507 +))) 508 +|事态记录|事态应该最好自动记录在监控系统中。 509 +|事态过滤和相关性检查(可能是迭代的)|((( 510 +事态应该按照规则集进行处理,以过滤和查找相关性,以实现更好的分类。 432 432 512 +该活动可能是迭代的。 513 +))) 514 +|事态分类|事态分为组或类型,如果需要选择适当的响应,则在组内进一步过滤特定的事态。 515 +|事态响应选择|在监控规划流程中应该为每个事态制定行动计划或响应规程。根据规划中定义的规则,选择事态响应和通知的团队。 516 +|发送通知,执行响应规程|响应规程执行后,将通知负责操作或监督的团队(如果响应规程是全自动的)。 433 433 518 +|**关键输入**|**活动**|**关键输出** 519 +|((( 520 +* 更新的知识文章 521 +* 重大事态记录 522 +* 重大事件记录 523 +* 改进建议 524 +* 事态记录和统计 525 +* 服务所有者和利益相关者的信息请求 526 +)))|((( 527 +* 评审重大事态和事件 528 +* 评审过滤和相关性分析 529 +* 评审服务“运行状态模式” 530 +* 评估事态的响应程序和自动化程度 531 +* 评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具 532 +* 评审监控工具收集的统计信息 533 +)))|((( 534 +* 更新的事态响应程序 535 +* 过滤和相关分析的改进建议 536 +* 针对自动化的变更 537 +* 更新的监控标准和阈值 538 +* 更新的过滤方法 539 +* 更新的被使用的工具和技术清单 540 +* 更新的已提供的报告和统计信息清单 541 +))) 434 434 543 + 544 + 435 435 === **3.2.3 监控和事态管理评审** === 436 436 437 -[[image:1642237945213-442.png]] 547 +|活动|描述 548 +|评审重大事态和事件|((( 549 +事实上,重大事件发生通常可能意味着未检测到某些异常服务或组件行为并对其采取行动。因此,重大事态和事件为监控知识发现和改进提供了良好的基础。 438 438 551 +应审查和分析重大事态的性质、相关性,并将其分解为组件甚至配置项,并应探索相应的指标,这些指标可能有助于检测导致重大事件的重大事态或异常。 552 + 553 +应探索组件的其他或类似风险,并将已识别的事态添加到监控中。 554 + 555 +建议对监控进行更改以在未来检测类似的事态。 556 +))) 557 +|((( 558 +评审过滤和相关性分析的评审 559 + 560 +评审服务的“运行状态模式” 561 +)))|当监控检测到大量事态或检测不到事态时,应进行过滤和相关性分析。有时可以考虑采取临时措施,例如放宽阈值或事态分组。否则,应进行详细分析和详尽的规则定义,以及建议对监控进行更改。 562 +|评估事态响应程序和自动化程度|((( 563 +应评审因事态响应导致的事件和故障并提出变更建议。 564 + 565 +同样,此评审的目标应是提高事态检测和事态响应的自动化程度。也可以建议其他的自动化。 566 +))) 567 +|评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具|((( 568 +应审查内部和市场上可能提高监控效率的工具。应在监控预算内建议试用和试运行。 569 + 570 +另外,此评审应该讨论监控中使用的任何新技术或最佳实践,应该进行市场基准测试的开发,并提出对监控的改进。 571 +))) 572 +|评审监控工具收集的统计信息|((( 573 +应该审查统计信息,以提出对监控的改进,并监控服务。 574 + 575 +服务生命周期涉及的所有团队均应评审检测到的服务趋势。 576 +))) 577 + 439 439 表3.6 监控和事态管理评审流程的活动 440 440 441 441 ... ... @@ -458,16 +458,215 @@ 458 458 |**М**|**Methods and techniques expert 方法和技术专家** 与该能力相关的活动和技能包括设计和工作技术的实施,程序文档,有关流程的咨询,工作分析以及持续改进。 459 459 |**Т**|**Technical expert 技术专家** 此能力专注于技术(IT)专业知识和基于专业知识的任务。 460 460 461 -[[image:1642237990168-323.png]] 600 +|(% style="width:203px" %)活动|(% colspan="2" style="width:205px" %)负责角色|(% colspan="2" %)能力框架|**具体技能** 601 +|(% colspan="6" %)监控规划流程 602 +|(% style="width:203px" %)定义监控目标|(% style="width:199px" %)((( 603 +服务负责人 462 462 463 - [[image:1642238024237-336.png]]605 +设计人 464 464 465 - [[image:1642238202293-164.png]]607 +开发人员 466 466 467 - [[image:1642238225338-195.png]]609 +用户 468 468 469 - [[image:1642238253882-729.png]]611 +交付经理 470 470 613 +客户经理 614 + 615 +测试人员 616 + 617 +服务验证专家 618 + 619 +运维经理 620 +)))|(% colspan="2" %)协调员、管理员(CA)|(% colspan="2" %)((( 621 +理解利益相关者的服务价值和服务主张 622 + 623 +服务级别和用户体验方面的专业知识 624 +))) 625 +|(% style="width:203px" %)((( 626 +评估可用的度量监控标准 627 + 628 +定义监控对象的事态类型 629 + 630 +定义不同事态类型的阈值 631 +)))|(% style="width:199px" %)((( 632 +测试人员 633 + 634 +服务验证专家 635 + 636 +监控专家 637 + 638 +开发人员 639 + 640 +设计人员 641 + 642 +架构师 643 + 644 +业务经理 645 +)))|(% colspan="2" %)技术专家、方法技术专家(T M)|(% colspan="2" %)((( 646 +服务架构和设计的知识 647 + 648 +监控工具,探头探测器和传感器方面的专业知识 649 +))) 650 +|(% style="width:203px" %)((( 651 +定义服务'运行状况模型'(端到端事件) 652 + 653 +定义事件关联和规则集 654 +)))|(% style="width:199px" %)((( 655 +服务负责人 656 + 657 +用户 658 + 659 +交付经理 660 + 661 +客户经理 662 + 663 +运维经理 664 + 665 +测试人员 666 + 667 +服务验证专家 668 + 669 +监控专家 670 + 671 +开发人员 672 + 673 +设计人员 674 + 675 +架构师 676 +)))|(% colspan="2" %)技术专家、方法技术专家、管理员(T M A)|(% colspan="2" %)((( 677 +用户体验的知识 678 + 679 +功效需求和功用需求的知识 680 + 681 +服务主题和业务流程知识 682 + 683 +服务架构和设计的知识 684 + 685 +监控工具、探头探测器和传感器方面的专业知识 686 +))) 687 +|(% style="width:203px" %)建立行动计划和需要响应和通知的职能部门之间的映射关系|(% style="width:199px" %)((( 688 +服务负责人 689 + 690 +用户 691 + 692 +交付经理 693 + 694 +客户经理 695 + 696 +测试人员 697 + 698 +服务验证专家 699 + 700 +监控专家 701 + 702 +开发人员 703 + 704 +设计人员 705 + 706 +架构师 707 +)))|(% colspan="2" %)管理员、技术专家、方法技术专家(A T M)|(% colspan="2" %)((( 708 +运维和支持基础设施以及组织的知识 709 + 710 +服务架构和设计的知识 711 + 712 +监控工具以及探头探测器和传感器方面的专业知识 713 +))) 714 +|(% colspan="6" %)((( 715 +事态处理流程 716 + 717 +应尽一切努力使此流程尽可能自动化,因此将不讨论该流程的角色。 718 +))) 719 +|(% colspan="6" %)监控和事态管理评审 720 +|(% style="width:203px" %)((( 721 +评审重大事件或事态 722 + 723 +评审过滤和相关性分析 724 + 725 +评审服务“运行状况模式“ 726 +)))|(% style="width:199px" %)((( 727 +服务负责人 728 + 729 +用户 730 + 731 +交付经理 732 + 733 +客服经理 734 + 735 +监控专家 736 + 737 +开发人员 738 + 739 +设计人员 740 + 741 +架构师 742 +)))|(% colspan="2" %)技术专家、方法技术专家、管理员(T M A)|(% colspan="2" %)((( 743 +服务架构和设计的知识 744 + 745 +监控工具方面的专业知识 746 + 747 +服务主题知识和业务流程知识 748 + 749 +持续改进技能 750 +))) 751 +|(% style="width:203px" %)评估事态的响应程序和自动化程度|(% style="width:199px" %)((( 752 +服务负责人 753 + 754 +交付经理 755 + 756 +监控专家 757 + 758 +开发人员 759 + 760 +设计人员 761 + 762 +架构师 763 + 764 +服务台经理 765 + 766 +运维经理 767 +)))|(% colspan="2" %)管理员、技术专家、方法技术专家、协调员(ATMC)|(% colspan="2" %)((( 768 +运维和支持基础设施以及组织的知识 769 + 770 +监控工具方面的专业知识 771 + 772 +自动化专业知识 773 + 774 +服务主题知识和业务流程知识 775 + 776 +持续改进技能 777 +))) 778 +|(% style="width:203px" %)评审用于数据分析、相关性分析、人工智能(AI)和机器学习(ML)的工具|(% style="width:199px" %)((( 779 +监控专家 780 + 781 +架构师 782 + 783 +业务分析员 784 + 785 +技术顾问 786 +)))|(% colspan="2" %)方法技术专家、技术专家、管理员(MTA)|(% colspan="2" %)((( 787 +监控工具,AI,ML方面的专业知识 788 + 789 +自动化专业知识 790 + 791 +持续改进技能 792 +))) 793 +|(% style="width:203px" %)评审监控工具收集的统计信息|(% style="width:199px" %)((( 794 +监控专家 795 + 796 +架构师 797 + 798 +业务分析员 799 +)))|(% colspan="2" %)方法技术专家、技术专家、管理员(M T A)|(% colspan="2" %)((( 800 +服务架构和设计的知识 801 + 802 +监控工具方面的专业知识 803 + 804 +服务主题知识和业务流程知识 805 + 806 +持续改进技能 807 +))) 808 + 471 471 表4.1 监控和事态管理实践活动涉及的角色 472 472 473 473 ... ... @@ -523,19 +523,169 @@ 523 523 该信息可以采用各种形式。实践的关键输入和输出在本指南的“ 价值流和流程”部分中列出。 524 524 525 525 526 -== **5.2 自动化和工具**==864 +== 5.2 自动化和工具 == 527 527 528 528 529 529 在某些情况下,监控和事态管理实践的工作可以大大受益于自动化(有关何时适用的详细信息,请参见本指南的“ 价值流和流程”部分)。在这种情况下,自动化是可能且有效的,它可能涉及表5.1中概述的解决方案。 530 530 531 -[[image:1642238337737-961.png]] 869 +|流程活动|自动化手段|关键功能|实践的效果上的影响 870 +|(% colspan="4" %)监控规划流程 871 +|((( 872 +定义监控目标 532 532 533 - [[image:1642238364744-334.png]]874 +评估可用的度量监控标准 534 534 535 -[[image:1642238466365-934.png]] 876 +定义监控对象的事态类型 877 +)))|((( 878 +可视化工具(例如思维导图,服务图表,架构可视化) 536 536 537 - [[image:1642238480595-735.png]]880 +服务目录工具 538 538 882 +配置管理数据库 883 +)))|((( 884 +服务结构,依赖项,配置项等的可视化 885 + 886 +提供有关服务结构的信息,以及 887 + 888 +组件/ 服务的相互依赖性 889 + 890 +提供有关 891 + 892 +服务SLA和要求的信息 893 +)))|中 894 +|((( 895 +定义不同事态类型的阈值 896 + 897 +定义服务'运行状况模型'(端到端事件) 898 + 899 +定义事态关联和规则集 900 +)))|((( 901 +监控和事态管理工具 902 + 903 +ITSM工具 904 + 905 +软件定义的基础设施工具 906 + 907 +基础设施和平台内置的监控工具 908 + 909 +服务可视化工具 910 +)))|主动和被动性监控,事态设置,数据收集,数据分析,警报,规则设置|高 911 +|建立行动计划和需要响应和通知的职能部门之间的映射关系|((( 912 +监控和事态管理工具 913 + 914 +ITSM工具 915 + 916 +软件定义的基础设施工具 917 + 918 +协作和通讯工具 919 + 920 +集成总线 921 + 922 +自动化系统 923 + 924 +用于事态关联、行为监控与分析的AI和ML工具 925 +)))|((( 926 +ITSM工具集成(例如,基于事态的事件记录) 927 + 928 +通知和通讯,任务创建。 929 + 930 +自动化脚本运行 931 + 932 +AI和ML 事态关联,正常/异常行为分析 933 +)))|高 934 +|(% colspan="4" %)事态处理流程 935 +|((( 936 +事态检测 937 + 938 +事态日志记录 939 + 940 +事态过滤和相关性检查(可能是迭代的) 941 + 942 +事态分类 943 + 944 +事态响应选择 945 + 946 +发送通知、执行响应过程 947 +)))|((( 948 +监控和事态管理工具 949 + 950 +ITSM工具 951 + 952 +软件定义的基础设施工具 953 + 954 +协作和 955 + 956 +通讯工具 957 + 958 +集成总线 959 + 960 +自动化系统 961 + 962 +报告和仪表板工具和门户 963 +)))|((( 964 +ITSM工具集成(例如,基于事态的事件记录) 965 + 966 +通知和通讯,任务创建。 967 + 968 +自动化脚本运行 969 + 970 +AI和ML 事态关联,正常/异常行为分析 971 + 972 +报告和仪表板发布 973 +)))|高 974 +|(% colspan="4" %)监控和事态管理评审 975 +|((( 976 +评审重大事件或事态 977 + 978 +评审过滤和相关性分析 979 + 980 +评审服务“运行状况模式“ 981 + 982 +评估事态的响应程序和自动化程度 983 + 984 +评审用于数据分析、相关性分析、人工智能和机器学习的工具 985 + 986 +评审监控工具收集的统计信息 987 +)))|((( 988 +可视化工具(例如思维导图,服务图表,架构可视化) 989 + 990 +统计分析工具,数据库 991 + 992 +服务目录工具 993 + 994 +配置管理数据库 995 + 996 +监控和事态管理工具 997 + 998 +ITSM工具 999 + 1000 +协作和通讯工具 1001 + 1002 +报告和仪表板工具和门户 1003 + 1004 +业务分析工具 1005 + 1006 +基准工具和 1007 + 1008 +知识管理工具 1009 +)))|((( 1010 +服务结构,依赖项,配置项等的可视化 1011 + 1012 +提供有关服务结构和组件/ 服务相互依赖关系的信息 1013 + 1014 +提供有关服务SLA和要求,合规性和违规的信息 1015 + 1016 +提供重大事件的信息 1017 + 1018 +报告和仪表板发布 1019 + 1020 +通知,聊天 1021 + 1022 +分析和评估 1023 + 1024 +知识共享 1025 +)))|中 1026 + 539 539 表5.1 监控和事态管理活动的自动化解决方案 540 540 541 541 ... ... @@ -564,13 +564,13 @@ 564 564 565 565 实践指南的大部分内容都应作为组织在建立和发展自己的实践时可能考虑的领域的建议。实践指南是组织可能考虑的事情的目录,而不是答案的列表。使用ITIL 实践指南的内容时,组织应始终遵循ITIL 指导原则: 566 566 567 - *聚焦价值568 - *从你所处的地方开始569 - *基于反馈迭代推进570 - *协作和提升可视化程度571 - *整体性思考和工作572 - *保持简单实用573 - *优化和自动化。1055 +1. 聚焦价值 1056 +1. 从你所处的地方开始 1057 +1. 基于反馈迭代推进 1058 +1. 协作和提升可视化程度 1059 +1. 整体性思考和工作 1060 +1. 保持简单实用 1061 +1. 优化和自动化。 574 574 575 575 有关指导原则及其应用程序的更多信息,请参见以下内容的第4.3节: 576 576
- 1642237641108-965.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -99.0 KB - Content
- 1642237710166-351.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -109.4 KB - Content
- 1642237738910-108.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -26.9 KB - Content
- 1642237833826-395.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -68.3 KB - Content
- 1642237866153-106.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -50.7 KB - Content
- 1642237945213-442.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -117.1 KB - Content
- 1642237990168-323.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -59.9 KB - Content
- 1642238024237-336.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -51.8 KB - Content
- 1642238049838-958.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -39.8 KB - Content
- 1642238202293-164.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -45.3 KB - Content
- 1642238225338-195.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -59.3 KB - Content
- 1642238253882-729.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -21.9 KB - Content
- 1642238337737-961.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -69.5 KB - Content
- 1642238364744-334.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -39.6 KB - Content
- 1642238421478-919.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -94.3 KB - Content
- 1642238466365-934.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -49.1 KB - Content
- 1642238480595-735.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -71.7 KB - Content
- 1642238606576-143.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -33.5 KB - Content