Changes for page 服务管理实践 - 14 服务连续性
Last modified by superadmin on 2024/12/25, 15:40
Summary
Details
- Page properties
-
- Content
-
... ... @@ -34,7 +34,6 @@ 34 34 * 支持本实践的信息和技术 35 35 * 对本实践的合作伙伴和供应商的考虑 36 36 37 - 38 38 == **1.1 ITIL 4资格认证计划** == 39 39 40 40 本文档中的部分内容可作为以下教学大纲的一部分以供检查: ... ... @@ -229,18 +229,21 @@ 229 229 * 进行练习,并测试如果发生灾难情况下,服务连续性计划的启用 230 230 * 有一些活动和责任领域尽管仍与服务连续性管理密切相关,但不包含在服务连续性管理实践中。表2.1中列出了这些内容,以及涉及到的包含这些内容的实践。重要的是要记住,ITIL实践只是在价值流的背景中使用的工具的集合;它们应当根据情况在必要时组合在一起。 231 231 232 -|活动|实践指南 233 -|与客户沟通以使客户的业务连续性策略和计划与服务提供者的服务连续性策略和计划保持一致|关系管理 234 -|协商并与客户服务连续性要求达成一致|服务级别管理 235 -|将服务连续性解决方案设计为服务模型的一部分|服务设计 236 -|使服务连续性解决方案与业务架构保持一致|架构管理 237 -|识别与服务连续性相关的风险|风险管理 238 -|与供应商和合作伙伴建立和管理合同|供应商管理 239 -|监控服务的可用性|监控和事态管理 240 -|证明新的服务连续性解决方案|组合管理 241 -|实施风险缓解措施并更改IT基础设施,以确保弹性|项目管理, 变更控制 242 -|管理并实施持续改进|持续改进 231 +(% style="width:469px" %) 232 +|(% style="width:335px" %)活动|(% style="width:132px" %)实践指南 233 +|(% style="width:335px" %)与客户沟通以使客户的业务连续性策略和计划与服务提供者的服务连续性策略和计划保持一致|(% style="width:132px" %)关系管理 234 +|(% style="width:335px" %)协商并与客户服务连续性要求达成一致|(% style="width:132px" %)服务级别管理 235 +|(% style="width:335px" %)将服务连续性解决方案设计为服务模型的一部分|(% style="width:132px" %)服务设计 236 +|(% style="width:335px" %)使服务连续性解决方案与业务架构保持一致|(% style="width:132px" %)架构管理 237 +|(% style="width:335px" %)识别与服务连续性相关的风险|(% style="width:132px" %)风险管理 238 +|(% style="width:335px" %)与供应商和合作伙伴建立和管理合同|(% style="width:132px" %)供应商管理 239 +|(% style="width:335px" %)监控服务的可用性|(% style="width:132px" %)监控和事态管理 240 +|(% style="width:335px" %)证明新的服务连续性解决方案|(% style="width:132px" %)组合管理 241 +|(% style="width:335px" %)实施风险缓解措施并更改IT基础设施,以确保弹性|(% style="width:132px" %)项目管理, 变更控制 242 +|(% style="width:335px" %)管理并实施持续改进|(% style="width:132px" %)持续改进 243 243 244 + 245 + 244 244 === **2.3.1 可用性与连续性之间的界线** === 245 245 246 246 服务的连续性和可用性管理的实践之间的界限是不明显的。两种做法都涉及风险的概念,并致力于识别和准备应对可能威胁并导致服务不能运转的事件。对于这两种实践,都需要了解VBF和风险评估或服务故障的BIA。最终,两种做法都确保了组织的抗故障能力。 ... ... @@ -247,15 +247,16 @@ 247 247 248 248 一些组织不希望将可用性的管理和连续性分开。但是,表2.2中概述了这两种做法之间的一些差异,在设计服务管理系统时应考虑这些差异。 249 249 250 -|可用性管理|服务连续性管理 251 -|专注于高概率的风险|专注于高影响风险(紧急情况,灾难) 252 -|更主动|更被动 253 -|减少意外的可能性|减少意外的影响 254 -|关注技术解决方案|关注组织措施 255 -|优化|创建冗余 256 -|不属于公司职能|通常是公司职能的一部分 257 -|日常业务|特殊情况下 258 -|MTRS, MTBF, MTBSI|RTO, RPO 252 +(% style="width:454px" %) 253 +|(% style="width:174px" %)可用性管理|(% style="width:278px" %)服务连续性管理 254 +|(% style="width:174px" %)专注于高概率的风险|(% style="width:278px" %)专注于高影响风险(紧急情况,灾难) 255 +|(% style="width:174px" %)更主动|(% style="width:278px" %)更被动 256 +|(% style="width:174px" %)减少意外的可能性|(% style="width:278px" %)减少意外的影响 257 +|(% style="width:174px" %)关注技术解决方案|(% style="width:278px" %)关注组织措施 258 +|(% style="width:174px" %)优化|(% style="width:278px" %)创建冗余 259 +|(% style="width:174px" %)不属于公司职能|(% style="width:278px" %)通常是公司职能的一部分 260 +|(% style="width:174px" %)日常业务|(% style="width:278px" %)特殊情况下 261 +|(% style="width:174px" %)MTRS, MTBF, MTBSI|(% style="width:278px" %)RTO, RPO 259 259 260 260 表2.2 可用性管理和服务连续性管理之间的区别 261 261 ... ... @@ -281,6 +281,8 @@ 281 281 服务提供者必须承诺服务连续性计划,以便继续服务的交付。 282 282 ))) 283 283 287 + 288 + 284 284 === **2.3.3 服务连续性实践在管理风险时的角色** === 285 285 286 286 风险的概念是服务连续性管理实践的核心。该实践通常关注于减轻无法完全防止的高影响,低概率风险。 ... ... @@ -331,66 +331,25 @@ 331 331 332 332 表2.3响应和恢复规划结构中的层次 333 333 334 -|层次|描述 335 -|战略层|高管如何做出有关恢复流程的决策,如何与外部各方(包括相关媒体)进行沟通以及处理服务连续性计划中未涉及的任何情况 336 -|战术层|管理层如何协调恢复流程,以确保根据优先级(当前业务优先级,季节性变化等)适当分配资源并管理规划团队和恢复团队之间的冲突 337 -|操作层|团队如何执行恢复活动,包括响应破坏性事件,恢复到服务的预定义级别,和/或提供替代设施以继续运行 339 +(% style="width:683px" %) 340 +|(% style="width:66px" %)层次|(% style="width:614px" %)描述 341 +|(% style="width:66px" %)战略层|(% style="width:614px" %)高管如何做出有关恢复流程的决策,如何与外部各方(包括相关媒体)进行沟通以及处理服务连续性计划中未涉及的任何情况 342 +|(% style="width:66px" %)战术层|(% style="width:614px" %)管理层如何协调恢复流程,以确保根据优先级(当前业务优先级,季节性变化等)适当分配资源并管理规划团队和恢复团队之间的冲突 343 +|(% style="width:66px" %)操作层|(% style="width:614px" %)团队如何执行恢复活动,包括响应破坏性事件,恢复到服务的预定义级别,和/或提供替代设施以继续运行 338 338 339 339 根据组织的规模以及服务提供者是内部的还是外部的,可能会有不同的解决方案来构建计划。责任主体也可能有所不同。 340 340 341 341 服务连续性计划根据服务提供者的类型和组织的规模,其结构的复杂度可能会或多或少。表2.4 概述了一些常见的结构。 342 342 343 -|(% style="width:122px" %) |(% style="width:290px" %)小型组织|大型组织 344 -|(% style="width:122px" %)内部服务提供商|(% style="width:290px" %)((( 345 -在小型组织的IT部门中,可能没有任何服务连续性计划。所有连续性安排都可以作为业务连续性管理的一部分进行管理。 349 +[[image:1642262167262-433.png]] 346 346 347 -特定的IT服务连续性活动可以作为事件管理实践的一部分执行。 348 -)))|((( 349 -战略层:由高管执行的危机管理计划。它通常是业务连续性计划的一部分。 350 - 351 -战术层:大量计划,每个计划都涵盖一个产品,服务,业务单元,站点或位置,每个计划都拥有自己的恢复团队。战术的IT部门活动可以包含在业务连续性计划中,但通常将它们设计为单独的相关计划。 352 - 353 -操作层:大量的用于特定恢复活动的详细步骤(例如,从备份中恢复应用程序数据)。其他部门可能会有自己的特定操作说明,作为连续性计划的一部分。 354 -))) 355 -|(% style="width:122px" %)外部服务提供商|(% style="width:290px" %)所有层次(战略,战术,运行的)都可以作为一个计划实施,而一个团队则负责响应和恢复的各个方面。|连续性计划级别的描述与上面类似,但是服务提供者对所有级别负责。 356 - 357 357 表2.4 连续性计划的结构选项 358 358 359 359 360 360 服务连续性计划应涵盖表2.5中概述的灾难发生之后的各个阶段。 361 361 362 -|(% style="width:79px" %)阶段|(% style="width:503px" %)响应|恢复|复原 363 -|(% style="width:79px" %)计划|(% style="width:503px" %)响应计划|恢复计划|恢复正常运行计划 364 -|(% style="width:79px" %)内容|(% style="width:503px" %)((( 365 -应触发服务连续性计划的事件和场景 356 +[[image:1642262190748-510.png]] 366 366 367 -危机管理组联系人 368 - 369 -初始响应并最小化潜在损失的规程。通常会有针对特定场景的程序(例如火灾或停电) 370 - 371 -用于挑选恢复选项的文档化准则(如果有) 372 - 373 -沟通程序,包括与客户,合作伙伴和员工的沟通 374 - 375 -用于启用的文件化的触发器 376 -)))|((( 377 -恢复团队成员联系方式 378 - 379 -恢复团队的协调指南 380 - 381 -恢复程序的详细说明 382 - 383 -整个组织的监控和共享信息的指南 384 - 385 -升级程序 386 -)))|((( 387 -恢复正常运行的文件化准则 388 - 389 -恢复正常运行程序的详细说明 390 - 391 -复原恢复站点的说明(如果有) 392 -))) 393 - 394 394 表2.5 响应阶段和恢复阶段 395 395 396 396 ... ... @@ -405,12 +405,13 @@ 405 405 406 406 表2.6 中概述的服务连续性选项可以作为总体风险缓解计划的一部分来设计和实现。 407 407 408 -|(% style="width:174px" %)服务管理维度|(% style="width:842px" %)服务连续性措施 409 -|(% style="width:174px" %)组织和人员|(% style="width:842px" %)((( 372 +(% style="width:475px" %) 373 +|(% style="width:129px" %)服务管理维度|(% style="width:343px" %)服务连续性措施 374 +|(% style="width:129px" %)组织和人员|(% style="width:343px" %)((( 410 410 * 在灾难期间的人员管理 411 411 * 使用替代站点和设施 412 412 ))) 413 -|(% style="width:1 74px" %)信息和技术|(% style="width:842px" %)(((378 +|(% style="width:129px" %)信息和技术|(% style="width:343px" %)((( 414 414 * 物理安全 415 415 * 弹性电信网络 416 416 * 运维中的数据保护:使用RAID阵列,SAN等来确保数据的可用性 ... ... @@ -418,12 +418,12 @@ 418 418 * 容错应用程序 419 419 * 监控以提供及时告警 420 420 ))) 421 -|(% style="width:1 74px" %)合作伙伴和供应商|(% style="width:842px" %)(((386 +|(% style="width:129px" %)合作伙伴和供应商|(% style="width:343px" %)((( 422 422 * 互惠协议 423 423 * 将服务外包给多个提供商 424 424 * 作为服务的火灾探测系统或灭火系统 425 425 ))) 426 -|(% style="width:1 74px" %)流程和价值流|(% style="width:842px" %)(((391 +|(% style="width:129px" %)流程和价值流|(% style="width:343px" %)((( 427 427 * 服务交付的手动操作和替代方法 428 428 * 响应和恢复的计划与程序(服务连续性计划) 429 429 ))) ... ... @@ -439,7 +439,6 @@ 439 439 * 效率服务连续性度量的成本应该进行评估,并与收益进行比较。通过估算实施该措施后破坏性事态发生概率的降低,并乘以发生事态会对服务提供者和客户造成的预期的影响,可以计算出收益。就成本而言,应将此价值与该措施实施的成本进行比较。这里可以使用成本效益分析。 440 440 441 441 442 - 443 443 === **2.4.3 确保认知和就绪状态** === 444 444 445 445 未经测试的恢复计划通常根本无法按预期工作。因此,测试是服务连续性管理的关键组成部分,并且是确保所选策略,已实施措施和计划切实可行的唯一方法。 ... ... @@ -458,32 +458,9 @@ 458 458 459 459 表2.7 概述了2013年。 460 460 461 -|(% style="width:92px" %)演练类型|(% style="width:426px" %)关键特征|目的 462 -|(% style="width:92px" %)走查|(% style="width:426px" %)((( 463 -* 基于讨论的演练 464 -* 未加压的环境 465 -* 通常专注于某一特定区域进行改进 466 -)))|((( 467 -用于恢复团队成员首次见面 425 +[[image:1642262249963-601.png]] 468 468 469 -利用改进机会 470 -))) 471 -|(% style="width:92px" %)桌上演练|(% style="width:426px" %)((( 472 -* 基于一个给定场景的讨论 473 -* 通常实时运行,但可以包含“时间跳跃”以使得场景的不同阶段都受到演练 474 -)))|提高对计划的了解 475 -|(% style="width:92px" %)指挥所演练|(% style="width:426px" %)((( 476 -* 以模拟真实事件的方式为恢复团队成员提供信息,并邀请他们做出回应 477 -)))|测试沟通,决策和协调 478 -|(% style="width:92px" %)现场|(% style="width:426px" %)((( 479 -* 测试计划的最逼真的方法 480 -* 范围可以从一个组件的恢复的小型排练,到整个服务或组织的恢复的全面排练 481 -* 通常包括参与的利益相关方 482 -)))|测试在发生破坏性事态时,达到RTO,RPO和最低目标服务水平的能力 483 -|(% style="width:92px" %)测试|(% style="width:426px" %)((( 484 -* 它通常应用于特定的硬件或软件,例如从备份恢复应用程序数据。 485 -* 依照ISO 22301,测试是一种独特类型的演练,它包含了一个期望,就是:演练的(一个或多个)目标的成功或失败要素正在计划中 486 -)))|当故障的风险较高时,测试服务组件的恢复 427 +[[image:1642262271197-361.png]] 487 487 488 488 表2.7 锻炼类型 489 489 ... ... @@ -499,19 +499,20 @@ 499 499 500 500 服务连续性管理实践的关键指标已映射到其PSF。它们可以用作价值流的背景中的KPI,以评估实践对这些价值流的效果和效率的贡献。表2.8给出了一些关键指标的示例。 501 501 502 -|实践成功因素|指标示例 503 -|制定和管理服务连续性计划|((( 443 +(% style="width:565px" %) 444 +|(% style="width:172px" %)实践成功因素|(% style="width:391px" %)指标示例 445 +|(% style="width:172px" %)制定和管理服务连续性计划|(% style="width:391px" %)((( 504 504 * 具有清晰地文件化连续性要求的产品和服务的百分比 505 505 * 文件化的服务连续性计划中(关键)产品和服务的百分比 506 506 * 及时更新服务连续性计划 507 507 ))) 508 -|降低服务的连续性风险|((( 450 +|(% style="width:172px" %)降低服务的连续性风险|(% style="width:391px" %)((( 509 509 * RTO达成情况(实际灾难和演练) 510 510 * RPO达成情况(实际灾难和演练) 511 511 * 有效连续性措施的百分比 512 512 * 实际损失与预期损失之比 513 513 ))) 514 -|确保认知和就绪状态|((( 456 +|(% style="width:172px" %)确保认知和就绪状态|(% style="width:391px" %)((( 515 515 * 按计划进行的演练和认知活动的百分比 516 516 * 在给定时间段内(通常为过去6个月)对其连续性计划进行测试的服务所占的百分比 517 517 ))) ... ... @@ -564,28 +564,27 @@ 564 564 * 测试服务连续性计划 565 565 * 响应和恢复 566 566 567 - 568 - 569 569 === **3.2.1 服务连续性管理的治理** === 570 570 571 571 该流程包括表3.1中列出的活动,并将输入转换为输出。 572 572 573 -|关键输入|活动|关键输出 574 -|((( 575 -1. 业务影响分析报告 576 -1. 风险登记册 577 -1. 客户要求 578 -1. 法规要求 579 -1. 风险偏好 580 -1. 标准 581 -)))|((( 582 -1. 范围的定义 583 -1. 策略设置 584 -1. 认知和演练方案制定 585 -)))|((( 586 -1. 服务连续性策略 587 -1. 文件化的角色和职责 588 -1. 认知和演练方案 513 +(% style="width:515px" %) 514 +|(% style="width:176px" %)关键输入|(% style="width:145px" %)活动|(% style="width:191px" %)关键输出 515 +|(% style="width:176px" %)((( 516 +* 业务影响分析报告 517 +* 风险登记册 518 +* 客户要求 519 +* 法规要求 520 +* 风险偏好 521 +* 标准 522 +)))|(% style="width:145px" %)((( 523 +* 范围的定义 524 +* 策略设置 525 +* 认知和演练方案制定 526 +)))|(% style="width:191px" %)((( 527 +* 服务连续性策略 528 +* 文件化的角色和职责 529 +* 认知和演练方案 589 589 ))) 590 590 591 591 表3.1 服务连续性管理的治理的输入,活动和输出 ... ... @@ -601,8 +601,9 @@ 601 601 602 602 这些活动可能由组织中的许多人以不同程度的正式方式来执行。表3.2进一步描述了这些活动。 603 603 604 -|(% style="width:106px" %)活动|(% style="width:662px" %)描述 605 -|(% style="width:106px" %)范围的定义|(% style="width:662px" %)((( 545 +(% style="width:687px" %) 546 +|(% style="width:98px" %)活动|(% style="width:587px" %)描述 547 +|(% style="width:98px" %)范围的定义|(% style="width:587px" %)((( 606 606 定义服务连续性管理实践的范围,确保它所涵盖的组织的环境和地域清晰。 607 607 608 608 组织范围可能受到产品和服务,站点和位置,客户等的限制。那些已停产的或即将终止的产品和服务通常被排除在范围之外,非关键和低利润的产品和服务也一样。 ... ... @@ -620,7 +620,7 @@ 620 620 621 621 根据灾难定义实践的范围也很重要。 622 622 ))) 623 -|(% style="width: 106px" %)策略设置|(% style="width:662px" %)(((565 +|(% style="width:98px" %)策略设置|(% style="width:587px" %)((( 624 624 策略的设置包括: 625 625 626 626 * 记录范围。 ... ... @@ -629,7 +629,7 @@ 629 629 * 应尽快建立并传达政策,以便所有参与服务连续性管理实践或受其影响的利益相关者都知道范围,限制及其职责。 630 630 * 范围和政策应定期修订(通常每年一次)。修订被触发,可能是由于破坏性事态(尤其是计划未涵盖的),一个新的服务,一个新的客户或者是与合作伙伴的一个新关系。 631 631 ))) 632 -|(% style="width: 106px" %)认知和演练方案制定|(% style="width:662px" %)(((574 +|(% style="width:98px" %)认知和演练方案制定|(% style="width:587px" %)((( 633 633 测试是整个服务连续性管理实践的关键部分:这是确保所选策略,措施和计划有效的唯一方法。 634 634 635 635 应该制定教育,认知培训和演练计划,以确保实践的所有部分(站点,团队成员,服务或CI)每年至少进行一次测试。 ... ... @@ -662,8 +662,9 @@ 662 662 663 663 该流程包括表3.3中列出的活动,并将输入转换为输出。 664 664 665 -|关键输入|活动|关键输出 666 -|((( 607 +(% style="width:475px" %) 608 +|(% style="width:153px" %)关键输入|(% style="width:150px" %)活动|(% style="width:170px" %)关键输出 609 +|(% style="width:153px" %)((( 667 667 * 服务文档 668 668 * 风险评估报告 669 669 * VBF损失的财务数据 ... ... @@ -672,12 +672,12 @@ 672 672 * 风险管理策略 673 673 * 风险偏好 674 674 * 监管要求 675 -)))|((( 618 +)))|(% style="width:150px" %)((( 676 676 * VBF识别 677 677 * 中断后果分析 678 678 * VBF相互依赖关系识别 679 679 * 服务连续性要求的确定 680 -)))|((( 623 +)))|(% style="width:170px" %)((( 681 681 * VBF的优先级列表 682 682 * 文件化的VBF损失产生的影响 683 683 * 文件化的VBF相互依赖关系 ... ... @@ -697,8 +697,9 @@ 697 697 698 698 这些活动可以由组织中的许多人以不同程度的正式方式来执行。表3.4进一步概述了这些活动。 699 699 700 -|(% style="width:110px" %)活动|(% style="width:657px" %)描述 701 -|(% style="width:110px" %)VBF识别|(% style="width:657px" %)((( 643 +(% style="width:704px" %) 644 +|(% style="width:78px" %)活动|(% style="width:624px" %)描述 645 +|(% style="width:78px" %)VBF识别|(% style="width:624px" %)((( 702 702 VBF涉及到服务中对于服务提供者和/或客户的成功至关重要的一部分。识别和文件化这些VBF,以提供适当的焦点和资源分配非常重要。 703 703 704 704 可以使用许多不同的技术来识别风险,包括头脑风暴,与利益相关者(包括客户和用户)的访谈,对服务文档的分析等等。 ... ... @@ -705,7 +705,7 @@ 705 705 706 706 如果服务提供者具有已建立的风险管理实践,则有关风险评估的信息可能有助于理解最关键的区域。 707 707 ))) 708 -|(% style="width: 110px" %)中断后果分析|(% style="width:657px" %)(((652 +|(% style="width:78px" %)中断后果分析|(% style="width:624px" %)((( 709 709 当确定了VBF时,应确定中断的影响。该影响可能是可以准确识别的“硬” 影响,例如财务损失,也可以是“软” 影响,例如声誉受损或失去竞争优势。 710 710 711 711 可以考虑FAIR提出的以下形式的损失: ... ... @@ -723,16 +723,16 @@ 723 723 724 724 服务中断造成的损失通常会随着时间呈指数增长。除了与组织产生其主要价值主张的能力下降的有关损失之外,还存在罚款,判决和声誉受损的威胁。 725 725 ))) 726 -|(% style="width: 110px" %)(((670 +|(% style="width:78px" %)((( 727 727 VBF 728 728 729 729 相互依赖关系识别 730 -)))|(% style="width:6 57px" %)(((674 +)))|(% style="width:624px" %)((( 731 731 VBF和服务组件以及关键的内部和外部资源之间的相互依赖关系应予以识别和文件化。 732 732 733 733 为此,如果已安装配置管理数据库,则服务提供者可以使用服务和配置模型。组件故障影响分析(CFIA)也可能是有用的技术。CFIA可用于识别失效的单个点,现有的冗余等。 734 734 ))) 735 -|(% style="width: 110px" %)服务连续性要求的确定|(% style="width:657px" %)(((679 +|(% style="width:78px" %)服务连续性要求的确定|(% style="width:624px" %)((( 736 736 基于对中断后果和识别的相互依赖关系的分析,服务提供者应为服务连续性管理范围中的每个服务或VBF确定服务连续性要求,包括: 737 737 738 738 * 恢复时间目标 ... ... @@ -743,22 +743,23 @@ 743 743 表3.4 业务影响分析流程的活动 744 744 745 745 746 -=== **3. 3.3 制定和维护服务连续性计划** ===690 +=== **3.2.3 制定和维护服务连续性计划** === 747 747 748 748 该流程包括表3.5 中列出的活动,并将输入转换为输出。 749 749 750 -|关键输入|活动|关键输出 751 -|((( 694 +(% style="width:554px" %) 695 +|(% style="width:186px" %)关键输入|(% style="width:188px" %)活动|(% style="width:178px" %)关键输出 696 +|(% style="width:186px" %)((( 752 752 * 业务影响分析报告 753 753 * 现有控件 754 754 * 有关可用资源的信息 755 755 * 消费者的连续性计划 756 756 * 服务连续性策略 757 -)))|((( 702 +)))|(% style="width:188px" %)((( 758 758 * 服务连续性策略制定 759 759 * 服务连续性计划制定 760 760 * 服务连续性计划的初始测试 761 -)))|((( 706 +)))|(% style="width:178px" %)((( 762 762 * 新的和更新的控件 763 763 * 服务连续性策略 764 764 * 服务连续性计划 ... ... @@ -779,34 +779,36 @@ 779 779 780 780 表3.6 进一步概述了这些活动。 781 781 782 -|(% style="width:147px" %)活动|(% style="width:621px" %)描述 783 -|(% style="width:147px" %)服务连续性策略制定|(% style="width:621px" %)((( 727 +(% style="width:657px" %) 728 +|(% style="width:147px" %)活动|(% style="width:508px" %)描述 729 +|(% style="width:147px" %)服务连续性策略制定|(% style="width:508px" %)((( 784 784 基于BIA 报告,服务提供者应该确定一套适当的且具有成本效益的服务连续性策略集。 785 785 786 786 对于影响更早,影响更大的流程和服务,应采取更多的预防措施。对于影响较低且需要较长时间开发的流程和服务,应更加重视恢复措施。 787 787 ))) 788 -|(% style="width:147px" %)服务连续性计划制定|(% style="width: 621px" %)(((734 +|(% style="width:147px" %)服务连续性计划制定|(% style="width:508px" %)((( 789 789 基于服务连续性政策和策略,服务提供者应该制定和维护服务连续性计划。 790 790 791 791 如果服务或恢复团队成员发生变化,则必须更新计划。计划也可以在演练或实际恢复之后更新。 792 792 ))) 793 -|(% style="width:147px" %)服务连续性计划的初始测试|(% style="width: 621px" %)发布之前,应测试服务连续性计划。初始测试的方法类似于正在进行的演练。739 +|(% style="width:147px" %)服务连续性计划的初始测试|(% style="width:508px" %)发布之前,应测试服务连续性计划。初始测试的方法类似于正在进行的演练。 794 794 795 795 表3.6 制定和维护服务连续性计划流程的活动 796 796 797 797 798 -=== **3. 3.4 测试服务连续性计划** ===744 +=== **3.2.4 测试服务连续性计划** === 799 799 800 800 该流程包括表3.7 中列出的活动,并将输入转换为输出。 801 801 802 -|关键输入|活动|关键输出 803 -|((( 748 +(% style="width:536px" %) 749 +|(% style="width:156px" %)关键输入|(% style="width:164px" %)活动|(% style="width:214px" %)关键输出 750 +|(% style="width:156px" %)((( 804 804 * 认知和演练方案 805 805 * 服务连续性计划 806 -)))|((( 753 +)))|(% style="width:164px" %)((( 807 807 * 进行演练 808 808 * 服务连续性审计 809 -)))|((( 756 +)))|(% style="width:214px" %)((( 810 810 * 演练报告 811 811 * 新的和更新的控件的要求 812 812 * 策略或计划的变更请求 ... ... @@ -826,8 +826,9 @@ 826 826 827 827 这些活动可能由组织中的许多人以不同程度的正式方式来执行。表3.8进一步概述了这些活动。 828 828 829 -|(% style="width:131px" %)活动|(% style="width:636px" %)描述 830 -|(% style="width:131px" %)进行演练|(% style="width:636px" %)((( 776 +(% style="width:613px" %) 777 +|(% style="width:121px" %)活动|(% style="width:490px" %)描述 778 +|(% style="width:121px" %)进行演练|(% style="width:490px" %)((( 831 831 演练应按计划的时间间隔,和当出现可能影响恢复的显著变化时进行。服务中断的可能影响越高,演练的频率就应该越高。 832 832 833 833 演练和测试不仅是确保准备就绪的方法;它们也是改进机会。这通常是一个好主意,用来分析测试结果以及整个恢复团队绩效,然后生成包括结果和建议的演练报告。 ... ... @@ -836,7 +836,7 @@ 836 836 837 837 如果演练失败,则会更新后续演练时间表以便尽快重新执行失败的演练。 838 838 ))) 839 -|(% style="width:1 31px" %)服务连续性审计|(% style="width:636px" %)(((787 +|(% style="width:121px" %)服务连续性审计|(% style="width:490px" %)((( 840 840 服务连续性审计可确保在环境更改时,BIA,服务连续性策略和计划保持适当和相关。审计通常是按计划进行的,但是可能由于演练失败或恢复失败而触发。 841 841 842 842 审核可以在内部进行,也可以由第三方进行。审计的输出可能会确定一个实施新的或更新的控件的需求,也可以是调整服务连续性策略或计划的需求。 ... ... @@ -845,18 +845,19 @@ 845 845 表3.8测试服务连续性计划流程的活动 846 846 847 847 848 -=== **3. 3.5 响应和恢复** ===796 +=== **3.2.5 响应和恢复** === 849 849 850 850 该流程包括表3.9 中所述的活动,并将输入转换为输出。 851 851 852 -|关键输入|活动|关键输出 853 -|((( 800 +(% style="width:496px" %) 801 +|(% style="width:170px" %)关键输入|(% style="width:155px" %)活动|(% style="width:169px" %)关键输出 802 +|(% style="width:170px" %)((( 854 854 * 服务连续性计划 855 855 * 事件记录 856 -)))|((( 805 +)))|(% style="width:155px" %)((( 857 857 * 调用 858 858 * 执行服务连续性计划 859 -)))|((( 808 +)))|(% style="width:169px" %)((( 860 860 * 恢复报告 861 861 * 新的和更新的控件的要求 862 862 * 变更计划的请求 ... ... @@ -877,8 +877,9 @@ 877 877 878 878 表3.10 进一步概述了这些活动。 879 879 880 -|(% style="width:152px" %)实现价值|(% style="width:615px" %)描述 881 -|(% style="width:152px" %)启动|(% style="width:615px" %)((( 829 +(% style="width:715px" %) 830 +|(% style="width:92px" %)实现价值|(% style="width:621px" %)描述 831 +|(% style="width:92px" %)启动|(% style="width:621px" %)((( 882 882 启动是一项声明行为,组织的连续性安排需要实施,以便继续提供关键产品和服务[[12>>path:#_bookmark12]]. 883 883 884 884 启动的决定通常是由“ 危机管理”团队(在组织结构的战略层面上)做出的。[[13>>path:#_bookmark13]]),用于核算: ... ... @@ -887,8 +887,8 @@ 887 887 * 服务中断的可能持续时间 888 888 * 每天/每月/每年的时间 889 889 ))) 890 -|(% colspan="2" %)((( 891 -|(% style="width:1 43px" %)启动|(% style="width:607px" %)(((840 +|(% colspan="2" style="width:712px" %)((( 841 +|(% style="width:81px" %)启动|(% style="width:614px" %)((( 892 892 如果风险较低,则危机管理团队可以决定不调用服务连续性计划。 893 893 894 894 如果启动,危机管理团队还应该: ... ... @@ -898,7 +898,7 @@ 898 898 899 899 启动是服务连续性计划的最终测试。如果准备工作已经完成并且计划已经制定和经过测试,那么启动应该很简单。如果计划未经测试,则可能会失败。 900 900 ))) 901 -|(% style="width:1 43px" %)执行服务连续性计划|(% style="width:607px" %)(((851 +|(% style="width:81px" %)执行服务连续性计划|(% style="width:614px" %)((( 902 902 一旦发生启动,所有参与的恢复团队都应执行服务连续性程序。恢复可能是一段时间的高级活动,需要许多人花费长时间。在战术层面上,恢复团队调度员必须对此进行识别和管理。 903 903 904 904 任何时候都可能发生中断,因此对于办公室内外的关键人员而言,容易获得启动流程的指南是非常必要的。 ... ... @@ -931,156 +931,30 @@ 931 931 932 932 表4.1 能力代码和简介 933 933 934 -|能力代码|能力类型(活动和技能) 935 -|L|**领导者 **决策,委派,监督其他活动,提供激励和动机以及评估结果 936 -|A|**管理员 **分配任务并确定优先级,保留记录,进行中的报告并启动基本改进 937 -|C|**协调员/沟通者 **协调多方,维护利益相关者之间的沟通,并开展宣传活动 938 -|M|**方法和技术专家 **设计和实施工作技术,记录程序,咨询流程,工作分析和持续改进 939 -|T|**技术专家 **提供技术(IT)专业知识并实施基于专业知识的任务 884 +(% style="width:477px" %) 885 +|(% style="width:75px" %)能力代码|(% style="width:400px" %)能力类型(活动和技能) 886 +|(% style="width:75px" %)L|(% style="width:400px" %)**领导者 **决策,委派,监督其他活动,提供激励和动机以及评估结果 887 +|(% style="width:75px" %)A|(% style="width:400px" %)**管理员 **分配任务并确定优先级,保留记录,进行中的报告并启动基本改进 888 +|(% style="width:75px" %)C|(% style="width:400px" %)**协调员/沟通者 **协调多方,维护利益相关者之间的沟通,并开展宣传活动 889 +|(% style="width:75px" %)M|(% style="width:400px" %)**方法和技术专家 **设计和实施工作技术,记录程序,咨询流程,工作分析和持续改进 890 +|(% style="width:75px" %)T|(% style="width:400px" %)**技术专家 **提供技术(IT)专业知识并实施基于专业知识的任务 940 940 941 -表4.2 中列出了服务连续性管理实践涉及的角色示例,以及相关的能力简介和特定技能。 942 942 943 -|流程活动|(% colspan="2" %)负责角色|(% colspan="2" %)能力类型|具体技能 944 -|(% colspan="6" %)服务连续性管理流程的治理 945 -|范围的定义|(% colspan="2" %)指导委员会|(% colspan="2" %)MC|对各种影响组织的PESTLE因素的能见度 946 -|策略设置|(% colspan="2" %)指导委员会|(% colspan="2" %)MCL|((( 947 -意识到组织特定的文档要求 948 948 949 -确保管理人员的持续参与,以确保服务连续性策略的清晰性和持续实现 950 -))) 951 -|认知和演练方案开发|(% colspan="2" %)连续性管理员|(% colspan="2" %)ACM|((( 952 -演练类型和恢复团队结构的知识 894 +表4.2 中列出了服务连续性管理实践涉及的角色示例,以及相关的能力简介和特定技能。 953 953 954 -启用沟通渠道 955 -))) 956 -|(% colspan="6" %)业务影响分析流程 957 -|VBF识别|(% colspan="2" %)((( 958 -服务或产品所有者 896 +[[image:1642262555280-925.png]] 959 959 960 - 关系经理898 +[[image:1642262576270-128.png]] 961 961 962 - 服务设计者900 +[[image:1642262601759-766.png]] 963 963 964 -客户 965 -)))|(% colspan="2" %)CM|((( 966 -业务分析 902 +[[image:1642262627236-955.png]] 967 967 968 -很好的了解服务消费者的业务 969 969 970 -熟悉产品,包括其架构和配置 971 -))) 972 -|中断后果分析|(% colspan="2" %)((( 973 -服务或产品所有者 974 - 975 -关系经理 976 - 977 -客户 978 -)))|(% colspan="2" %)MC|((( 979 -能够系统地应用定性和定量风险分析工具 980 - 981 -专业能力和对影响服务的PESTLE因素的能见度 982 -))) 983 -|VBF相互依赖关系识别|(% colspan="2" %)((( 984 -服务或产品所有者 985 - 986 -服务设计者 987 - 988 -技术专家 989 - 990 -架构管理专家 991 -)))|(% colspan="2" %)MT|熟悉产品,包括其架构和配置 992 -|服务连续性要求的确定|(% colspan="2" %)((( 993 -服务或产品所有者 994 - 995 -连续性管理员 996 -)))|(% colspan="2" %)MTC|((( 997 -对恢复流程的深入了解 998 - 999 -了解服务的连续性策略 1000 -))) 1001 -|(% colspan="6" %)制定和维护服务连续性计划流程 1002 -|服务连续性策略开发|(% colspan="2" %)((( 1003 -连续性管理员 1004 - 1005 -服务设计者 1006 - 1007 -技术专家 1008 -)))|(% colspan="2" %)TM|((( 1009 -对服务连续性选项有很好的了解 1010 - 1011 -认知现有控件 1012 - 1013 -认知市场上可用的技术 1014 -))) 1015 -|服务连续性计划开发|(% colspan="2" %)((( 1016 -连续性管理员 1017 - 1018 -技术专家 1019 -)))|(% colspan="2" %)MTA|((( 1020 -优秀的文档编制能力 1021 - 1022 -优秀的逻辑能力 1023 - 1024 -很好地了解服务组件的相互依赖关系 1025 - 1026 -对技术有很好的了解 1027 -))) 1028 -|服务连续性计划的初始测试|(% colspan="2" %)((( 1029 -连续性管理员 1030 - 1031 -响应和恢复协调员及团队成员 1032 -)))|(% colspan="2" %)CATL|((( 1033 -协调与沟通 1034 - 1035 -对服务连续性计划有深入的了解 1036 - 1037 -了解作为服务连续性策略组成部分的技术 1038 -))) 1039 -|(% colspan="6" %)测试服务连续性计划流程 1040 -|(% colspan="2" %)进行演练|((( 1041 -连续性管理员 1042 - 1043 -响应和恢复协调员及团队成员 1044 -)))|CATL|(% colspan="2" %)((( 1045 -协调与沟通 1046 - 1047 -对服务连续性计划有深入的了解 1048 - 1049 -了解作为服务连续性策略组成部分的技术 1050 -))) 1051 -|(% colspan="2" %)服务连续性审计|内部或外部审计师(根据授权并代表董事会)|CAMT|(% colspan="2" %)((( 1052 -审计管理技术 1053 - 1054 -常见的审计实践命令 1055 - 1056 -确保审核员公正性,客观性和独立性 1057 -))) 1058 -|(% colspan="6" %)响应和恢复流程 1059 -|(% colspan="2" %)调用|危机管理组|LC|(% colspan="2" %)((( 1060 -对服务提供者和消费者风险有深入的了解 1061 - 1062 -了解对消费者的背景 1063 - 1064 -协调与沟通 1065 -))) 1066 -|(% colspan="2" %)执行服务连续性计划|((( 1067 -危机管理组 1068 - 1069 -连续性管理员 1070 - 1071 -响应和恢复协调员及团队成员 1072 -)))|CATL|(% colspan="2" %)((( 1073 -协调与沟通 1074 - 1075 -对服务连续性计划有深入的了解 1076 - 1077 -了解作为服务连续性策略组成部分的技术 1078 -))) 1079 - 1080 1080 表4.2 负责服务连续性管理活动的角色示例 1081 1081 1082 1082 1083 - 1084 1084 == **4.2 组织结构和团队** == 1085 1085 1086 1086 灾难是影响重大的事件,因此响应必须非常快。协调响应和恢复活动需要灵活性。因此,常规业务的组织结构与灾难无关。 ... ... @@ -1087,10 +1087,11 @@ 1087 1087 1088 1088 在恢复过程中,组织结构通常基于连续性计划的级别。表4.3概述了用于响应和恢复的组织结构级别。 1089 1089 1090 -|连续性计划的层次|(% style="width:77px" %)组织层次|(% style="width:602px" %)描述 1091 -|战略|(% style="width:77px" %)行政级别|(% style="width:602px" %)这包括高级管理/主管人员,他们具有组织内的总体权限和控制,并负责危机管理,联络其他部门,事业部,组织,媒体,监管机构,紧急服务等。 1092 -|战术|(% style="width:77px" %)协调级别|(% style="width:602px" %)通常,该级别比主管组低一级,该组负责协调组织内的整体恢复工作。 1093 -|运行|(% style="width:77px" %)专家级|(% style="width:602px" %)一系列服务恢复团队,负责在各自区域内执行计划并与员工,客户和第三方保持联系。在IT内部,恢复团队应按服务和产品分组。 914 +(% style="width:467px" %) 915 +|(% style="width:91px" %)连续性计划的层次|(% style="width:81px" %)组织层次|(% style="width:293px" %)描述 916 +|(% style="width:91px" %)战略|(% style="width:81px" %)行政级别|(% style="width:293px" %)这包括高级管理/主管人员,他们具有组织内的总体权限和控制,并负责危机管理,联络其他部门,事业部,组织,媒体,监管机构,紧急服务等。 917 +|(% style="width:91px" %)战术|(% style="width:81px" %)协调级别|(% style="width:293px" %)通常,该级别比主管组低一级,该组负责协调组织内的整体恢复工作。 918 +|(% style="width:91px" %)运行|(% style="width:81px" %)专家级|(% style="width:293px" %)一系列服务恢复团队,负责在各自区域内执行计划并与员工,客户和第三方保持联系。在IT内部,恢复团队应按服务和产品分组。 1094 1094 1095 1095 表4.3 用于响应和恢复的组织结构 1096 1096 ... ... @@ -1120,44 +1120,16 @@ 1120 1120 1121 1121 尤其是在大型组织中,服务连续性实践应该是自动化的。在可行且有效的地方,可能涉及表5.1中概述的解决方案。 1122 1122 1123 -|(% style="width:89px" %)流程活动|(% colspan="4" style="width:293px" %)自动化手段|(% colspan="3" style="width:442px" %)关键功能|(% colspan="3" style="width:132px" %)对实践有效性的影响 1124 -|(% colspan="11" %)服务连续性管理流程的治理 1125 -|(% style="width:89px" %)((( 1126 -范围的定义 948 +[[image:1642262695902-600.png]] 1127 1127 1128 -策略设置 1129 -)))|(% colspan="4" style="width:293px" %)知识管理工具和文档存储库|(% colspan="3" style="width:442px" %)服务提供者的员工,监管机构和外部利益相关者(例如客户代表)必须容易访问服务的连续性策略,包括方案的范围,指南,角色和职责。|(% colspan="3" style="width:132px" %)低 1130 -|(% style="width:89px" %)认知和演练方案开发|(% colspan="4" style="width:293px" %)业务连续性计划工具|(% colspan="3" style="width:442px" %)服务连续性管理员,服务所有者和恢复团队成员们应有权访问演练时间表,以及他们参与的演练范围的信息。|(% colspan="3" style="width:132px" %)中 1131 -|(% colspan="11" %)业务影响分析流程 1132 -|(% colspan="3" style="width:105px" %)VBF识别|(% colspan="3" style="width:164px" %)服务目录,CMDB,BPM工具|(% colspan="3" style="width:470px" %)为了识别VBF,服务分析人员应有权访问有关服务组件和操作的信息。BPM工具可以提供消费者的流程以及服务支持的操作的有关信息|(% colspan="2" %)高 1133 -|(% colspan="3" style="width:105px" %)中断后果分析|(% colspan="3" style="width:164px" %)((( 1134 -业务连续性计划工具 950 +[[image:1642262721398-460.png]] 1135 1135 1136 - 分析工具,952 +[[image:1642262745322-477.png]] 1137 1137 1138 -风险评估工具,事件管理工具 1139 -)))|(% colspan="3" style="width:470px" %)各种管理系统数据都可以支持分析,例如事件报告和有关已经意识到的风险的信息。在服务或特定的VBF中断的情况下,分析师还可以使用建模工具预测预期的损失。|(% colspan="2" %)高 1140 -|(% colspan="3" style="width:105px" %)((( 1141 -VBF 954 +[[image:1642262768023-787.png]] 1142 1142 1143 -相互依赖关系识别 1144 -)))|(% colspan="3" style="width:164px" %)业务连续性计划工具,CMDB,分析工具|(% colspan="3" style="width:470px" %)分析师可以使用服务和配置模型来识别关键的服务和VBF相互依赖关系。|(% colspan="2" %)高 1145 -|(% colspan="3" style="width:105px" %)服务连续性要求的确定|(% colspan="3" style="width:164px" %)业务连续性计划工具,服务目录|(% colspan="3" style="width:470px" %)连续性管理员,服务所有者和恢复团队成员应有权访问服务的连续性要求。|(% colspan="2" %)低 1146 -|(% colspan="11" %)开发和维护服务连续性计划流程 1147 -|(% colspan="3" style="width:105px" %)服务连续性策略开发|(% colspan="3" style="width:164px" %)业务连续性计划工具,CMDB,变更初始化和控制工具|(% colspan="3" style="width:470px" %)((( 1148 -确定现有控件和弹性措施 956 +[[image:1642262782136-227.png]] 1149 1149 1150 -发起应作为服务连续性策略实现的一部分实施的变更 1151 -)))|(% colspan="2" %)中 1152 -|(% colspan="3" style="width:105px" %)服务连续性计划开发|(% colspan="3" style="width:164px" %)业务连续性计划工具,文档控制工具|(% colspan="3" style="width:470px" %)失效日期控制,版本控制和文档的归档|(% colspan="2" %)从低到高,取决于要管理的文档量 1153 -|(% colspan="2" style="width:138px" %)服务连续性计划的初始测试|(% colspan="9" style="width:877px" %)参见“进行演练” 1154 -|(% colspan="11" %)测试服务连续性计划流程 1155 -|(% colspan="4" %)进行演练|(% colspan="3" %)会议工具,监控工具,技术管理和系统管理工具|(% colspan="3" %)所有相关方应该能够进行沟通和协作,持续了解当前状况并管理服务组件,以执行服务连续性计划。|高 1156 -|(% colspan="4" %)服务连续性审计|(% colspan="3" %)知识管理工具和文档存储库|(% colspan="3" %)审核员应该可以访问服务连续性文档资料,包括计划,练习程序,练习报告和恢复报告。|中 1157 -|(% colspan="11" %)响应和恢复流程 1158 -|(% colspan="4" %)启用|(% colspan="3" %)监控工具,紧急通知,会议工具,事件管理工具|(% colspan="3" %)危机管理组必须能够获得有关事态的信息,并立即直接响应和恢复流程。|高 1159 -|(% colspan="4" %)执行服务连续性计划|(% colspan="3" %)会议工具,紧急管理工具,监控工具,技术管理和系统管理工具,事件管理工具|(% colspan="3" %)所有相关方应能够进行沟通和协作,对当前情况有持续的了解,并管理服务组件,以执行服务连续性计划|高 1160 - 1161 1161 表5.1 服务连续性管理活动的自动化解决方案 1162 1162 1163 1163
- 1642262167262-433.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +69.5 KB - Content
- 1642262190748-510.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +59.5 KB - Content
- 1642262249963-601.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +42.6 KB - Content
- 1642262271197-361.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +45.7 KB - Content
- 1642262555280-925.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +64.4 KB - Content
- 1642262576270-128.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +64.8 KB - Content
- 1642262601759-766.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +61.5 KB - Content
- 1642262627236-955.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +51.6 KB - Content
- 1642262695902-600.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +54.7 KB - Content
- 1642262721398-460.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +54.6 KB - Content
- 1642262745322-477.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +68.5 KB - Content
- 1642262768023-787.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +49.0 KB - Content
- 1642262782136-227.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.superadmin - Size
-
... ... @@ -1,0 +1,1 @@ 1 +40.5 KB - Content