AWS Well-Architected Framework Reliability Pillar 的运营最佳实践 - AWS Config
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

AWS Well-Architected Framework Reliability Pillar 的运营最佳实践

一致性包提供了通用的合规性框架,旨在使您能够使用托管或自定义 AWS Config 规则以及 AWS Config 修正操作来创建安全、操作或成本优化监管检查。作为示例模板的一致性包并非旨在完全确保符合特定的监管或合规性标准。您有责任评估您对服务的使用是否符合适用的法律法规要求。

下面提供了 Amazon Web Services 的“架构完善的框架可靠性支柱”和 AWS 托管 Config 规则之间的示例映射。每个 Config 规则适用于特定的 AWS 资源,并且与支柱的一个或多个设计原则相关。架构完善的框架类别可与多个 Config 规则关联。有关与这些映射相关的更多详细信息和指导,请参阅下表。

此一致性包已由 AWS Security Assurance Services LLC (AWS SAS) 验证,AWS SAS 是一个由支付卡行业限定的安全评估程序 (QSA)、HITRUST 认证的常见安全框架练习程序 (CCSFP) 和合规性专家组成的团队,这些专家通过了认证,可提供针对各种行业框架的指导和评估。AWS SAS 专业人员设计此一致性包,以使客户能够符合 AWell-Architected Framework Reliability Pillar 设计原则的子集。

AWS 区域: 所有支持的 AWS 区域(中东(巴林) 除外)

控制 ID 控制描述 AWS Config 规则 指南
REL-1 您如何管理服务配额和约束? 对于基于云的工作负载架构,具有服务配额(也称为服务限制)。这些配额存在是为了防止意外预配置超出所需数量的资源,并限制 API 操作的请求速率以防止服务滥用。此外还存在资源限制,例如,可以下推光纤电缆的比特或物理磁盘上的存储量。

dynamodb-throughput-limit-check

启用此规则可确保在 Amazon DynamoDB 表上检查预置的吞吐容量。这是每个表可支持的读/写活动量。DynamoDB 使用此信息来预留足够的系统资源,以满足吞吐量需求。此规则在吞吐量接近客户账户的最大限制时生成警报。此规则允许您选择性地设置 accountRCUThresholdPercentage(配置默认值:80)和 accountWCUThresholdPercentage(配置默认值:80)参数。实际值应反映您组织的策略。
REL-1 您如何管理服务配额和约束? 对于基于云的工作负载架构,具有服务配额(也称为服务限制)。这些配额存在是为了防止意外预配置超出所需数量的资源,并限制 API 操作的请求速率以防止服务滥用。此外还存在资源限制,例如,可以下推光纤电缆的比特或物理磁盘上的存储量。

lambda-concurrency-check

此规则可确保 Lambda 函数的并发数量上限和下限已建立。这有助于设定您的函数在任何给定时间所服务的请求数。
REL-2 您如何计划您的网络拓扑? 工作负载通常存在于多个环境中。其中包括多个云环境(可公开访问和私有)以及现有的数据中心基础设施。计划必须包括网络注意事项,如系统内和系统间连接、公有 IP 地址管理、私有 IP 地址管理和域名解析。

可以实施冗余站点到站点 VPN 隧道以实现恢复能力要求。它使用两条隧道来帮助确保连接性,以防其中一个站点到站点 VPN 连接变得不可用。为了防止连接丢失,在您的客户网关变得不可用时,您可以使用第二个客户网关设置到 Amazon Virtual Private Cloud (Amazon VPC) 和虚拟专用网关的第二个站点到站点 VPN 连接。
REL-7 您如何设计工作负载来适应需求变化? 可扩展工作负载提供弹性,可自动添加或删除资源,使其在任何给定时间点与当前需求紧密匹配。

dynamodb-autoscaling-enabled

Amazon DynamoDB Auto Scaling 使用 AWS Application Auto Scaling 服务调整预置的吞吐容量,以自动响应实际的流量模式。这使表或全局二级索引能够增加其预置读/写容量以处理突增流量,而不进行限制。
REL-8 您如何实施更改? 需要进行受控更改以部署新功能,并确保工作负载和操作环境正在运行已知的软件,并且可以按可预测的方式修补或替换。如果这些更改是 确认的,则很难预测这些更改的影响或解决因更改而导致的问题。

redshift-cluster-maintenancesettings-check

此规则可确保 Amazon Redshift 集群具有组织的首选设置。具体而言,他们首选数据库的维护时段和自动快照保留期。此规则要求您设置 allowVersionUpgrade。 默认值为 true。它还允许您选择设置 preferredMaintenanceWindow(默认值为“sait:16:00-sat:16:30”),以及 automatedSnapshotRetentionPeriod(默认值为 1)。实际值应反映您组织的策略。
REL-9 如何备份数据? 备份数据、应用程序和配置以满足您的恢复时间目标 (RTO) 和恢复点目标 (RPO) 要求。

db-instance-backup-enabled

Amazon RDS 的备份功能创建数据库和事务日志的备份。Amazon RDS 自动创建数据库实例的存储卷快照,并备份整个数据库实例。系统允许您设置特定的保留期以满足您的弹性要求。
REL-9 如何备份数据? 备份数据、应用程序和配置以满足您的恢复时间目标 (RTO) 和恢复点目标 (RPO) 要求。

dynamodb-in-backup-plan

为了帮助备份数据过程,请确保您的 Amazon DynamoDB 表是 AWS Backup 计划的一部分。AWS Backup 是一项具有基于策略的备份解决方案的完全托管的备份服务。此解决方案简化了备份管理,并使您能够满足业务和监管备份合规性要求。
REL-9 如何备份数据? 备份数据、应用程序和配置以满足您的恢复时间目标 (RTO) 和恢复点目标 (RPO) 要求。

dynamodb-pitr-enabled

启用此规则可检查是否已备份信息。它还通过确保在 Amazon DynamoDB 中启用时间点恢复来维护备份。 该恢复将保留过去 35 天的表连续备份。
REL-9 如何备份数据? 备份数据、应用程序和配置以满足您的恢复时间目标 (RTO) 和恢复点目标 (RPO) 要求。

ebs-in-backup-plan

为了帮助处理数据备份过程,请确保您的 Amazon Elastic Block Store (Amazon EBS) 卷是 AWS Backup 计划的一部分。AWS Backup 是一项具有基于策略的备份解决方案的完全托管的备份服务。此解决方案简化了备份管理,并使您能够满足业务和监管备份合规性要求。
REL-9 如何备份数据? 备份数据、应用程序和配置以满足您的恢复时间目标 (RTO) 和恢复点目标 (RPO) 要求。

efs-in-backup-plan

为了帮助处理数据备份过程,请确保您的 Amazon Elastic File System (Amazon EFS) 文件系统是 AWS Backup 计划的一部分。AWS Backup 是一项具有基于策略的备份解决方案的完全托管的备份服务。此解决方案简化了备份管理,并使您能够满足业务和监管备份合规性要求。
REL-9 如何备份数据? 备份数据、应用程序和配置以满足您的恢复时间目标 (RTO) 和恢复点目标 (RPO) 要求。

elasticache-redis-cluster-automatic-backup-check

在启用自动备份时,Amazon ElastiCache 每天为集群创建备份。备份可以保留您的组织指定的天数。自动备份可以帮助防止数据丢失。如果发生故障,您可以创建一个新集群,以从最新的备份还原数据。
REL-9 如何备份数据? 备份数据、应用程序和配置以满足您的恢复时间目标 (RTO) 和恢复点目标 (RPO) 要求。

rds-in-backup-plan

为了帮助处理数据备份过程,请确保您的 Amazon Relational Database Service (Amazon RDS) 实例是 AWS Backup 计划的一部分。AWS Backup 是一项具有基于策略的备份解决方案的完全托管的备份服务。此解决方案简化了备份管理,并使您能够满足业务和监管备份合规性要求。
REL-10 您如何使用故障隔离来保护您的工作负载? 故障隔离边界将工作负载中故障的影响限定为有限数量的组件。边界外部的组件不受故障影响。通过使用多个故障隔离边界,您可以限制对工作负载的影响。

elb-cross-zone-load-balancing-enabled

为您的 Elastic Load Balancer (ELB) 启用跨区域负载均衡,以帮助保持充足的容量和可用性。跨区域负载均衡可降低在每个启用的可用区中保持相同数量的实例的需求。它还可以提高应用程序处理一个或多个实例丢失情况的能力。
REL-9 如何备份数据? 备份数据、应用程序和配置以满足您的恢复时间目标 (RTO) 和恢复点目标 (RPO) 要求。

s3-bucket-replication-enabled

Amazon Simple Storage Service (Amazon S3) 跨区域复制 (CRR) 支持保持充足的容量和可用性。CRR 允许跨 Amazon S3 存储桶自动异步复制对象,以帮助确保维护数据可用性。
REL-10 您如何使用故障隔离来保护您的工作负载? 故障隔离边界将工作负载中故障的影响限定为有限数量的组件。边界外部的组件不受故障影响。通过使用多个故障隔离边界,您可以限制对工作负载的影响。

rds-multi-az-support

Amazon Relational Database Service (Amazon RDS) 中的多可用区支持为数据库实例提供了更高的可用性和持久性。当您预配置多可用区数据库实例时,Amazon RDS 会自动创建一个主数据库实例,并将数据同步复制到其他可用区中的备用实例。每个可用区都运行在其自己的、独立的物理上不同的基础设施上,且设计为高度可靠。如果基础设施出现故障,Amazon RDS 将自动故障转移到备用实例,以便您可以在故障转移完成后立即恢复数据库操作。

Template

该模板在 GitHub 上可用: AWS Well-Architected Reliability Pillar 的运营最佳实践