了解容器组（pod）之间的东-西网络流量 EKS 可用区转移要求常见问题其他资源

了解 Amazon EKS 中的 Amazon 应用程序恢复控制器（ARC）可用区转移

Kubernetes 具有原生功能，可让您的应用程序对可用区（AZ）运行状况下降或损坏等事件更具弹性。在 Amazon EKS 集群中运行工作负载时，您可以使用 Amazon 应用程序恢复控制器（ARC）的可用区转移或可用区自动转移，进一步改善应用程序环境的容错能力和应用程序恢复。ARC 可用区转移旨在用作为一种临时措施，允许您将资源流量从损坏的可用区移走，直到可用区转移到期或您取消可用区转移。如有必要，您可以延长可用区转移。

您可以为 EKS 集群启动可用区转移，也可以通过启用可用区自动转移来允许 Amazon 为您进行可用区转移。这种转移会更新集群中东-西网络流量，使其仅考虑在运行状况良好的可用区中的 Worker 节点上运行的容器组（pod）的网络端点。此外，任何处理 EKS 集群中应用程序入口流量的 ALB 或 NLB 都会自动将流量路由到运行状况良好的可用区中的目标。对于那些寻求最高可用性目标的客户来说，在可用区损坏的情况下，能够将所有流量从损坏的可用区转移出去可能很重要，直到可用区恢复为止。为此，您还可以启用带有 ARC 可用区转移的 ALB 或 NLB。

了解容器组（pod）之间的东-西网络流量

下图说明了两个示例工作负载，即“订单”和“产品”。此示例的目的是展示不同可用区中的工作负载和容器组（pod）是如何通信的。

要使“订单”与“产品”通信，它必须首先解析目标服务的 DNS 名称。“订单”将与 CoreDNS 通信以获取该服务的虚拟 IP 地址（集群 IP）。“订单”解析“产品”服务名称后，它会将流量发送到该目标 IP。
kube-proxy 在集群中的每个节点上运行，并持续监视 EndpointSlices 的服务。创建服务时，EndpointSlice 控制器将在后台创建和管理 EndpointSlice。每个 EndpointSlice 都有一个端点列表或表格，其中包含容器组（pod）地址的子集以及它们在其中正在运行的节点。kube-proxy 在节点上为每个容器组（pod）端点设置 iptables 路由规则。kube-proxy 还负责一种基本的负载平衡，方法是将发往服务集群 IP 的流量重定向为直接发送到容器组（pod）的 IP 地址。kube-proxy 通过重写传出连接上的目标 IP 来实现此目的。
然后，网络数据包通过相应节点上的 ENI 发送到可用区 2 中的“产品”容器组（pod）（如上图所示）。

了解 Amazon EKS 中的 ARC 可用区转移

如果您的环境中存在可用区损坏，则可以为您的 EKS 集群环境启动可用区转移。或者，您可以允许 Amazon 使用可用区自动转移来为您管理此操作。使用可用区自动转移，Amazon 将监控整体可用区运行状况，并通过自动将流量从集群环境中损坏的可用区转移出去来应对潜在的可用区损坏。

使用 ARC 启用 Amazon EKS 集群可用区转移后，您可以使用 ARC 控制台、Amazon CLI 或可用区转移和可用区自动转移 API，触发可用区转移或启用可用区自动转移。在 EKS 可用区转移期间，将自动发生以下情况：

受影响可用区中的所有节点都将被封锁。这将防止 Kubernetes 调度器将新容器组（pod）调度到运行状况不佳的可用区中的节点上。
如果您使用的是托管节点组，则可用区重新平衡将被暂停，并且您的自动扩缩组（ASG）也将更新，以确保新的 EKS 数据面板节点仅在运行状况良好的可用区中启动。
运行状况不佳的可用区中的节点不会被终止，容器组（pod）也不会被逐出这些节点。这是为了确保当可用区转移到期或被取消时，您的流量可以安全地返回到仍处于满负荷状态的可用区
EndpointSlice 控制器将在损坏的可用区中找到所有容器组（pod）端点，并将它们从相关的 EndpointSlices 中移除。这将确保只有运行状况良好的可用区中的容器组（pod）端点才会成为接收网络流量的目标。当可用区转移被取消或到期时，EndpointSlice 控制器将更新 EndpointSlices 以包括已恢复的可用区中的端点。

下图描绘了 EKS 可用区转移如何确保集群环境中仅针对健康的容器组（pod）端点的高级流程。

EKS 可用区转移要求

要在 EKS 中成功进行可用区转移，您需要事先设置集群环境，使其能够抵御可用区损坏。以下是您必须遵循的步骤列表。

跨多个可用区配置集群的 Worker 节点
配置足够的计算容量以承受单个可用区的移除
在每个可用区预先扩展容器组（pod）（包括 CoreDN）
将多个容器组（pod）副本分布在所有可用区中，确保从单个可用区转移出来会给您留下足够的容量
将相互依赖或相关的容器组（pod）放在同一可用区中
通过手动启动可用区转移，测试集群环境是否能在减少一个可用区的情况下按预期运行。或者，您可以启用可用区自动转移并在自动转移练习运行时回复。在 EKS 中进行可用区转移不是强制要求，但强烈建议这样做。

跨多个可用区配置您的 EKS Worker 节点

Amazon 区域有多个独立的地点，其物理数据中心被称为可用区（AZ)。可用区在物理上相互隔离，以避免同时影响整个区域的冲击。在配置 EKS 集群时，您应该将 Worker 节点部署到一个区域中的多个可用区。这将使您的集群环境更能抵御单个可用区的损坏，并使您能够保持在其它可用区中运行的应用程序的高可用性（HA）。当您开始从受影响的可用区启动可用区转移时，您的 EKS 环境的集群内网络将自动更新为仅使用运行状况良好的可用区，同时保持集群的高可用性。

确保为 EKS 环境设置这样的多可用区将提高系统的整体可靠性。但是，多可用区环境可以在应用程序数据的传输和处理方式中发挥重要作用，这反过来又会影响您环境的网络费用。特别是，频繁的跨可用区出站流量（流量分布在可用区之间）可能会对您的网络相关成本产生重大影响。您可以应用不同的策略来控制 EKS 集群中容器组（pod）之间的跨可用区流量并降低相关成本。有关在运行高可用性 EKS 环境时如何优化网络成本的更多详细信息，请参阅这份最佳实践指南。

下图描绘了具有 3 个运行状况良好的可用区的高可用 EKS 环境。

下图描绘了具有 3 个可用区的 EKS 环境如何抵御可用区损坏，并且由于其它 2 个可用区运行状况良好，因此仍保持高可用。

配置足够的计算容量以承受单个可用区的移除

为了优化 EKS 数据面板中计算基础设施的资源利用率和成本，最佳做法是使计算容量与工作负载要求保持一致。但是，如果您的所有 Worker 节点都已满负荷，那么在调度新的容器组（pod）之前，您只能依赖将新的 Worker 节点添加到 EKS 数据面板中。在运行关键工作负载时，通常最好使用冗余容量在线运行，以应对负载突然增加、节点运行状况问题等意外情况。如果您计划使用可用区转移，则要计划移除整个可用区的容量，因此您需要调整冗余计算容量，使其足以处理负载，即使可用区处于离线状态也不例外。

在扩展计算时，向 EKS 数据面板添加新节点的过程将花费一些时间，这可能会对应用程序的实时性能和可用性产生影响，尤其是在出现可用区损坏的情况下。您的 EKS 环境应具有弹性，能够承受丢失可用区所带来的负载，从而避免最终用户或客户体验降级。这意味着要最大限度地减少或消除需要新容器组（pod）的时间与实际调度到 Worker 节点上的时间之间的任何延迟。

此外，如果出现可用区损坏，您应降低潜在的计算容量限制的风险，这将阻止在运行状况良好的可用区中将新需要的节点添加到您的 EKS 数据面板中。

为此，您应该在每个可用区的某些 Worker 节点中超额预置计算容量，以便 Kubernetes 调度器有预先存在的容量可用于放置新容器组（pod），尤其是在您的环境中少了一个可用区时。

跨可用区运行和传播多个容器组（pod）副本

Kubernetes 允许您通过运行单个应用程序的多个实例（容器组（pod）副本）来预先扩展工作负载。为一个应用程序运行多个容器组（pod）副本可以消除单点故障，并通过减少单个副本的资源紧张来提高其整体性能。但是，为了使应用程序具有高可用性和更好的容错能力，您应该在不同的故障域（也称为拓扑域，在本例中为可用区）中运行应用程序的多个副本并将它们分散到不同的故障域。借助拓扑分布限制，您可以将应用程序设置为具有预先存在的静态稳定性，这样，在可用区出现故障的情况下，运行状况良好的可用区中有足够的副本可以立即处理它们可能遇到的任何额外峰值或流量激增。

下图描绘了当所有可用区都处于运行状况良好状态时，具有东-西流量流向的 EKS 环境。

下图描绘了当单个可用区出现故障并启动可用区转移时，具有东-西流量流向的 EKS 环境。

以下代码段是如何使用此 Kubernetes 功能设置工作负载的示例。


apiVersion: apps/v1
kind: Deployment
metadata:
  name: orders
spec:
  replicas: 9
  selector:
    matchLabels:
      app:orders
  template:
    metadata:
      labels:
        app: orders
        tier: backend
    spec:
      topologySpreadConstraints:
      - maxSkew: 1
        topologyKey: "topology.kubernetes.io/zone"
        whenUnsatisfiable: ScheduleAnyway
        labelSelector:
          matchLabels:
            app: orders

最重要的是，您应该运行 DNS 服务器软件（CoreDNS/kube-dns）的多个副本，如果默认情况下尚未配置这些副本，则应用类似的拓扑分布限制。这将有助于确保您在运行状况良好的可用区中有足够的 DNS 容器组（pod），以便在出现单个可用区损坏时继续处理集群中其它通信容器组（pod）的服务发现请求。CoreDNS EKS 附加组件具有默认设置，如果多个可用区中有节点可用，则 CoreDNS 容器组（pod）将分布在集群的可用区域中。您也可以将这些默认设置替换为您自己的自定义配置。

使用 Helm 安装 CoreDNS 时，您可以更新 values.yaml 文件中的 replicaCount，以确保每个可用区中有足够数量的副本。此外，为确保这些副本分布在集群环境中的不同可用区中，您应更新同一个 values.yaml 文件中的 topologySpreadConstraints 属性。下面的代码段演示了如何配置 CoreDNS 以实现此目的。

CoreDNS Helm values.yaml


replicaCount: 6
topologySpreadConstraints:
  - maxSkew: 1
    topologyKey: topology.kubernetes.io/zone
    whenUnsatisfiable: ScheduleAnyway
    labelSelector:
      matchLabels:
        k8s-app: kube-dns

如果出现可用区损坏，您可以使用 CoreDNS 的自动缩放系统来吸收 CoreDNS Pod 上增加的负载。您需要的 DNS 实例数将取决于集群中运行的工作负载数。CoreDNS 受 CPU 约束，允许它使用 Horizontal Pod Autoscaler（HPA）基于 CPU 进行扩展。以下是您可以修改以满足需求的示例。


apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  name: coredns
  namespace: default
spec:
  maxReplicas: 20
  minReplicas: 2
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: coredns
  targetCPUUtilizationPercentage: 50

另外，EKS 可以在 CoreDNS 的 EKS 附加组件版本中管理 CoreDNS 部署的自动扩缩。此 CoreDNS 自动扩缩器会持续监控集群状态，包括节点数量和 CPU 核心数量。控制器会根据这些信息，动态调整 EKS 集群中 CoreDNS 部署的副本数量。

要在 CoreDNS EKS 附加组件中启用自动缩放配置，您应该添加以下可选配置设置：


{
  "autoScaling": {
    "enabled": true
  }
}

您也可以使用 NodeLocal DNS 或集群比例自动扩缩器来扩展 CoreDNS。您可以点击横向扩展 CoreDNS 阅读更多相关信息。

将相互依赖的容器组（pod）托管在同一个可用区中

在大多数情况下，您可能正在运行不同的工作负载，这些工作负载必须相互通信才能成功执行端到端流程。如果不同的应用程序分布在不同的可用区中，但托管在同一个可用区中，则单个可用区损坏可能会影响底层的端到端流程。例如，如果应用程序 A 在可用区 1 和可用区 2 中有多个副本，但应用程序 B 的所有副本都在可用区 3 中，则可用区 3 丢失将影响这两个工作负载（应用程序 A 和 B）之间的任何端到端流程。将拓扑分布约束与容器组（pod）亲和性相结合，可以将容器组（pod）分布到所有可用区，以及在某些容器组（pod）之间配置关系以确保它们托管在一起，从而增强应用程序的弹性。

借助容器组（pod）亲和性规则，您可以定义工作负载之间的关系以影响 Kubernetes 调度器的行为，使其将容器组（pod）托管在同一个 Worker 节点或同一个可用区中。您还可以配置这些调度限制的严格程度。


apiVersion: apps/v1
kind: Deployment
metadata:
  name: products
  namespace: ecommerce
  labels:
    app.kubernetes.io/version: "0.1.6"

    spec:
      serviceAccountName: graphql-service-account
      affinity:
        podAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:
          - labelSelector:
              matchExpressions:
              - key: app
                operator: In
                values:
                - orders
            topologyKey: "kubernetes.io/hostname"

下图描绘了使用容器组（pod）亲和性规则托管在同一节点上的容器组（pod）。

测试您的集群环境能否应对可用区的丢失

完成上述要求后，下一个重要步骤是测试您是否有足够的计算和工作负载容量来应对可用区的丢失。您可以通过在 EKS 中手动触发可用区转移来实现此目的。或者，您可以启用可用区自动转移并配置练习运行，以测试在集群环境中少一个可用区的情况下，您的应用程序是否按预期运行。

常见问题

为什么应该使用此功能？

通过在 EKS 集群中使用 ARC 可用区转移或可用区自动转移，您可以自动执行将集群内网络流量从损坏的可用区转移出去的快速恢复过程，从而更好地维护 Kubernetes 应用程序的可用性。使用 ARC，您可以避免漫长而复杂的步骤，这些步骤通常会导致在可用区损坏事件期间延长恢复期。

此功能如何与其它 Amazon 服务结合使用？

EKS 与 ARC 集成，后者为您提供了在 Amazon 中完成恢复操作的主要接口。为了确保集群内流量从损坏的可用区适当路由，对在 Kubernetes 数据面板中运行的容器组（pod）的网络端点列表进行了修改。如果您使用 Amazon 负载均衡器将外部流量路由到集群，则可以向 ARC 注册您的负载均衡器，并对其触发可用区转移，以防止流量流入降级的可用区。此功能还与由 EKS 托管节点组（MNG）创建的 Amazon EC2 Auto Scaling 组（ASG）进行交互。为了防止损坏的可用区被用于新的 Kubernetes 容器组（pod）或节点启动，EKS 将损坏的可用区从 ASG 中移除。

此功能与默认的 Kubernetes 保护有何不同？

此功能与多个 Kubernetes 原生内置保护结合使用，可帮助客户保持弹性。您可以配置容器组（pod）就绪性和存活性探测器，以决定容器组（pod）何时应接入流量。当这些探测器失败时，Kubernetes 会移除将这些容器组（pod）作为服务的目标，流量将不再发送到这些容器组（pod）。虽然这很有用，但对于客户来说，配置这些运行状况检查以确保在区域降级时它们会失败并非易事。ARC 可用区转移功能为用户提供了额外的安全网，可以帮助他们在 Kubernetes 的原生保护不足时完全隔离已降级的可用区。它还为用户提供了一种测试架构的运行就绪性和弹性的简便方法。

Amazon 可以代表我触发可用区转移吗？

可以。如果您想以一种全自动的方式使用 ARC 可用区转移，则可以启用 ARC 可用区自动转移。借助可用区自动转移，您可以依靠 Amazon 来监控 EKS 集群的可用区的运行状况，并在检测到可用区损坏时自动触发转移。

如果我使用此功能，但我的 Worker 节点和工作负载未预先扩展，会发生什么情况？

如果您没有预先扩展，并且依赖于在可用区转移期间配置其它节点或容器组（pod），则可能会出现恢复延迟的情况。向 Kubernetes 数据面板添加新节点的过程将需要一些时间，这可能会对应用程序的实时性能和可用性产生影响，尤其是在出现可用区损坏的情况下。此外，如果出现可用区损坏，您可能会遇到潜在的计算容量限制，这会阻止将新需要的节点添加到运行状况良好的可用区。

如果您的工作负载未预先扩展并分布在集群中的所有可用区，则可用区损坏可能会影响仅在受影响可用区的 Worker 节点上运行的应用程序的可用性。为了降低应用程序可用性完全中断的风险，如果工作负载的所有端点都位于运行状况不佳的可用区中，EKS 提供了故障安全功能，可以将流量发送到损坏的可用区中的容器组（pod）端点。但是，强烈建议您预先扩展应用程序并将其分散到所有可用区，以便在出现可用区问题时保持可用性。

如果我运行的是有状态的应用程序会怎样？

如果您运行的是有状态的应用程序，则需要根据用例和架构评估其容错能力。如果您采用主动/备用架构或模式，则可能存在主动服务器位于损坏的可用区中的情况。在应用程序级别，如果未激活备用副本，则您的应用程序可能会遇到问题。在运行状况良好的可用区中启动新的 Kubernetes 容器组（pod）时，您也可能会遇到问题，因为它们将无法连接到损坏的可用区的永久卷。

此功能适用于 Karpenter 吗？

在 EKS 中，ARC 可用区转移和可用区自动转移目前不支持 Karpenter。如果可用区损坏，则可以通过移除运行状况不佳的可用区来调整相关的 Karpenter NodePool 配置，这样新的 Worker 节点只能在运行状况良好的可用区中启动。

此功能是否可以与 EKS Fargate 结合使用？

此功能不能与 EKS Fargate 结合使用。默认情况下，当 EKS Fargate 识别出可用区运行状况值事件时，容器组（pod）将更愿意在其它可用区中运行。

EKS 托管的 Kubernetes 控制面板是否会受到影响？

不会。默认情况下，Amazon EKS 跨多个可用区运行和扩展 Kubernetes 控制面板以确保高可用性。ARC 可用区转移和可用区自动转移只能在 Kubernetes 数据面板上起作用。

这项新功能有什么相关费用吗？

您可以在 EKS 集群中使用 ARC 可用区转移和可用区自动转移，无需额外付费。但是，您将继续为预配置实例付费，因此强烈建议您在使用此功能之前预先扩展 Kubernetes 数据面板。您应该考虑在成本和应用程序可用性之间取得适当的平衡。

其他资源

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

自动扩缩

启用可用区转移