创建托管节点组 - Amazon EKS
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

创建托管节点组

本主题介绍了如何启动向 Amazon EKS 集群注册的节点的 Amazon EKS 托管节点组。在这些节点加入集群后,您可以向其部署 Kubernetes 应用程序。

如果这是您首次启动 Amazon EKS 托管节点组,建议您改为遵循我们的 开始使用 Amazon EKS 指南之一。这些指南提供了有关创建包含节点的 Amazon EKS 集群的演练。

重要

先决条件

您可以使用 eksctl 或 Amazon Web Services Management Console 创建托管节点组。

eksctl

使用 eksctl 创建托管节点组

此过程需要 eksctl 版本 0.114.0 或更高版本。可以使用以下命令来查看您的版本:

eksctl version

有关如何安装或升级 eksctl 的说明,请参阅 安装或更新 eksctl

  1. (可选)如果 AmazonEKS_CNI_Policy 托管 IAM policy 附加到您的 Amazon EKS 节点 IAM 角色,我们建议将其分配给您与 Kubernetes aws-node 服务账户关联的 IAM 角色。有关更多信息,请参阅配置 Amazon VPC CNI plugin for Kubernetes 将 IAM 角色用于服务账户

  2. 使用或不使用自定义启动模板创建托管节点组。手动指定启动模板可允许对节点组进行更好的自定义。例如,它可以允许部署自定义 AMI 或向 Amazon EKS 优化的 AMI 中的 boostrap.sh 脚本提供参数。要查看所有可用选项和原定设置的完整列表,请输入以下命令。

    eksctl create nodegroup --help

    在以下命令中,将 my-cluster 替换为您的集群名称,并将 my-mng 替换为您的节点组名称。名称只能包含字母数字字符(区分大小写)和连字符。该名称必须以字母字符开头,且不得超过 100 个字符。将剩余的 example values 替换为您自己的值。

    重要

    如果首次创建托管节点组时没有使用自定义启动模板,则以后不要对节点组使用模板。如果没有指定自定义启动模板,系统会自动生成启动模板,我们不建议您手动修改该模板。手动修改此自动生成的启动模板可能会导致错误。

    • 不使用启动模板eksctl在您的账户中创建默认 Amazon EC2 启动模板,并使用它根据您指定的选项创建的启动模板来部署节点组。在为 --node-type 指定值之前,请参阅 选择 Amazon EC2 实例类型

      my-key 替换为您的 Amazon EC2 密钥对或公有密钥的名称。此密钥用于在节点启动后通过 SSH 进入节点。如果还没有 Amazon EC2 密钥对,可以在 Amazon Web Services Management Console 中创建一个。有关更多信息,请参阅适用于 Linux 实例的 Amazon EC2 用户指南中的 Amazon EC2 密钥对

      如果满足以下条件,我们建议阻止容器组(pod)访问 IMDS:

      • 您计划将 IAM 角色分配到所有 Kubernetes 服务账户,以便容器组(pod)只具有他们所需的最低权限。

      • 集群中没有任何容器组(pod)需要出于其他原因(例如检索当前 Amazon Web Services 区域)访问 Amazon EC2 实例元数据服务(IMDS)。

      有关更多信息,请参阅限制对分配给工作节点的实例配置文件的访问

      如果要阻止 pod 对 IMDS 的访问,请将 --disable-pod-imds 选项添加到以下命令。

      eksctl create nodegroup \ --cluster my-cluster \ --region region-code \ --name my-mng \ --node-type m5.large \ --nodes 3 \ --nodes-min 2 \ --nodes-max 4 \ --ssh-access \ --ssh-public-key my-key

      您的实例可以选择性地为 pods 分配更多的 IP 地址,为其他 CIDR 块(而不是实例的 CIDR 块)中的 pods 分配 IP 地址,以及部署到没有网络访问权限的集群。有关更多信息,请参阅 提高 Amazon EC2 节点的可用 IP 地址数量教程:自定义联网私有集群要求,以获取要添加到上一个命令中的其他选项。

      托管节点组将根据实例类型计算并应用单个值,以作为可以在节点组的每个节点上运行的最大 pods 数量。如果创建具有不同实例类型的节点组,则在所有实例类型中计算得出的最小值将应用为可以在节点组中每种实例类型上运行的最大 pods 数量。托管节点组会使用 Amazon EKS 建议每种 Amazon EC2 实例类型的最大 pods 数量 中引用的脚本计算值。

    • 使用启动模板 – 启动模板必须已存在,并且必须满足 启动模板配置基础知识 中指定的要求。

      如果满足以下条件,我们建议阻止容器组(pod)访问 IMDS:

      • 您计划将 IAM 角色分配到所有 Kubernetes 服务账户,以便容器组(pod)只具有他们所需的最低权限。

      • 集群中没有任何容器组(pod)需要出于其他原因(例如检索当前 Amazon Web Services 区域)访问 Amazon EC2 实例元数据服务(IMDS)。

      有关更多信息,请参阅限制对分配给工作节点的实例配置文件的访问

      如果要阻止 pod 访问 IMDS,请在启动模板中指定必要的设置。

      1. 将以下内容复制到您的设备。替换示例值,然后运行修改后的命令以创建 eks-nodegroup.yaml 文件。在不使用启动模板的情况下进行部署时指定的多个设置将移动到启动模板中。如果未指定 version,则使用模板的默认版本。

        cat >eks-nodegroup.yaml <<EOF apiVersion: eksctl.io/v1alpha5 kind: ClusterConfig metadata: name: my-cluster region: region-code managedNodeGroups: - name: my-mng launchTemplate: id: lt-id version: "1" EOF

        有关 eksctl 配置文件设置的完整列表,请参阅 eksctl 文档中的配置文件架构。您的实例可以选择为 pods 分配更多 IP 地址,为其他 CIDR 块(而不是实例的 CIDR 块)中的 pods 分配 IP 地址,使用 containerd 运行时间,并将其部署到没有出站网络访问权限的集群。有关更多信息,请参阅 提高 Amazon EC2 节点的可用 IP 地址数量教程:自定义联网启用 containerd 运行时间引导标记私有集群要求,以获取添加到配置文件中的其他选项。

        如果您没有在启动模板中指定 AMI ID,则托管节点组将根据实例类型计算并应用单个值,以作为可以在节点组的每个节点上运行的最大 pods 数量。如果创建具有不同实例类型的节点组,则在所有实例类型中计算得出的最小值将应用为可以在节点组中每种实例类型上运行的最大 pods 数量。托管节点组会使用 Amazon EKS 建议每种 Amazon EC2 实例类型的最大 pods 数量 中引用的脚本计算值。

        如果您在启动模板中指定了 AMI ID,请指定可以在节点组的每个节点上运行的最大 pods 数量(如果您使用自定义网络或者想要增加分配到实例的 IP 地址数量)。有关更多信息,请参阅Amazon EKS 建议每种 Amazon EC2 实例类型的最大 pods 数量

      2. 使用以下命令部署节点组。

        eksctl create nodegroup --config-file eks-nodegroup.yaml
Amazon Web Services Management Console

要使用 Amazon Web Services Management Console 创建托管节点组

  1. 等待集群状态显示为 ACTIVE。无法为状态尚未处于 ACTIVE 的集群创建托管节点组。

  2. 从以下位置打开 Amazon EKS 控制台:https://console.aws.amazon.com/eks/home#/clusters

  3. 选择要在其中创建托管节点组的集群的名称。

  4. 选择 Compute(计算)选项卡。

  5. 请选择 Add node group(添加节点组)。

  6. Configure node group (配置节点组) 页面上,填写相应参数,然后选择 Next (下一步)

    • 名称 – 为托管节点组输入唯一名称。名称只能包含字母数字字符(区分大小写)和连字符。该名称必须以字母字符开头,且不得超过 100 个字符。

    • 节点 IAM 角色 – 选择要与节点组一起使用的节点实例角色。有关更多信息,请参阅Amazon EKS 节点 IAM 角色

      重要
      • 您不能使用创建任何集群时使用的相同角色。

      • 我们建议使用任何自行管理节点组当前未使用的角色。否则,计划与新的自行管理节点组配合使用。有关更多信息,请参阅删除托管节点组

    • 使用启动模板 -(可选)选择是否要使用现有启动模板。选择 Launch Template Name(启动模板名称)。然后,选择 Launch template version(启动模板版本)。如果您未选择版本,Amazon EKS 将使用模板的默认版本。启动模板允许您对节点组进行更多自定义,例如允许您部署自定义 AMI、为 pods 分配更多的 IP 地址、将 IP 地址分配到其他 CIDR 块(而不是实例的 CIDR 块)中的 pods、为实例启用 containerd 运行时间,并将节点部署到没有出站网络访问权限的集群。有关更多信息,请参阅 提高 Amazon EC2 节点的可用 IP 地址数量教程:自定义联网启用 containerd 运行时间引导标记私有集群要求

      启动模板必须满足 启动模板支持 中的要求。如果您不使用自己的启动模板,Amazon EKS API 会在您的账户中创建默认 Amazon EC2 启动模板,并使用默认启动模板部署节点组。

      如果实施服务账户的 IAM 角色,请将必要的权限直接分配到需要访问 Amazon 服务的所有 pod,如果集群中没有 pods 因其他原因(例如检索当前 Amazon Web Services 区域)而需要访问 IMDS,那么您还可以在启动模板中为不使用主机网络的 pods 禁用对 IMDS 的访问。有关更多信息,请参阅限制对分配给工作节点的实例配置文件的访问

    • Kubernetes 标签 –(可选)您可以选择对托管节点组中的节点应用 Kubernetes 标签。

    • Kubernetes 污点 –(可选)您可以选择对托管节点组中的节点应用 Kubernetes 污点。Effect(效果)菜单中的可用选项包括 NoScheduleNoExecutePreferNoSchedule

    • 标签 –(可选)您可以选择对 Amazon EKS 托管节点组进行标记。这些标签不会传播到节点组中的其他资源,例如 弹性缩放组或实例。有关更多信息,请参阅为您的 Amazon EKS 资源添加标签

    • 节点组更新配置 –(可选)您可以选择要并行更新的节点的数量或百分比。选择 Number(数字)或者 Percentage(百分比)以输入值。更新期间,这些节点将不可用。

  7. Set compute and scaling configuration(设置计算和扩展配置)页面上,填写相应参数,然后选择 Next(下一步)

    • AMI 类型 – 为 Linux 非 GPU 实例选择 Amazon Linux 2 (AL2_x86_64),为 Linux GPU 实例选择 Amazon Linux 2 GPU 已启用 (AL2_x86_64_GPU)、为 Linux Arm 实例选择 Amazon Linux 2 Arm (AL2_ARM_64)为 Bottlerocket x86_64 实例选择 Bottlerocket (BOTTLEROCKET_x86_64)或为 Bottlerocket Arm 实例选择 Bottlerocket Arm (BOTTLEROCKET_ARM_64)

      如果您要部署 Arm 实例,请务必在部署前查看 Amazon EKS 优化版 Arm Amazon Linux AMI 中的注意事项。

      如果您在上一页指定了启动模板,并在启动模板中指定了 AMI,则无法选择值。此时将显示模板中的值。模板中指定的 AMI 必须满足 指定 AMI 中的要求。

    • 容量类型 – 选择容量类型。有关选择容量类型的更多信息,请参阅 托管节点组容量类型。不能在同一节点组中混合使用不同的容量类型。如果要同时使用这两种容量类型,请创建单独的节点组,每个节点组都有自己的容量和实例类型。

    • 实例类型 – 默认指定一个或多个实例类型。要删除默认实例类型,请选择实例类型右侧的 X。选择要在托管节点组中使用的实例类型。有关更多信息,请参阅选择 Amazon EC2 实例类型

      控制台显示一组常用的实例类型。如果需要使用未显示的实例类型创建托管节点组,请使用 eksctl、Amazon CLI、Amazon CloudFormation 或 SDK 创建节点组。如果在上一页指定了启动模板,则无法选择值,因为必须在启动模板中指定实例类型。将显示启动模板中的值。如果为容量类型选择了 Spot 实例,我们建议您指定多个实例类型以增强可用性。

    • 磁盘大小 – 输入要用于节点根卷的磁盘大小(单位为 GiB)。

      如果在上一页指定了启动模板,则无法选择值,因为必须在启动模板中指定该值。

    • 最小大小 – 指定托管节点组可以横向缩减到的最小节点数量。

    • 最大大小 – 指定托管节点组可以横向扩展到的最大节点数量。

    • 所需大小 – 指定托管节点组在启动时应当维持的当前节点数量。

      注意

      Amazon EKS 不会自动扩展或缩减节点组。但是,您可以配置 Kubernetes Cluster Autoscaler 以为您执行此操作。

    • 对于最大不可用,选择下列选项之一,然后指定一个

      • Number(数字)– 选择并指定节点组中可以并行更新的节点数。这些节点在更新过程中将不可用。

      • Percentage(百分比)– 选择并指定节点组中可并行更新的节点的百分比。这些节点在更新过程中将不可用。如果您的节点组中有大量节点,这将非常有用。

  8. Specify networking(指定联网)页面上,相应填写参数,然后选择 Next(下一步)

    • 子网 – 选择要在其中启动托管节点的子网。

      重要

      如果要使用 Kubernetes Cluster Autoscaler 在由 Amazon EBS 卷支持的多个可用区中运行有状态应用程序,则应该配置多个节点组,每个节点组的范围都限定为一个可用区。此外,您还应该启用 --balance-similar-node-groups 功能。

      重要
      • 如果您选择公有子网,并且您的集群仅启用公有 API 服务器端点,则子网必须将 MapPublicIPOnLaunch 设置为 true,实例才能成功加入集群。如果子网是使用 eksctlAmazon EKS 发布的 Amazon CloudFormation 模板在 2020 年 3 月 26 日或之后创建的,则此设置已设置为 true。如果子网是在 2020 年 3 月 26 日之前使用 eksctl 或 Amazon CloudFormation 模板创建的,则需要手动更改设置。有关更多信息,请参阅修改子网的公有 IPv4 寻址属性

      • 如果使用启动模板并指定多个网络接口,即使 MapPublicIpOnLaunch 设置 true,Amazon EC2 也不会自动分配公有 IPv4 地址。在这种情况下,要让节点加入集群,您必须启用集群的私有 API 服务器端点,或者在具有出站 Internet 访问的私有子网中启动节点(Internet 访问通过如 NAT 网关等其他方法提供)。有关更多信息,请参阅适用于 Linux 实例的 Amazon EC2 用户指南中的 Amazon EC2 实例 IP 寻址

    • Configure SSH access to nodes(配置对节点的 SSH 访问)(可选)。启用 SSH 后,如果出现问题,您可以连接到实例并收集诊断信息。请完成以下步骤以启用远程访问。我们强烈建议您在创建节点组时启用远程访问。创建节点组后,将无法启用远程访问。

      如果您选择使用启动模板,则不会显示此选项。要启用对节点的远程访问,请在启动模板中指定密钥对,并确保为您在启动模板中指定的安全组中的节点打开正确的端口。有关更多信息,请参阅使用自定义安全组

    • 对于 SSH 密钥对(可选),请选择要使用的 Amazon EC2 SSH 密钥。有关更多信息,请参阅适用于 Linux 实例的 Amazon EC2 用户指南中的 Amazon EC2 密钥对。如果您选择使用启动模板,则无法选择密钥对。使用 Bottlerocket AMI 为节点组提供 Amazon EC2 SSH 密钥后,还启用管理容器。有关更多信息,请参阅 GitHub 上的 Admin 容器

    • 对于 Allow SSH remote access from(允许来自以下的远程访问),如果要限制对特定实例的访问,请选择与这些实例关联的安全组。如果没有选择特定的安全组,则允许从 Internet 上的任何位置进行 SSH 访问(0.0.0.0/0)。

  9. Review and create (审核并创建) 页面上,审核托管节点组配置并选择 Create (创建)

    如果节点无法加入集群,请参阅《故障排除指南》中的 节点未能加入集群

  10. 查看节点的状态并等待它们达到 Ready 状态。

    kubectl get nodes --watch
  11. (仅限 GPU 节点)如果选择 GPU 实例类型和 Amazon EKS 优化版加速型 AMI,则必须使用以下命令在集群上将适用于 Kubernetes 的 NVIDIA 设备插件用作 DaemonSet。

    kubectl apply -f https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v0.9.0/nvidia-device-plugin.yml
  12. (可选)将 Linux 节点添加到集群后,请按照 为 Amazon EKS 集群启用 Windows 支持 中的步骤向集群添加 Windows 支持并添加 Windows Worker 节点。所有 Amazon EKS 集群必须至少包含一个 Linux 节点,即使您只想在集群中运行 Windows 工作负载也是如此。

现在,您已有使用节点运行的 Amazon EKS 集群,那么就可以准备开始安装 Kubernetes 插件并将应用程序部署到您的集群。以下文档主题可帮助您扩展集群的此功能。

  • 创建集群的 IAM 实体(用户或角色)是唯一可以使用 kubectl 或 Amazon Web Services Management Console 调用 Kubernetes API 服务器的 IAM 用户。如果您希望其他 IAM 用户或角色拥有访问您集群的权限,您需要添加它们。有关更多信息,请参阅 让 IAM 用户和角色有权访问您的集群所需权限

  • 如果满足以下条件,我们建议阻止容器组(pod)访问 IMDS:

    • 您计划将 IAM 角色分配到所有 Kubernetes 服务账户,以便容器组(pod)只具有他们所需的最低权限。

    • 集群中没有任何容器组(pod)需要出于其他原因(例如检索当前 Amazon Web Services 区域)访问 Amazon EC2 实例元数据服务(IMDS)。

    有关更多信息,请参阅限制对分配给工作节点的实例配置文件的访问

  • Cluster Autoscaler – 配置 Kubernetes Cluster Autoscaler 以自动调整节点组中的节点数。

  • 示例应用程序部署到您的集群。

  • 集群管理 – 了解如何使用重要工具来管理集群。