HeadNode 部分 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

HeadNode 部分

(必需)指定头节点的配置。

HeadNode: InstanceType: string Networking: SubnetId: string ElasticIp: string/boolean SecurityGroups: - string AdditionalSecurityGroups: - string Proxy: HttpProxyAddress: string DisableSimultaneousMultithreading: boolean Ssh: KeyName: string AllowedIps: string LocalStorage: RootVolume: Size: integer Encrypted: boolean VolumeType: string Iops: integer Throughput: integer DeleteOnTermination: boolean EphemeralVolume: MountDir: string Dcv: Enabled: boolean Port: integer AllowedIps: string CustomActions: OnNodeStart: Script: string Args: - string OnNodeConfigured: Script: string Args: - string OnNodeUpdated: Script: string Args: - string Iam: InstanceRole: string InstanceProfile: string S3Access: - BucketName: string EnableWriteAccess: boolean KeyName: string AdditionalIamPolicies: - Policy: string Imds: Secured: boolean Image: CustomAmi: string

HeadNode 属性

InstanceType必需String

指定头节点的实例类型。

指定用于头节点的 Amazon EC2 实例类型。实例类型的架构必须与用于Amazon BatchInstanceType或SlurmInstanceType设置的架构相同。

注意

Amazon ParallelCluster不支持该HeadNode设置的以下实例类型。

  • hpc6id

如果您定义了 p4d 实例类型或其他具有多个网络接口或网络接口卡的实例类型,则必须设置为ElasticIptrue才能提供公共访问权限。 Amazon公有 IP 只能分配给使用单个网络接口启动的实例。在这种情况下,我们建议您使用 NAT 网关提供对集群计算节点的公共访问权限。有关更多信息,请参阅适用于 Lux 实例的 Amazon EC2 用户指南中的在实例启动期间分配公有 IPv4 地址

更新策略:如果更改此设置,则不允许更新。

DisableSimultaneousMultithreading可选Boolean

如果true是,则禁用头节点上读取超线程。默认值为 false

并非所有实例类型都可以禁用超线程。有关支持禁用超线程的实例类型的列表,请参阅《适用于 Linux 实例的 Amazon EC2 用户指南》中每种实例类型的 CPU 核心和线程。

更新策略:如果更改此设置,则不允许更新。

Networking

(必需)定义头节点的网络配置。

Networking: SubnetId: string ElasticIp: string/boolean SecurityGroups: - string AdditionalSecurityGroups: - string Proxy: HttpProxyAddress: string

更新策略:如果更改此设置,则不允许更新。

Networking 属性

SubnetId必需String

指定要在其中配置头节点的现有子网的 ID。

更新策略:如果更改此设置,则不允许更新。

ElasticIp可选String

创建或分配弹性 IP 地址。支持的值是truefalse、或现有弹性 IP 地址的 ID。默认为 false

更新策略:如果更改此设置,则不允许更新。

SecurityGroups可选[String]

用于头节点的 Amazon VPC 安全组 ID 列表。如果不包含此属性,它们将取代Amazon ParallelCluster创建的安全组。

验证是否为您的SharedStorage系统正确配置了安全组。

更新策略:可以在更新期间更改此设置。

AdditionalSecurityGroups可选[String]

用于头节点的其他 Amazon VPC 安全组 ID 列表。

更新策略:可以在更新期间更改此设置。

Proxy可选

指定头节点的代理设置。

Proxy: HttpProxyAddress: string
HttpProxyAddress可选String

定义 HTTP 或 HTTPS 代理服务器,通常为 https://x.x.x.x:8080

没有默认值。

更新策略:如果更改此设置,则不允许更新。

Ssh

(可选)定义 SSH 访问头节点的配置。

Ssh: KeyName: string AllowedIps: string

更新策略:可以在更新期间更改此设置。

Ssh 属性

KeyName可选String

命名一个现有 Amazon EC2 key pair,以支持对头节点进行 SSH 访问。

更新策略:如果更改此设置,则不允许更新。

AllowedIps可选String

为与头节点的 SSH 连接指定 CIDR 格式的 IP 范围。默认为 0.0.0.0/0

更新策略:可以在更新期间更改此设置。

LocalStorage

(可选)定义头节点的本地存储配置。

LocalStorage: RootVolume: Size: integer Encrypted: boolean VolumeType: string Iops: integer Throughput: integer DeleteOnTermination: boolean EphemeralVolume: MountDir: string

更新策略:可以在更新期间更改此设置。

LocalStorage 属性

RootVolume必需

为头节点指定根卷存储。

RootVolume: Size: integer Encrypted: boolean VolumeType: string Iops: integer Throughput: integer DeleteOnTermination: boolean

更新策略:可以在更新期间更改此设置。

Size可选Integer

以吉字节 (GiB) 为单位)指定头节点根卷大小。默认大小来自 AMI。使用不同的大小需要 AMI 支持growroot

更新策略:如果更改此设置,则不允许更新。

Encrypted可选Boolean

指定是否加密根卷。默认值为 true

更新策略:如果更改此设置,则不允许更新。

VolumeType可选String

指定亚马逊 EBS 卷类型。支持的值为gp2gp3io1io2sc1st1、和standard。默认值为 gp3

有关更多信息,请参阅 Amazon EC2 用户指南(适用于 Linux 实例) 中的 Amazon EBS 卷类型

更新策略:如果更改此设置,则不允许更新。

Iops可选Integer

定义io1io2gp3类型卷的 IOPS 数量。

默认值、支持的值和volume_size比率volume_iopsVolumeType和而异Size

更新策略:如果更改此设置,则不允许更新。

VolumeType = io1

默认值Iops = 100

支持的值Iops = 100—64000 †

最大IopsSize比率 = 每 GiB 50 IOPS。5000 IOPS 需要至少 100 GiB 的。Size

VolumeType = io2

默认值Iops = 100

支持的值Iops = 100—64000(io2Block Express 卷为 256000)†

最大IopsSize比率 = 每 GiB 500 IOPS。5000 IOPS 需要至少 10 GiB。Size

VolumeType = gp3

默认值Iops = 3000

支持的值Iops = 3000—16000

最大IopsSize比率 = 每 GiB 500 IOPS。5000 IOPS 需要至少 10 GiB。Size

† 只有在 IOPS 超过 32,000的情况下,才能保证在 Nitro 系统上构建的实例上实现最大 IOPS。其他实例保证最高为 32,000 IOPS。除非您修改io1卷,否则较旧的卷可能无法实现完全性能。 io2Block Express 卷支持的R5b实例类型Iops值最高为 256,000。有关更多信息,请参阅适用于 Lux 实例的 Amazon EC2 用户指南中的io2 Block Ex press 卷

更新策略:可以在更新期间更改此设置。

Throughput可选Integer

定义gp3卷类型的吞吐量,以 MiB/s 为单位。此设置仅在为时VolumeType有效gp3。默认值为 125。支持的值:125—1000 MiB/s

Throughput的比率Iops不能超过 0.25。1000 MiB/s 的最大吞吐量要求Iops设置至少为 4000。

更新策略:如果更改此设置,则不允许更新。

DeleteOnTermination可选Boolean

指定终止头节点时是否应删除根音量。默认值为 true

更新策略:如果更改此设置,则不允许更新。

EphemeralVolume可选

指定任何实例存储卷的详细信息。有关更多信息,请参阅适用于 Lux 实例的 Amazon EC2 用户指南中的实例存储卷

EphemeralVolume: MountDir: string

更新策略:如果更改此设置,则不允许更新。

MountDir可选String

指定实例存储卷的装载目录。默认为 /scratch

更新策略:如果更改此设置,则不允许更新。

Dcv

(可选)定义在头节点上运行的 NICE DCV 服务器的配置设置。

有关更多信息,请参阅通过 NICE DCV Connect 头节点

Dcv: Enabled: boolean Port: integer AllowedIps: string
重要

默认情况下,设置的 NICE DCV 端口对所有 IPv4 地址开放。Amazon ParallelCluster但是,只有当你有 NICE DCV 会话的 URL 并在返回 URL 后的 30 秒内连接到 NICE DCV 会话时,你才能连接到 NICE DCV 端口pcluster dcv-connect。使用该AllowedIps设置进一步限制对具有 CIDR 格式的 IP 范围的 NICE DCV 端口的访问,并使用该Port设置来设置非标准端口。

更新策略:如果更改此设置,则不允许更新。

Dcv 属性

Enabled必需Boolean

指定是否在头节点上使用 NICE DCV。默认值为 false

更新策略:如果更改此设置,则不允许更新。

注意

NICE DCV 自动生成自签名证书,用于保护在头节点上运行的 NICE DCV 客户端和 NICE DCV 服务器之间的流量。要配置您自己的证书,请参阅 NICE DCV HTTPS证书

Port可选Integer

指定 NICE DCV 的端口。默认值为 8443

更新策略:如果更改此设置,则不允许更新。

AllowedIps可选、推荐String

指定连接到 NICE DCV 的 CIDR 格式的 IP 范围。此设置仅在 Amazon ParallelCluster 创建安全组时使用。默认值是 0.0.0.0/0,允许从任何 Internet 地址访问。

更新策略:可以在更新期间更改此设置。

CustomActions

(可选)指定要在头节点上运行的自定义脚本。

CustomActions: OnNodeStart: Script: string Args: - string OnNodeConfigured: Script: string Args: - string OnNodeUpdated: Script: string Args: - string

CustomActions 属性

OnNodeStart可选String

指定在启动任何节点部署引导操作之前在头节点上运行的脚本。有关更多信息,请参阅自定义引导导导导导导操作

Script必需String

指定要使用的文件。文件路径可以以https://或开头s3://

Args可选[String]

要传递给脚本的参数列表。

更新策略:如果更改此设置,则不允许更新。

OnNodeConfigured可选String

指定节点引导操作完成后在头节点上运行的脚本。有关更多信息,请参阅自定义引导导导导导导操作

Script必需String

指定要使用的文件。文件路径可以以https://或开头s3://

Args可选[String]

要传递给脚本的参数列表。

更新策略:如果更改此设置,则不允许更新。

OnNodeUpdated可选String

指定节点更新操作完成后在头节点上运行的脚本。有关更多信息,请参阅自定义引导导导导导导操作

Script必需String

指定要使用的文件。文件路径可以以https://或开头s3://

Args可选[String]

要传递给脚本的参数列表。

更新策略:可以在更新期间更改此设置。

注意

OnNodeUpdated是从Amazon ParallelCluster 3.4.0 开始添加的。

Iam

(可选)指定要在头节点上使用的实例角色或实例配置文件,以覆盖集群的默认实例角色或实例配置文件。

Iam: InstanceRole: string InstanceProfile: string S3Access: - BucketName: string EnableWriteAccess: boolean KeyName: string AdditionalIamPolicies: - Policy: string

更新策略:可以在更新期间更改此设置。

Iam 属性

InstanceProfile可选String

指定一个实例配置文件以覆盖默认的头节点实例配置文件。您不能同时指定 InstanceProfileInstanceRole。格式为 arn:Partition:iam::Account:instance-profile/InstanceProfileName

如果指定了此AdditionalIamPolicies设置,则无法指定S3Access和设置。

我们建议您指定S3AccessAdditionalIamPolicies设置中的一个或两个,因为添加的功能Amazon ParallelCluster通常需要新的权限。

更新策略:如果更改此设置,则不允许更新。

InstanceRole可选String

指定一个实例角色以覆盖默认的头节点实例角色。您不能同时指定 InstanceProfileInstanceRole。格式为 arn:Partition:iam::Account:role/RoleName

如果指定了此AdditionalIamPolicies设置,则无法指定S3Access和设置。

我们建议您指定S3AccessAdditionalIamPolicies设置中的一个或两个,因为添加的功能Amazon ParallelCluster通常需要新的权限。

更新策略:可以在更新期间更改此设置。

S3Access

S3Access可选

指定存储桶。这用于生成策略以授予对存储桶的指定访问权限。

如果指定了此InstanceRole设置,则无法指定InstanceProfile和设置。

我们建议您指定S3AccessAdditionalIamPolicies设置中的一个或两个,因为添加的功能Amazon ParallelCluster通常需要新的权限。

S3Access: - BucketName: string EnableWriteAccess: boolean KeyName: string

更新策略:可以在更新期间更改此设置。

BucketName必需String

存储桶的名称。

更新策略:可以在更新期间更改此设置。

KeyName可选String

水桶的钥匙。默认值为“*”。

更新策略:可以在更新期间更改此设置。

EnableWriteAccess可选Boolean

指示是否为桶启用写入权限。默认值为 false

更新策略:可以在更新期间更改此设置。

AdditionalIamPolicies

AdditionalIamPolicies可选

指定适用于 Amazon EC2 的 IAM 策略的 Amazon 资源名称(ARN)的列表。除所需的权限外,此列表还附加到用于头节点的根角色上Amazon ParallelCluster。

IAM 策略名称和其 ARN 是不同的。不能使用名称。

如果指定了此InstanceRole设置,则无法指定InstanceProfile和设置。

我们建议您使用,AdditionalIamPolicies因为AdditionalIamPolicies已添加到Amazon ParallelCluster所需的权限中,并且InstanceRole必须包含所需的所有权限。随着功能的不断添加,所需权限通常会随版本发生变化。

没有默认值。

AdditionalIamPolicies: - Policy: string

更新策略:可以在更新期间更改此设置。

Policy可选[String]

IAM 策略列表。

更新策略:可以在更新期间更改此设置。

Imds

(可选)指定实例元数据服务 (IMDS) 的属性。有关更多信息,请参阅适用于 Lux 实例的 Amazon EC2 用户指南中的实例元数据服务版本 2 的工作方式

Imds: Secured: boolean

更新策略:如果更改此设置,则不允许更新。

Imds 属性

Secured可选Boolean

如果true,则将对头节点的 IMDS(和实例配置文件凭据)的访问权限限制为超级用户子集。

如果false,则头节点中的每个用户都有权访问头节点的 IMDS。

允许以下用户访问头节点的 IMDS:

  • 根用户

  • 集群管理用户(pc-cluster-admin默认情况下)

  • 操作系统特定的默认用户(ec2-user在亚马逊 Linux 2ubuntu 上、Ubuntu 18.04centos 上、CentOS 7 上)

默认为 true

default用户有责任确保集群拥有与Amazon资源交互所需的权限。如果您禁用default用户 IMDS 访问权限,则Amazon ParallelCluster无法管理计算节点并停止工作。不要禁用default用户 IMDS 访问权限。

当用户被授予对头节点的 IMDS 的访问权限时,他们可以使用头节点的实例配置文件中包含的权限。例如,他们可以使用这些权限启动 EC2 实例或读取集群配置为用于身份验证的 AD 域的密码。

要限制 IMDS 的访问权限,请Amazon ParallelCluster管理一连串的iptables

具有sudo访问权限的集群用户可以通过运行以下命令有选择地启用或禁用其他个人用户(包括default用户)对头节点 IMDS 的访问权限:

$ sudo /opt/parallelcluster/scripts/imds/imds-access.sh --allow <USERNAME>

您可以使用此命令的--deny选项禁用用户 IMDS 访问权限。

如果您在不知不觉中禁用了default用户 IMDS 访问权限,则可以使用--allow选项恢复权限。

注意

任何自定义iptablesip6tables规则都可能干扰用于限制头节点上 IMDS 访问的机制。

更新策略:如果更改此设置,则不允许更新。

Image

(可选)为头节点定义自定义图像。

Image: CustomAmi: string

更新策略:如果更改此设置,则不允许更新。

Image 属性

CustomAmi可选String

指定用于头节点的自定义 AMI 的 ID,而不是默认 AMI。有关更多信息,请参阅Amazon ParallelClusterAMI 自定义

如果自定义 AMI 需要额外权限才能启动,则必须将这些权限添加到用户和头节点策略中。

例如,如果自定义 AMI 有与之关联的加密快照,则在用户和头节点策略中都需要以下附加策略:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "kms:DescribeKey", "kms:ReEncrypt*", "kms:CreateGrant", "kms:Decrypt" ], "Resource": [ "arn:aws:kms:<AWS_REGION>:<AWS_ACCOUNT_ID>:key/<AWS_KMS_KEY_ID>" ] } ] }

要对自定义 AMI 验证警告进行故障排除,请参阅自定义 AMI 问题疑难解答

更新策略:如果更改此设置,则不允许更新。