[cluster] 部分 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

[cluster] 部分

定义可用于创建集群的集群模板。配置文件可以包含多个[cluster]部分。

同一群集模板可用于创建多个集群。

格式为 [cluster cluster-template-name]。这些区域有:[cluster]部分由cluster_template[global]部分默认情况下使用,但可以在pcluster命令行。

cluster-template-name必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

[cluster default]

additional_cfn_template

(可选)定义一个额外的Amazon CloudFormation与集群一起启动的模板。此附加模板用于创建属于集群外部但属于集群生命周期一部分的资源。

此值必须是到公有模板的 HTTP URL,带有提供的所有参数。

没有默认值。

additional_cfn_template = https://<bucket-name>.s3.amazonaws.com/my-cfn-template.yaml

更新策略:如果更改此设置,则不允许进行更新。

additional_iam_policies

(可选)指定适用于 Amazon EC2 的 IAM 策略的 Amazon 资源名称 (ARN) 的列表。除了所需的权限之外,此列表还附加到集群中使用的 root 角色。Amazon ParallelCluster用逗号隔开。IAM 策略名称及其 ARN 不相同。名字不能用作参数additional_iam_policies.additional_iam_policies应该用来代替ec2_iam_role. 这是因为已经将 additional_iam_policies 添加到 Amazon ParallelCluster 所需的权限中,而 ec2_iam_role 必须包含所有必需的权限。随着功能的不断添加,所需权限通常会随版本发生变化。

没有默认值。

additional_iam_policies = arn:aws:iam::aws:policy/AdministratorAccess
注意

对该项的支持additional_iam_policies增加了Amazon ParallelCluster版本 2.5.0。

更新策略:可以在更新期间更改此设置。

base_os

(必需)指定在集群中使用的操作系统类型。

可用的选项为:

  • alinux2

  • centos7

  • ubuntu1804

  • ubuntu2004

注意

适用于Amazon仅限基于 Graviton 的实例alinux2ubuntu1804,或者ubuntu2004支持。

注意

对该项的支持centos8已在中删除Amazon ParallelCluster版本 2.11.4。对该项的支持ubuntu2004已添加并支持alinuxubuntu1604已删除Amazon ParallelCluster版本 2.11.0。对该项的支持centos8已添加并支持centos6已删除Amazon ParallelCluster版本 2.10.0。对该项的支持alinux2增加了Amazon ParallelCluster版本 2.6.0。对该项的支持ubuntu1804已添加,并支持ubuntu1404已在中删除Amazon ParallelCluster版本 2.5.0。

除了下表中提到的不支持的特定区域之外centos7. 所有其他Amazon商业区域支持以下所有操作系统。

分区(区域) alinux2 centos7 ubuntu1804ubuntu2004
商业(未具体提及的所有区域) True True True
Amazon GovCloud(美国东部)us-gov-east-1 True False True
Amazon GovCloud(美国西部)us-gov-west-1 True False True
中国(北京) (cn-north-1) True False True
中国(宁夏) (cn-northwest-1) True False True
注意

这些区域有:base_os参数还确定用于登录到集群的用户名。

  • centos7: centos

  • ubuntu1804ubuntu2004ubuntu

  • alinux2: ec2-user

注意

优化前Amazon ParallelCluster版本 2.7.0base_os参数是可选的,默认值为alinux. 从启动Amazon ParallelCluster版本 2.7.0base_os参数是必需的。

注意

如果 scheduler 参数为 awsbatch,则仅支持 alinux2

base_os = alinux2

更新策略:如果更改此设置,则不允许进行更新。

cluster_resource_bucket

(可选)指定用于托管创建集群时生成的资源的 Amazon S3 存储桶的名称。该存储桶必须已启用版本控制。有关更多信息,请参阅 。使用版本控制中的Amazon Simple Storage Service 用户指南. 此存储桶可用于多个集群。存储桶必须与集群位于同一区域中。

如果未指定此参数,则在创建集群时创建一个新的存储桶。新存储桶的名称为parallelcluster-random_string. 以这个名字,random _string是字母数字字符串的随机字符串。所有集群资源都以带有表单的路径存储在此存储桶中bucket_name/resource_directory.resource_directory有表单stack_name-random_string,其中,stack_name是其中之一的名称Amazon CloudFormation使用的堆栈Amazon ParallelCluster. 的价值bucket_name可以在ResourcesS3Bucket的输出中的值parallelcluster-clustername堆栈。的价值资源ce_目录可以在的值中找到ArtifactS3RootDirectory来自同一堆栈的输出。

默认值为 parallelcluster-random_string

cluster_resource_bucket = my-s3-bucket
注意

对该项的支持cluster_resource_bucket增加了Amazon ParallelCluster版本 2.10.0。

更新策略:如果更改此设置,则不允许进行更新。无法强制更新此设置。

cluster_type

(可选)定义要启动的集群的类型。如果queue_settings设置已定义,那么必须将此设置替换为compute_type settings in the [queue]部分.

有效的选项为:ondemandspot

默认值为 ondemand

有关 Spot 实例的更多信息,请参阅 使用竞价型实例

注意

使用 Spot 实例需要AWSServiceRoleForEC2Spot您的账户中存在与服务相关的角色。使用在账户中创建此角色Amazon CLI中,运行以下命令:

aws iam create-service-linked-role --aws-service-name spot.amazonaws.com

有关更多信息,请参阅 。竞价型实例请求的服务相关角色中的适用于 Linux 实例的 Amazon EC2 用户指南.

cluster_type = ondemand

更新策略:必须停止计算队列才能更改此设置才能进行更新。

compute_instance_type

(可选)定义用于集群计算节点的 Amazon EC2 实例类型。实例类型的体系结构必须与用于master_instance_type设置设置。如果queue_settings设置已定义,那么必须将此设置替换为instance_type settings in the [compute_resource]部分.

如果您使用awsbatch调度程序,请参阅中的计算环境创建Amazon Batch用于获取受支持实例类型的列表。

默认值为 t2.micro;当计划程序为 awsbatch 时,为 optimal

compute_instance_type = t2.micro
注意

对该项的支持Amazon基于 Graviton 的实例(包括A1C6g实例)已添加到Amazon ParallelCluster版本 2.8.0。

更新策略:必须停止计算队列才能更改此设置才能进行更新。

compute_root_volume_size

(可选)指定ComputeFleet根卷大小(以 GiB 为单位)。AMI 必须支持 growroot

默认值为 35

注意

适用于Amazon ParallelCluster在 2.5.0 和 2.10.4 之间的版本,默认值为 25。优化前Amazon ParallelCluster版本 2.5.0,默认值为 20。

compute_root_volume_size = 35

更新策略:必须停止计算队列才能更改此设置才能进行更新。

custom_ami

(可选)指定要用于头部和计算节点的自定义 AMI 的 ID,而非默认值。已发布的 AMI.

没有默认值。

custom_ami = ami-00d4efc81188687a0

如果自定义 AMI 需要其他权限才能启动,则必须将这些权限添加到用户和头节点策略中。

例如,如果自定义 AMI 具有与其关联的加密快照,则用户和头节点策略中都需要以下附加策略:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "kms:DescribeKey", "kms:ReEncrypt*", "kms:CreateGrant", "kms:Decrypt" ], "Resource": [ "arn:aws:kms:<AWS_REGION>:<AWS_ACCOUNT_ID>:key/<AWS_KMS_KEY_ID>" ] } ] }

更新策略:如果更改此设置,则不允许进行更新。

cw_log_settings

(可选)标识[cw_log]部分CloudWatch记录配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[cw_log]部分亚马逊CloudWatch仪表板, 和与亚马逊集成CloudWatch日志.

例如,以下设置指定将以开始的部分。[cw_log custom-cw]用于CloudWatch记录配置。

cw_log_settings = custom-cw
注意

对该项的支持cw_log_settings增加了Amazon ParallelCluster版本 2.6.0。

更新策略:如果更改此设置,则不允许进行更新。

dashboard_settings

(可选)标识[dashboard]部分CloudWatch控制面板配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[dashboard]部分.

例如,以下设置指定将以开始的部分。[dashboard custom-dashboard用于CloudWatch控制面板配置。

dashboard_settings = custom-dashboard
注意

对该项的支持dashboard_settings增加了Amazon ParallelCluster版本 2.10.0。

更新策略:可以在更新期间更改此设置。

dcv_settings

(可选)标识[dcv]部分带有 NICE DCV 配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[dcv]部分.

例如,以下设置指定将以开始的部分。[dcv custom-dcv]用于 NICE DCV 配置。

dcv_settings = custom-dcv
注意

在 上Amazon基于 Graviton 的实例,NICE DCV 仅在alinux2.

注意

对该项的支持dcv_settings增加了Amazon ParallelCluster版本 2.5.0。

更新策略:如果更改此设置,则不允许进行更新。

desired_vcpus

(可选)指定计算环境中所需的 vCPU 数。仅在计划程序为 awsbatch 时使用。

默认值为 4

desired_vcpus = 4

更新策略:更新期间不会分析此设置。

disable_cluster_dns

(可选)指定是否不应创建集群的 DNS 条目。默认情况下,Amazon ParallelCluster创建 Route 53 托管区域。如果disable_cluster_dns设置为true,未创建托管区域。

默认值为 false

disable_cluster_dns = true
警告

集群需要名称解析系统才能正常运行。如果disable_cluster_dns设置为true, 还必须提供额外的名称解析系统.

重要

disable_cluster_dns=true只有在queue_settings已指定设置。

注意

对该项的支持disable_cluster_dns增加了Amazon ParallelCluster版本 2.9.1。

更新策略:如果更改此设置,则不允许进行更新。

disable_hyperthreading

(可选)禁用在头和计算节点上的超线程。并非所有实例类型都可以禁用超线程。有关支持禁用超线程的实例类型的列表,请参阅。每种实例类型的 CPU 核心和每个 CPU 核心的线程中的适用于 Linux 实例的 Amazon EC2 用户指南. 如果queue_settings设置已定义,可以定义此设置,也可以定义disable_hyperthreading settings in the [queue]部分可以定义。

默认值为 false

disable_hyperthreading = true
注意

disable_hyperthreading只会在以下情况下影响头节点scheduler = awsbatch.

注意

对该项的支持disable_hyperthreading增加了Amazon ParallelCluster版本 2.5.0。

更新策略:如果更改此设置,则不允许进行更新。

ebs_settings

(可选)标识[ebs]部分中有挂载在头节点上的 Amazon EBS 卷。使用多个 Amazon EBS 卷时,请在列表中输入这些参数,每个卷用逗号分隔。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

支持最多五 (5) 个额外的 Amazon EBS 卷。

有关更多信息,请参阅 。[ebs]部分.

例如,以下设置指定将以开始的部分。[ebs custom1][ebs custom2]用于 Amazon EBS 卷。

ebs_settings = custom1, custom2

更新策略:如果更改此设置,则不允许进行更新。

ec2_iam_role

(可选)定义附加到集群中所有实例的 Amazon EC2 的现有 IAM 角色的名称。IAM 角色名称及其 Amazon 资源名称 (ARN) 是不同的。ARN 不能用作的参数ec2_iam_role. 如果指定了此选项,则忽略 additional_iam_policies 设置。建议您使用additional_iam_policies,而不是ec2_iam_role,因为添加了功能Amazon ParallelCluster通常需要新的权限。

没有默认值。

ec2_iam_role = ParallelClusterInstanceRole

更新策略:如果更改此设置,则不允许进行更新。

efs_settings

(可选)指定与 Amazon EFS 文件系统相关的设置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[efs]部分.

例如,以下设置指定将以开始的部分。[efs customfs]用于 Amazon EFS 文件系统配置。

efs_settings = customfs

更新策略:如果更改此设置,则不允许进行更新。

enable_efa

(可选)如果存在,则指定为计算节点启用 Elastic Fabric Adapter (EFA)。EFA 由特定实例类型支持(c5n.18xlargec5n.metalg4dn.metali3en.24xlargei3en.metalm5dn.24xlargem5n.24xlargem5zn.12xlargem5zn.metalr5dn.24xlarger5n.24xlargep3dn.24xlarge, 和p4d.24xlarge对于 x86-64 实例,c6gn.16xlarge对于特定操作系统上的基于 ARM 的 Graviton2 实例)(base_osalinux2centos7ubuntu1804,或者ubuntu2004对于 x86-64 实例,alinux2ubuntu1804,或者ubuntu2004对于基于 ARM 的 Graviton2 实例)。有关更多信息,请参阅 Elastic Fabric Adapter。如果queue_settings设置已定义,可以定义此设置,也可以定义enable_efa settings in the [queue]部分可以定义。应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placementplacement_group

enable_efa = compute
注意

在基于 ARM 的 Graviton2 实例上添加了对全民教育的 SupportAmazon ParallelCluster版本 2.10.1。

更新策略:如果更改此设置,则不允许进行更新。

enable_efa_gdr

(可选) 从启动Amazon ParallelCluster版本 2.11.3,此设置无效。如果实例类型和操作系统都支持 Elastic Fabric Adapter (EFA),则始终启用对 gpudDirect RDMA(远程直接内存访问)的支持。

注意

Amazon ParallelCluster版本 2.10.0 到 2.11.2:如果compute,指定为计算节点启用对 GPudirect RDMA(远程直接内存访问)的 Elastic Fabric Adapter (EFA)) 支持。将此设置设置为compute要求enable_efa设置compute. EFA 对 GpuDirect RDMA 的支持由特定实例类型(p4d.24xlarge) 在特定操作系统上 (base_osalinux2centos7ubuntu1804,或者ubuntu2004)。如果queue_settings设置已定义,可以定义此设置,也可以定义enable_efa_gdr settings in the [queue]部分可以定义。应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placementplacement_group

enable_efa_gdr = compute
注意

对该项的支持enable_efa_gdr增加了Amazon ParallelCluster版本 2.10.0。

更新策略:必须停止计算队列才能更改此设置才能进行更新。

enable_intel_hpc_platform

(可选)如果存在,则表示最终用户许可协议英特尔并行工作室被接受。这将导致 Intel Parallel Studio 安装在头节点上并与计算节点共享。这使主节点进行引导的时间增加了几分钟。仅 CentOS 7 (base_os = centos7) 上支持 enable_intel_hpc_platform 设置。

默认值为 false

enable_intel_hpc_platform = true
注意

这些区域有:enable_intel_hpc_platform参数不兼容Amazon基于 Graviton 的实例。

注意

对该项的支持enable_intel_hpc_platform增加了Amazon ParallelCluster版本 2.5.0。

更新策略:如果更改此设置,则不允许进行更新。

encrypted_ephemeral

(可选)使用 LUKS (Linux Unified Key Setup),通过无法恢复的内存中密钥对临时实例存储卷进行加密。

有关更多信息,请参阅 https://gitlab.com/cryptsetup/cryptsetup/blob/master/README.md

默认值为 false

encrypted_ephemeral = true

更新策略:如果更改此设置,则不允许进行更新。

ephemeral_dir

(可选)定义将在其中挂载实例存储卷的路径(如果使用它们)。

默认值为 /scratch

ephemeral_dir = /scratch

更新策略:如果更改此设置,则不允许进行更新。

extra_json

(可选)定义合并到Chef dna.json. 有关更多信息,请参阅 构建自定义 Amazon ParallelCluster AMI

默认值为 {}

extra_json = {}
注意

从启动Amazon ParallelCluster为缩短启动时间,在启动节点时将默认跳过大多数安装配方以缩短启动时间。要以牺牲启动时间为代价运行所有安装配方以获得更好的向后兼容性,请添加"skip_install_recipes" : "no"cluster键入extra_json设置设置。例如:

extra_json = { "cluster" : { "skip_install_recipes" : "no" } }

更新策略:必须停止计算队列才能更改此设置才能进行更新。

fsx_settings

(可选)指定用于定义 Lustre 配置的 FSx 的部分。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[fsx]部分.

例如,以下设置指定将以开始的部分。[fsx fs]用于 Lustre 配置的 FSx。

fsx_settings = fs

更新策略:如果更改此设置,则不允许进行更新。

iam_lambda_role

(可选)定义现有的名称Amazon Lambda执行角色。此角色附加到集群中的所有 Lambda 函数。有关更多信息,请参阅 。Amazon Lambda执行角色中的Amazon Lambda开发人员指南.

注意

从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。

IAM 角色名称及其 Amazon 资源名称 (ARN) 是不同的。ARN 不能用作的参数iam_lambda_role. 如果两者都ec2_iam_roleiam_lambda_role已定义,并且schedulersgeslurm,或者torque,那么就不会创建任何角色。如果schedulerawsbatch,那么将在期间创建角色pcluster start. 有关示例策略,请参阅ParallelClusterLambdaPolicy使用SGE、Slurm,或者TorqueParallelClusterLambdaPolicy,使用 awsbatch.

没有默认值。

iam_lambda_role = ParallelClusterLambdaRole
注意

对该项的支持iam_lambda_role增加了Amazon ParallelCluster版本 2.10.1。

更新策略:可以在更新期间更改此设置。

initial_queue_size

(可选)设置要作为集群中的计算节点启动的 Amazon EC2 实例的初始数量。如果queue_settings设置已定义,那么必须删除此设置并替换为initial_count settings in the [compute_resource]部分.

注意

从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。

此设置仅适用于传统计划程序(SGE、Slurm 和 Torque)。如果maintain_initial_size设置设置true,然后initial_queue_size设置必须至少为一 (1)。

如果计划程序是 awsbatch,请改用 min_vcpus

默认值为 2

initial_queue_size = 2

更新策略:可以在更新期间更改此设置。

key_name

(可选)命名用于启用对实例进行 SSH 访问的现有 Amazon EC2 key pair 的名称。

key_name = mykey
注意

优化前Amazon ParallelCluster版本 2.11.0key_name是必需的设置。

更新策略:如果更改此设置,则不允许进行更新。

maintain_initial_size

注意

从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。

(可选)为传统计划程序保持 Auto Scaling 组的初始大小 (SGE、Slurm, 和Torque)。

如果计划程序是 awsbatch,请改用 desired_vcpus

此设置是一个布尔标记。如果设置为true,Auto Scaling 组的成员数量绝不会少于的值。initial_queue_size,以及的价值initial_queue_size必须为 1 (1) 或更大。集群仍可以扩展到 max_queue_size 的值。如果cluster_type = spot然后 Auto Scaling 组的实例可能会中断,并且大小可能降至以下。initial_queue_size.

如果设置为false,Auto Scaling 组的成员数可以缩减为零 (0),以防止在不需要资源时闲置。

如果queue_settings设置已定义,则必须删除此设置并替换为initial_countmin_count settings in the [compute_resource]部分.

默认值为 false

maintain_initial_size = false

更新策略:可以在更新期间更改此设置。

master_instance_type

(可选)定义用于头节点的 Amazon EC2 实例类型。实例类型的体系结构必须与用于compute_instance_type设置设置。

在具有免费套餐的区域中,默认为免费套餐实例类型(t2.micro要么t3.micro)。在没有免费套餐的地区中,默认为t3.micro. 有关的更多信息Amazon免费套餐,请参阅Amazon免费套餐问题.

master_instance_type = t2.micro
注意

优化前Amazon ParallelCluster版本 2.10.1,默认为t2.micro在所有区域。InAmazon ParallelCluster版本 2.10.0,p4d.24xlarge头节点不支持。对该项的支持Amazon基于 Graviton 的实例(例如A1C6g增加了Amazon ParallelCluster版本 2.8.0。

更新策略:如果更改此设置,则不允许进行更新。

master_root_volume_size

(可选)指定主节点根卷大小(以 GiB 为单位)。AMI 必须支持 growroot

默认值为 35

注意

适用于Amazon ParallelCluster在 2.5.0 和 2.10.4 之间的版本,默认值为 25。优化前Amazon ParallelCluster版本 2.5.0,默认值为 20。

master_root_volume_size = 35

更新策略:如果更改此设置,则不允许进行更新。

max_queue_size

(可选)设置集群中可以启动的 Amazon EC2 实例的最大数量。如果queue_settings设置已定义,那么必须删除此设置并替换为max_count settings in the [compute_resource]部分.

注意

从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。

此设置仅适用于传统计划程序(SGE、Slurm 和 Torque)。

如果计划程序是 awsbatch,请改用 max_vcpus

默认值为 10

max_queue_size = 10

更新策略:可以在更新期间更改此设置,但如果值降低,则应停止计算队列。否则,可能会终止现有节点。

max_vcpus

(可选)指定计算环境中的最大 vCPU 数。仅在计划程序为 awsbatch 时使用。

默认值为 20

max_vcpus = 20

更新策略:更新期间不能减少此设置。

min_vcpus

(可选)保留 Auto Scaling 组的初始大小,以使用awsbatch计划程序。

注意

从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。

如果计划程序是 SGE、Slurm 或 Torque,请改用 maintain_initial_size

计算环境中的成员数绝不会少于 min_vcpus 的值。

默认值为 0

min_vcpus = 0

更新策略:可以在更新期间更改此设置。

placement

(可选)定义集群置放群组逻辑,并使整个集群或仅计算实例能够使用集群置放群组。

如果queue_settings设置已定义,那么应该删除此设置并替换为placement_group每个的设置[queue]部分. 如果同一置放群组用于不同的实例类型,则更有可能由于容量不足错误而导致请求失败。有关更多信息,请参阅 。实例容量不足中的适用于 Linux 实例的 Amazon EC2 用户指南. 多个队列只能共享置放群组,如果事先创建并在placement_group为每个队列设置。如果每个[queue]部分定义placement_group设置,那么头节点不能在队列的置放群组中。

有效选项是 clustercompute

当计划程序为时,不使用此参数。awsbatch.

默认值为 compute

placement = compute

更新策略:如果更改此设置,则不允许进行更新。

placement_group

(可选)定义集群置放群组。如果queue_settings设置已定义,那么应该删除此设置并替换为placement_group settings in the [queue]部分.

有效选项包括以下值:

  • DYNAMIC

  • 现有的 Amazon EC2 集群置放群组名称

当设置为 DYNAMIC 时,将唯一置放群组作为集群堆栈的一部分进行创建和删除。

当计划程序为时,不使用此参数。awsbatch.

有关置放群组的更多信息,请参阅。置放群组中的适用于 Linux 实例的 Amazon EC2 用户指南. 如果同一置放群组用于不同的实例类型,则更有可能由于容量不足错误而导致请求失败。有关更多信息,请参阅 。实例容量不足中的适用于 Linux 实例的 Amazon EC2 用户指南.

没有默认值。

并非所有实例类型都支持集群置放群组。例如,默认实例类型为t3.micro不支持集群置放群组。有关支持集群置放群组的实例类型列表的信息,请参阅集群置放群组规则和限制中的适用于 Linux 实例的 Amazon EC2 用户指南. 有关使用置放群组时的提示,请参阅置放群组和实例启动问题

placement_group = DYNAMIC

更新策略:如果更改此设置,则不允许进行更新。

post_install

(可选)指定在节点引导操作完成之后运行的安装后脚本的 URL。有关更多信息,请参阅 自定义引导操作

使用时awsbatch作为计划程序,安装后脚本仅在头节点上运行。

参数格式可以是 http://hostname/path/to/script.shs3://bucketname/path/to/script.sh

没有默认值。

post_install = s3://<bucket-name>/my-post-install-script.sh

更新策略:必须停止计算队列才能更改此设置才能进行更新。

post_install_args

(可选)指定要传递到安装后脚本的用双引号引起的参数列表。

没有默认值。

post_install_args = "argument-1 argument-2"

更新策略:必须停止计算队列才能更改此设置才能进行更新。

pre_install

(可选)指定在任何节点部署引导操作启动之前运行的预安装脚本的 URL。有关更多信息,请参阅 自定义引导操作

使用时awsbatch作为计划程序,预安装脚本仅在头节点上运行。

参数格式可以是 http://hostname/path/to/script.shs3://bucketname/path/to/script.sh

没有默认值。

pre_install = s3://<bucket-name>/my-pre-install-script.sh

更新策略:必须停止计算队列才能更改此设置才能进行更新。

pre_install_args

(可选)指定要传递到预安装脚本的用双引号引起的参数列表。

没有默认值。

pre_install_args = "argument-3 argument-4"

更新策略:必须停止计算队列才能更改此设置才能进行更新。

proxy_server

(可选)定义 HTTP 或 HTTPS 代理服务器,通常为http://x.x.x.x:8080.

没有默认值。

proxy_server = http://10.11.12.13:8080

更新策略:如果更改此设置,则不允许进行更新。

queue_settings

(可选)指定集群使用队列而不是同质计算队列,以及[queue]部分被使用。第一个[queue]部分列出的是默认的调度程序队列。这些区域有:queue段名称必须以小写字母开头,包含不超过 30 个字符,并且只包含小写字母、数字和连字符 (-)。

重要

queue_settings仅在scheduler设置为slurm. 这些区域有:cluster_typecompute_instance_typeinitial_queue_sizemaintain_initial_sizemax_queue_sizeplacementplacement_group, 和spot_price不能指定设置。这些区域有:disable_hyperthreadingenable_efa可在中指定设置[cluster]部分或者[queue]部分,但不能同时使用。

最多五 (5)[queue]部分支持。

有关更多信息,请参阅 。[queue]部分.

例如,以下设置指定将以开始的部分。[queue q1][queue q2]被使用。

queue_settings = q1, q2
注意

对该项的支持queue_settings增加了Amazon ParallelCluster版本 2.9.0。

更新策略:必须停止计算队列才能更改此设置才能进行更新。

raid_settings

(可选)标识[raid]部分与 Amazon EBS 卷 RAID 配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[raid]部分.

例如,以下设置指定将以开始的部分。[raid rs]用于 Auto Scaling 配置。

raid_settings = rs

更新策略:如果更改此设置,则不允许进行更新。

s3_read_resource

(可选)指定向的 Amazon S3 资源Amazon ParallelCluster授予节点只读访问权限。

例如,arn:aws:s3:::my_corporate_bucket*提供对的只读访问权限my_公司ate_bucket存储桶以及存储桶中的对象。

请参阅使用 Amazon S3有关格式的详细信息。

没有默认值。

s3_read_resource = arn:aws:s3:::my_corporate_bucket*

更新策略:可以在更新期间更改此设置。

s3_read_write_resource

(可选)指定 Amazon S3 资源,Amazon ParallelCluster授予节点的读/写访问权限。

例如,arn:aws:s3:::my_corporate_bucket/Development/*提供对中的所有对象的读/写访问权限Development的文件夹my_公司ate_bucket存储桶。

请参阅使用 Amazon S3有关格式的详细信息。

没有默认值。

s3_read_write_resource = arn:aws:s3:::my_corporate_bucket/*

更新策略:可以在更新期间更改此设置。

scaling_settings

标识[scaling]部分带有 Auto Scaling 配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[scaling]部分.

例如,以下设置指定将以开始的部分。[scaling custom]用于 Auto Scaling 配置。

scaling_settings = custom

更新策略:如果更改此设置,则不允许进行更新。

scheduler

(必需)定义集群计划程序。

有效选项包括以下值:

awsbatch

Amazon Batch

sge
注意

从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。

Son of Grid Engine (SGE)

slurm

Slurm Workload Manager (Slurm)

torque
注意

从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。

Torque Resource Manager (Torque)

有关 awsbatch 计划程序的更多信息,请参阅联网设置

注意

优化前Amazon ParallelCluster版本 2.7.0scheduler参数是可选的,默认值为sge. 从启动Amazon ParallelCluster版本 2.7.0scheduler参数是必需的。

scheduler = slurm

更新策略:如果更改此设置,则不允许进行更新。

shared_dir

(可选)定义在其中挂载共享 Amazon EBS 卷的路径。

请勿将此选项与多个 Amazon EBS 卷一起使用。相反,请提供shared_dir每个值下[ebs]部分.

请参阅[ebs]部分有关使用多个 Amazon EBS 卷的详细信息。

默认值为 /shared

以下示例显示在上挂载的共享 Amazon EBS 卷。/myshared.

shared_dir = myshared

更新策略:如果更改此设置,则不允许进行更新。

spot_bid_percentage

(可选)设置用于计算的最高 Spot 价格的按需百分比。ComputeFleet,何时awsbatch是调度程序。

如果未指定,则选择当前 Spot 市场价格,最高为按需价格。

spot_bid_percentage = 85

更新策略:可以在更新期间更改此设置。

spot_price

注意

从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。

(可选)设置的最高竞价价格ComputeFleet在传统的调度程序上(SGE、Slurm, 和Torque)。仅当 cluster_type 设置设为 spot 时使用。如果您没有指定值,则按 Spot 价格进行收费,最高为按需价格。如果queue_settings设置已定义,那么必须删除此设置并替换为spot_price settings in the [compute_resource]部分.

如果计划程序为 awsbatch,请改用 spot_bid_percentage

有关查找满足您需求的 Spot 实例的帮助信息,请参阅Spot 实例顾问.

spot_price = 1.50
注意

InAmazon ParallelCluster如果版本 2.5.0cluster_type = spot但是spot_price未指定,则将以ComputeFleet失败。这已修复Amazon ParallelCluster版本 2.5.1。

更新策略:可以在更新期间更改此设置。

tags

(可选)定义要由使用的标签Amazon CloudFormation.

如果通过 --tags 指定了命令行标签,则它们将与配置标签合并。

命令行标签覆盖具有相同键的配置标签。

标签是 JSON 格式的。请勿在大括号外使用引号。

有关更多信息,请参阅 。Amazon CloudFormation资源标签中的Amazon CloudFormation用户指南.

tags = {"key" : "value", "key2" : "value2"}

更新策略:必须停止计算队列才能更改此设置才能进行更新。

注意

更新策略不支持更改tags设置Amazon ParallelCluster版本 2.8.0 到版本 2.9.1。

template_url

(可选)定义的路径Amazon CloudFormation用于创建集群的模板。

更新使用最初用于创建堆栈的模板。

默认值为 https://aws_region_name-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-version.cfn.json

警告

这是一个高级参数。任何更改此设置均由您自行承担风险。

template_url = https://us-east-1-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-2.11.5.cfn.json

更新策略:更新期间不会分析此设置。

vpc_settings

(必需)标识[vpc]部分,其中将在其中部署集群的 Amazon VPC 配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[vpc]部分.

例如,以下设置指定将以开始的部分。[vpc public]用于亚马逊 VPC 配置。

vpc_settings = public

更新策略:如果更改此设置,则不允许进行更新。