[cluster] 部分 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

[cluster] 部分

定义可用于创建集群的集群模板。配置文件可以包含多个[cluster]部分。

同一个群集模板可用于创建多个群集。

格式为 [cluster cluster-template-name]。这些区域有:[cluster]部分命名为cluster_template设置[global]部分默认使用,但可以在pcluster命令行。

集群模板名称必须以字母开始,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。

[cluster default]

additional_cfn_template

(可选)定义一个附加的Amazon CloudFormation模板随集群启动。此附加模板用于创建集群外部但属于集群生命周期一部分的资源。

值必须是到公有模板的 HTTP URL,带有提供的所有参数。

没有默认值。

additional_cfn_template = https://<bucket-name>.s3.amazonaws.com/my-cfn-template.yaml

更新策略:如果更改此设置,则不允许更新。

additional_iam_policies

(可选)为 Amazon EC2 指定 IAM 策略的亚马逊资源名称 (ARN) 的列表。除了所需的权限之外,此列表还附加到集群中使用的 root 角色。Amazon ParallelCluster用逗号分隔。IAM 策略名称及其 ARN 不相同。名称不能用作的参数additional_iam_policies。additional_iam_policies应该用来代替ec2_iam_role。这是因为已经将 additional_iam_policies 添加到 Amazon ParallelCluster 所需的权限中,而 ec2_iam_role 必须包含所有必需的权限。随着功能的不断添加,所需权限通常会随版本发生变化。

没有默认值。

additional_iam_policies = arn:aws:iam::aws:policy/AdministratorAccess
注意

对该项的支持additional_iam_policies增加了Amazon ParallelCluster版本 2.5.0。

更新策略:更新期间可更改此设置。

base_os

(必需)指定在集群中使用的操作系统类型。

可用的选项为:

  • alinux2

  • centos7

  • centos8

  • ubuntu1804

  • ubuntu2004

注意

适用于Amazon仅基于重力的实例alinux2centos8ubuntu1804,或者ubuntu2004支持。

注意

对该项的支持ubuntu2004已添加,并支持alinuxubuntu1604中删除了Amazon ParallelCluster版本 2.11.0 对该项的支持centos8已添加,并支持centos6已删除Amazon ParallelCluster版本 2.10.0 对该项的支持alinux2增加了Amazon ParallelCluster版本 2.6.0 对该项的支持ubuntu1804,并支持ubuntu1404中删除了Amazon ParallelCluster版本 2.5.0

除了下表中提到的特定区域以外,不支持centos7centos8。所有其他Amazon商业区域支持以下所有操作系统。

分区(区域) alinux2 centos7centos8 ubuntu1804ubuntu2004
商业(未特别提及的所有区域) True True True
AmazonGovCloud(美国东部)(us-gov-east-1 True False True
AmazonGovCloud(美国西部)(us-gov-west-1 True False True
中国(北京)(cn-north-1 True False True
中国 (宁夏) (cn-northwest-1 True False True
注意

这些区域有:base_os参数还确定用于登录集群的用户名。

  • centos7centos8centos

  • ubuntu1804ubuntu2004ubuntu

  • alinux2: ec2-user

注意

优化前Amazon ParallelCluster版本 2.7.0base_os参数是可选的,默认值为alinux。从开始Amazon ParallelCluster版本 2.7.0base_os参数是必需的。

注意

如果 scheduler 参数为 awsbatch,则仅支持 alinux2

base_os = alinux2

更新策略:如果更改此设置,则不允许更新。

cluster_resource_bucket

(可选)指定用于托管创建集群时生成的资源的 Amazon S3 存储桶的名称。存储桶必须已启用版本控制。有关更多信息,请参阅 。使用版本控制中的Amazon Simple Storage Service 开发人员指南。此存储桶可用于多个集群。存储桶必须与集群位于同一区域中。

如果未指定此参数,则在创建集群时创建新存储桶。新存储桶的名称为parallelcluster-random_string。以这个名称,随机字符串是字母数字字符的随机字符串。所有群集资源都存储在此存储桶中的路径中,形式为bucket_name/resource_directoryresource_directory具有表单stack_name-random_string,其中stack_name是其中一个Amazon CloudFormation使用的堆栈Amazon ParallelCluster。值存储桶名称可以在ResourcesS3Bucket的输出中的parallelcluster-clustername堆栈。值资源目录的值中找到。ArtifactS3RootDirectory输出来自同一堆栈。

默认值为 parallelcluster-random_string

cluster_resource_bucket = my-s3-bucket
注意

对该项的支持cluster_resource_bucket增加了Amazon ParallelCluster版本 2.10.0

更新策略:如果更改此设置,则不允许更新。无法强制更新此设置。

cluster_type

(可选)定义要启动的集群的类型。如果queue_settings设置,则必须将此设置替换为compute_type设置[queue]部分

有效的选项为:ondemandspot

默认值为 ondemand

有关 Spot 实例的更多信息,请参阅 使用 Spot 实例

注意

使用 Spot 实例需要AWSServiceRoleRole2Spot服务相关角色存在于账户中。要在帐户中使用Amazon CLI,运行以下命令:

aws iam create-service-linked-role --aws-service-name spot.amazonaws.com

有关更多信息,请参阅 。适用于 Spot Instance 请求的服务相关角色中的适用于 Linux 实例的 Amazon EC2 用户指南

cluster_type = ondemand

更新策略:必须停止计算队列,才能更改此设置以进行更新。

compute_instance_type

(可选)定义用于集群计算节点的 Amazon EC2 实例类型。实例类型的体系结构必须与master_instance_type设置。如果queue_settings设置,则必须将此设置替换为instance_type设置[compute_resource]部分

如果您使用的是awsbatch调度程序中的计算环境创建,请参阅Amazon Batch用户界面,以获取支持的实例类型列表。

默认值为 t2.micro;当计划程序为 awsbatch 时,为 optimal

compute_instance_type = t2.micro
注意

对该项的支持Amazon基于重力的实例(包括A1C6g实例)添加到Amazon ParallelCluster版本 2.8.0

更新策略:必须停止计算队列,才能更改此设置以进行更新。

compute_root_volume_size

(可选)指定 ComputeFleet 根卷大小(以 GiB 为单位)。AMI 必须支持 growroot

默认值为 35

注意

适用于Amazon ParallelCluster版本,则默认值为 25。优化前Amazon ParallelCluster版本 2.5.0,默认值为 20。

compute_root_volume_size = 35

更新策略:必须停止计算队列,才能更改此设置以进行更新。

custom_ami

(可选)指定要用于头部和计算节点的自定义 AMI 的 ID,而不是默认已发布的 AMI

没有默认值。

custom_ami = ami-00d4efc81188687a0

更新策略:如果更改此设置,则不允许更新。

cw_log_settings

(可选)标识[cw_log]部分,以及 CloudWatch Logs 配置。节名称必须以字母开始,包含不超过 30 个字符,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[cw_log]部分Amazon CloudWatch 控制面板, 和与 Amazon CloudWatch Logs 集成

例如,以下设置指定将以[cw_log custom-cw]用于 CloudWatch Logs 配置。

cw_log_settings = custom-cw
注意

对该项的支持cw_log_settings增加了Amazon ParallelCluster版本 2.6.0

更新策略:如果更改此设置,则不允许更新。

dashboard_settings

(可选)标识[dashboard]部分中添加云监视仪表板配置。节名称必须以字母开始,包含不超过 30 个字符,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[dashboard]部分

例如,以下设置指定将以[dashboard custom-dashboard用于云监视仪表板配置。

dashboard_settings = custom-dashboard
注意

对该项的支持dashboard_settings增加了Amazon ParallelCluster版本 2.10.0

更新策略:更新期间可更改此设置。

dcv_settings

(可选)标识[dcv]部分与 NICE DCV 配置一起使用。节名称必须以字母开始,包含不超过 30 个字符,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[dcv]部分

例如,以下设置指定将以[dcv custom-dcv]用于 NICE DCV 配置。

dcv_settings = custom-dcv
注意

在 上Amazon基于引力的实例,NICE DCV 仅在alinux2

注意

对该项的支持dcv_settings增加了Amazon ParallelCluster版本 2.5.0

更新策略:如果更改此设置,则不允许更新。

desired_vcpus

(可选)指定计算环境中所需的 vCPU 数。仅在计划程序为 awsbatch 时使用。

默认值为 4

desired_vcpus = 4

更新策略:在更新过程中不会分析此设置。

disable_cluster_dns

(可选)指定是否不应创建集群的 DNS 条目。默认情况下,Amazon ParallelCluster创建 Route 53 托管区域。如果disable_cluster_dns设置为true,则不会创建托管区域。

默认值为 false

disable_cluster_dns = true
警告

群集需要一个名称解析系统才能正常运行。如果disable_cluster_dns设置为true,则还必须提供额外的名称解析系统。

重要

disable_cluster_dns=true只有在queue_settings设置。

注意

对该项的支持disable_cluster_dns增加了Amazon ParallelCluster版本 2.9.1

更新策略:如果更改此设置,则不允许更新。

disable_hyperthreading

(可选)禁用头部节点和计算节点上的超线程。并非所有实例类型都可以禁用超线程。有关支持禁用超线程的实例类型的列表,请参阅每个实例类型的 CPU 核心和线程中的适用于 Linux 实例的 Amazon EC2 用户指南。如果queue_settings设置,则可以定义此设置,或者disable_hyperthreading设置[queue]部分可以定义。

默认值为 false

disable_hyperthreading = true
注意

disable_hyperthreading仅影响头节点时scheduler = awsbatch

注意

对该项的支持disable_hyperthreading增加了Amazon ParallelCluster版本 2.5.0

更新策略:如果更改此设置,则不允许更新。

ebs_settings

(可选)标识[ebs]部分中挂载到头节点上的 Amazon EBS 卷。使用多个 Amazon EBS 卷时,请在列表中输入这些参数,每个参数用逗号分隔。节名称必须以字母开始,包含不超过 30 个字符,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。

支持最多五 (5) 个额外的 Amazon EBS 卷。

有关更多信息,请参阅 。[ebs]部分

例如,以下设置指定将以开始的部分[ebs custom1][ebs custom2]用于亚马逊 EBS 卷。

ebs_settings = custom1, custom2

更新策略:如果更改此设置,则不允许更新。

ec2_iam_role

(可选)定义将附加到集群中所有实例的 Amazon EC2 的现有 IAM 角色的名称。IAM 角色名称及其 Amazon 资源名称 (ARN) 是不同的。ARN 不能用作的参数ec2_iam_role。如果指定了此选项,则忽略 additional_iam_policies 设置。建议使用additional_iam_policies,而不是ec2_iam_role,因为要素添加到Amazon ParallelCluster通常需要新的权限。

没有默认值。

ec2_iam_role = ParallelClusterInstanceRole

更新策略:更新期间可更改此设置。

efs_settings

(可选)指定与 Amazon EFS 文件系统相关的设置。节名称必须以字母开始,包含不超过 30 个字符,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[efs]部分

例如,以下设置指定将以[efs customfs]用于亚马逊 EFS 文件系统配置。

efs_settings = customfs

更新策略:如果更改此设置,则不允许更新。

enable_efa

(可选)如果存在,则指定为计算节点启用 Elastic Fabric Adapter (EFA)。EFA 由特定实例类型(c5n.18xlargec5n.metalg4dn.metali3en.24xlargei3en.metalm5dn.24xlargem5n.24xlargem5zn.12xlargem5zn.metalr5dn.24xlarger5n.24xlargep3dn.24xlarge, 和p4d.24xlarge适用于 x86-64 实例,c6gn.16xlarge对于基于 ARM 的引力 2 实例)(base_osalinux2centos7centos8ubuntu1804,或者ubuntu2004适用于 x86-64 实例,alinux2ubuntu1804,或者ubuntu2004对于基于 ARM 的引力 2 实例)。有关更多信息,请参阅 Elastic Fabric Adapter。如果queue_settings设置,则可以定义此设置,或者enable_efa设置[queue]部分可以定义。

enable_efa = compute
注意

在基于 ARM 的引力 2 实例上添加了对 EFA 的 SupportAmazon ParallelCluster版本 2.10.1

更新策略:如果更改此设置,则不允许更新。

enable_efa_gdr

(可选)如果compute,指定为计算节点启用对 GPUDirect RDMA(远程直接内存访问)的 Elastic Fabric Adapter (EFA) FA) 的支持。将此设置设置为compute要求enable_efa设置设置为compute。GpuDirect RDMA 的 EFA 支持由特定实例类型(p4d.24xlarge)在特定操作系统上(base_osalinux2centos7centos8ubuntu1804,或者ubuntu2004)。如果queue_settings设置,则可以定义此设置,或者enable_efa_gdr设置[queue]部分可以定义。

enable_efa_gdr = compute

更新策略:必须停止计算队列,才能更改此设置以进行更新。

enable_intel_hpc_platform

(可选)如果存在,则表示最终用户许可协议接受英特尔并行工作室。这将导致 Intel Parallel Studio 安装在头节点上并与计算节点共享。这使头节点进行引导的时间增加了几分钟。这些区域有:enable_intel_hpc_platform设置仅在CentOS7 (base_os = centos7) 和CentOS8 (base_os = centos8)。

默认值为 false

enable_intel_hpc_platform = true
注意

这些区域有:enable_intel_hpc_platform参数不兼容Amazon基于重力的实例。

注意

对该项的支持enable_intel_hpc_platform增加了Amazon ParallelCluster版本 2.5.0

更新策略:如果更改此设置,则不允许更新。

encrypted_ephemeral

(可选)使用 LUKS (Linux Unified Key Setup),通过无法恢复的内存中密钥对临时实例存储卷进行加密。

有关更多信息,请参阅 https://gitlab.com/cryptsetup/cryptsetup/blob/master/README.md

默认值为 false

encrypted_ephemeral = true

更新策略:如果更改此设置,则不允许更新。

ephemeral_dir

(可选)定义将在其中挂载实例存储卷的路径(如果使用它们)。

默认值为 /scratch

ephemeral_dir = /scratch

更新策略:如果更改此设置,则不允许更新。

extra_json

(可选)定义合并到Chef dna.json。有关更多信息,请参阅 构建自定义 Amazon ParallelCluster AMI

默认值为 {}

extra_json = {}
注意

从开始Amazon ParallelCluster版本 2.6.1,则在启动节点时默认跳过大多数安装配方以缩短启动时间。要以牺牲启动时间为代价运行所有安装配方以获得更好的向后兼容性,请将添加"skip_install_recipes" : "no"添加到cluster键extra_json设置。例如:

extra_json = { "cluster" : { "skip_install_recipes" : "no" } }

更新策略:必须停止计算队列,才能更改此设置以进行更新。

fsx_settings

(可选)指定用于 Lustre 配置定义 Amazon FSx 的部分。节名称必须以字母开始,包含不超过 30 个字符,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[fsx]部分

例如,以下设置指定将以[fsx fs]用于 Amazon FSx for Lustre 配置。

fsx_settings = fs

更新策略:如果更改此设置,则不允许更新。

iam_lambda_role

(可选)定义现有的Amazon Lambda执行角色。此角色附加到集群中的所有 Lambda 函数。有关更多信息,请参阅 。Amazon Lambda执行角色中的Amazon Lambda开发人员指南

IAM 角色名称及其 Amazon 资源名称 (ARN) 是不同的。ARN 不能用作的参数iam_lambda_role。如果两者ec2_iam_roleiam_lambda_role已定义,并且schedulersgeslurm,或者torque,则不会创建任何角色。如果schedulerawsbatch,那么在pcluster start。有关示例策略,请参阅ParallelClusterLambdaPolicy,使用SGE、Slurm,或者TorqueParallelClusterLambdaPolicy,使用 awsbatch

没有默认值。

iam_lambda_role = ParallelClusterLambdaRole
注意

对该项的支持iam_lambda_role增加了Amazon ParallelCluster版本 2.10.1

更新策略:更新期间可更改此设置。

initial_queue_size

(可选)设置要作为集群中的计算节点启动的 Amazon EC2 实例的初始数量。如果queue_settings设置,则必须删除此设置并替换为initial_count设置[compute_resource]部分

此设置仅适用于传统计划程序(SGE、Slurm 和 Torque)。如果maintain_initial_size设置为true,然后initial_queue_size设置必须至少为一 (1)。

如果计划程序是 awsbatch,请改用 min_vcpus

默认值为 2

initial_queue_size = 2

更新策略:更新期间可更改此设置。

key_name

(可选)为启用对实例进行的 SSH 访问的现有 Amazon EC2 key pair 的名称。

key_name = mykey
注意

优化前Amazon ParallelCluster版本 2.11.0key_name是必需的设置。

更新策略:如果更改此设置,则不允许更新。

maintain_initial_size

(可选)为传统的计划程序保持 Auto Scaling 组的初始大小 (SGE、Slurm, 和Torque)。

如果计划程序是 awsbatch,请改用 desired_vcpus

此设置是一个布尔标记。如果设置为true,Auto Scaling 组的成员数量绝不会少于initial_queue_size,并将设置为initial_queue_size必须为 1 (1) 或更大。集群仍可以扩展到 max_queue_size 的值。如果cluster_type = spot,则 Auto Scaling 组的实例可能会中断,并且大小可能降至initial_queue_size

如果设置为false,则 Auto Scaling 组的成员数可以缩减为零 (0),以防止在不需要资源时闲置。

如果queue_settings设置,则必须删除此设置并替换为initial_countmin_count设置[compute_resource]部分

默认值为 false

maintain_initial_size = false

更新策略:更新期间可更改此设置。

master_instance_type

(可选)定义用于头节点的 Amazon EC2 实例类型。实例类型的体系结构必须与compute_instance_type设置。

在具有免费套餐的区域中,默认为免费套餐实例类型 (t2.micro或者t3.micro)。在没有免费套餐的区域中,默认为t3.micro。有关的更多信息Amazon免费套餐,请参阅Amazon免费套餐常见问题

master_instance_type = t2.micro
注意

优化前Amazon ParallelCluster版本 2.10.1,默认为t2.micro在所有区域中。InAmazon ParallelCluster版本 2.10.0p4d.24xlarge头节点不支持。对该项的支持Amazon基于重力的实例(例如A1C6g)添加到Amazon ParallelCluster版本 2.8.0

更新策略:如果更改此设置,则不允许更新。

master_root_volume_size

(可选)指定头节点根卷大小(以 GiB 为单位)。AMI 必须支持 growroot

默认值为 35

注意

适用于Amazon ParallelCluster版本,则默认值为 25。优化前Amazon ParallelCluster版本 2.5.0,默认值为 20。

master_root_volume_size = 35

更新策略:如果更改此设置,则不允许更新。

max_queue_size

(可选)设置集群中可以启动的 Amazon EC2 实例的最大数量。如果queue_settings设置,则必须删除此设置并替换为max_count设置[compute_resource]部分

此设置仅适用于传统计划程序(SGE、Slurm 和 Torque)。

如果计划程序是 awsbatch,请改用 max_vcpus

默认值为 10

max_queue_size = 10

更新策略:此设置可以在更新过程中更改,但如果值减少,则应停止计算队列。否则,可能会终止现有节点。

max_vcpus

(可选)指定计算环境中的最大 vCPU 数。仅在计划程序为 awsbatch 时使用。

默认值为 20

max_vcpus = 20

更新策略:更新期间不能减少此设置。

min_vcpus

(可选)保留 Auto Scaling 组的初始大小,以便awsbatch计划程序。

如果计划程序是 SGE、Slurm 或 Torque,请改用 maintain_initial_size

计算环境中的成员数绝不会少于 min_vcpus 的值。

默认值为 0

min_vcpus = 0

更新策略:更新期间可更改此设置。

placement

(可选)定义集群置放群组逻辑,并使整个集群或仅计算实例能够使用集群置放群组。

如果queue_settings设置,那么此设置应该被删除并替换为placement_group设置中的每个[queue]部分。如果同一置放群组用于不同的实例类型,则更有可能由于容量不足而导致请求失败。有关更多信息,请参阅 。实例容量不足中的适用于 Linux 实例的 Amazon EC2 用户指南。多个队列只能共享一个置放群组,如果它是事先创建的,并在placement_group设置为每个队列。如果每个[queue]部分定义placement_group设置,则头节点不能位于队列的置放群组中。

有效选项是 clustercompute

当计划程序为时,不使用此参数。awsbatch

默认值为 compute

placement = compute

更新策略:如果更改此设置,则不允许更新。

placement_group

(可选)定义集群置放群组。如果queue_settings设置,则此设置应该被删除并替换为placement_group设置[queue]部分

有效选项包括以下值:

  • DYNAMIC

  • 现有 Amazon EC2 集群置放群组名称

当设置为 DYNAMIC 时,将唯一置放群组作为集群堆栈的一部分进行创建和删除。

当计划程序为时,不使用此参数。awsbatch

有关置放群组的详细信息,请参阅置放群组中的适用于 Linux 实例的 Amazon EC2 用户指南。如果同一置放群组用于不同的实例类型,则更有可能由于容量不足而导致请求失败。有关更多信息,请参阅 。实例容量不足中的适用于 Linux 实例的 Amazon EC2 用户指南

没有默认值。

并非所有实例类型都支持集群置放群组。例如,默认实例类型t3.micro不支持集群置放群组。有关支持集群置放群组的实例类型列表的信息,请参阅集群置放群组规则和限制中的适用于 Linux 实例的 Amazon EC2 用户指南。有关使用置放群组时的提示,请参阅置放群组和实例启动问题

placement_group = DYNAMIC

更新策略:如果更改此设置,则不允许更新。

post_install

(可选)指定在所有安装后脚本之后运行的 URL。boot_as_*脚本正在运行。有关更多信息,请参阅 自定义引导操作

使用awsbatch作为计划程序,安装后脚本仅在头节点上运行。

参数格式可以是 http://hostname/path/to/script.shs3://bucketname/path/to/script.sh

没有默认值。

post_install = s3://<bucket-name>/my-post-install-script.sh

更新策略:必须停止计算队列,才能更改此设置以进行更新。

post_install_args

(可选)指定要传递到安装后脚本的用双引号引起的参数列表。

没有默认值。

post_install_args = "argument-1 argument-2"

更新策略:必须停止计算队列,才能更改此设置以进行更新。

pre_install

(可选)指定在任何安装前运行的预脚本的 URL。boot_as_*脚本正在运行。有关更多信息,请参阅 自定义引导操作

使用awsbatch作为计划程序,预安装脚本仅在头节点上运行。

参数格式可以是 http://hostname/path/to/script.shs3://bucketname/path/to/script.sh

没有默认值。

pre_install = s3://<bucket-name>/my-pre-install-script.sh

更新策略:必须停止计算队列,才能更改此设置以进行更新。

pre_install_args

(可选)指定要传递到预安装脚本的用双引号引起的参数列表。

没有默认值。

pre_install_args = "argument-3 argument-4"

更新策略:必须停止计算队列,才能更改此设置以进行更新。

proxy_server

(可选)定义 HTTP 或 HTTPS 代理服务器,通常为http://x.x.x.x:8080

没有默认值。

proxy_server = http://10.11.12.13:8080

更新策略:如果更改此设置,则不允许更新。

queue_settings

(可选)指定群集使用队列而不是同构计算队列,并且[queue]部分使用。第一个[queue]部分是默认调度程序队列。这些区域有:queue节名称必须以小写字母开始,包含不超过 30 个字符,并且仅包含小写字母、数字和连字符 (-)。

重要

queue_settings仅在scheduler设置为slurm。这些区域有:cluster_typecompute_instance_typeinitial_queue_sizemaintain_initial_sizemax_queue_sizeplacementplacement_group, 和spot_price设置不能指定。这些区域有:disable_hyperthreadingenable_efa设置可以在[cluster]部分[queue]部分,但不能同时使用两者。

最多五 (5)[queue]部分支持。

有关更多信息,请参阅 。[queue]部分

例如,以下设置指定将以开始的部分[queue q1][queue q2]使用。

queue_settings = q1, q2
注意

对该项的支持queue_settings增加了Amazon ParallelCluster版本 2.9.0

更新策略:必须停止计算队列,才能更改此设置以进行更新。

raid_settings

(可选)标识[raid]部分,以及 Amazon EBS 卷 RAID 配置。节名称必须以字母开始,包含不超过 30 个字符,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[raid]部分

例如,以下设置指定将以[raid rs]用于 Auto Scaling 配置。

raid_settings = rs

更新策略:如果更改此设置,则不允许更新。

s3_read_resource

(可选)指定 Amazon S3 资源,其中Amazon ParallelCluster节点被授予只读访问权限。

例如,arn:aws:s3:::my_corporate_bucket*提供对的只读访问权限我的企业存储桶存储桶和存储桶中的对象。

请参阅使用 Amazon S3有关格式的详细信息。

没有默认值。

s3_read_resource = arn:aws:s3:::my_corporate_bucket*

更新策略:更新期间可更改此设置。

s3_read_write_resource

(可选)指定 Amazon S3 资源Amazon ParallelCluster节点被授予读/写访问权限。

例如,arn:aws:s3:::my_corporate_bucket/Development/*提供对所有对象的读/写访问权限Development文件夹我的企业存储桶存储桶。

请参阅使用 Amazon S3有关格式的详细信息。

没有默认值。

s3_read_write_resource = arn:aws:s3:::my_corporate_bucket/*

更新策略:更新期间可更改此设置。

scaling_settings

标识[scaling]部分与自动扩展配置一起使用。节名称必须以字母开始,包含不超过 30 个字符,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[scaling]部分

例如,以下设置指定将以[scaling custom]用于 “自动扩展” 配置。

scaling_settings = custom

更新策略:如果更改此设置,则不允许更新。

scheduler

(必需)定义集群计划程序。

有效选项包括以下值:

awsbatch

Amazon Batch

sge

Son of Grid Engine (SGE)

slurm

Slurm Workload Manager (Slurm)

torque

Torque Resource Manager (Torque)

警告

从二零一二年十二月三十一日开始Amazon将不再包含SGE和Torque支持所有发布版本Amazon ParallelCluster。先前版本Amazon ParallelCluster支持SGE和Torque仍然可供下载和使用。但是,这些版本将不符合以后的更新或故障排除支持的条件Amazon服务和AmazonSupport 团队。此外,未来的版本Amazon ParallelCluster之前和之后 12 月 31 日,2021 年将不包括任何支持SGE或者Torque。

有关 awsbatch 计划程序的更多信息,请参阅联网设置

注意

优化前Amazon ParallelCluster版本 2.7.0scheduler参数是可选的,默认值为sge。从开始Amazon ParallelCluster版本 2.7.0scheduler参数是必需的。

scheduler = slurm

更新策略:如果更改此设置,则不允许更新。

shared_dir

(可选)定义将在其中挂载共享 Amazon EBS 卷的路径。

请勿将此选项与多个 Amazon EBS 卷一起使用。相反,提供shared_dir每个下的值[ebs]部分

请参阅[ebs]部分了解有关使用多个 Amazon EBS 卷的详细信息。

默认值为 /shared

以下示例显示在上挂载的共享 Amazon EBS 卷/myshared

shared_dir = myshared

更新策略:如果更改此设置,则不允许更新。

spot_bid_percentage

(可选)设置用于计算 ComputeFleet 的最高 Spot 价格的按需百分比,在awsbatch是计划程序。

如果未指定,则选择当前 Spot 市场价格,最高为按需价格。

spot_bid_percentage = 85

更新策略:更新期间可更改此设置。

spot_price

(可选)在传统 ComputeFleet 划程序(SGE、Slurm, 和Torque)。仅当 cluster_type 设置设为 spot 时使用。如果您不指定值,则按 Spot 价格进行收费,最高为按需价格。如果queue_settings设置,则必须删除此设置并替换为spot_price设置[compute_resource]部分

如果计划程序为 awsbatch,请改用 spot_bid_percentage

有关查找满足您需求的 Spot 实例的帮助信息,请参阅Spot 实例顾问

spot_price = 1.50
注意

InAmazon ParallelCluster版本 2.5.0cluster_type = spotbutspot_price未指定,则 ComputeFleet 的实例启动失败。这个问题已在Amazon ParallelCluster版本 2.5.1

更新策略:更新期间可更改此设置。

tags

(可选)定义要由使用的标签Amazon CloudFormation。

如果通过 --tags 指定了命令行标签,则它们将与配置标签合并。

命令行标签覆盖具有相同键的配置标签。

标签是 JSON 格式的。请勿在大括号外使用引号。

有关更多信息,请参阅 。Amazon CloudFormation资源标签类型中的Amazon CloudFormation用户指南

tags = {"key" : "value", "key2" : "value2"}

更新策略:必须停止计算队列,才能更改此设置以进行更新。

注意

更新策略不支持更改tags的设置Amazon ParallelCluster版本 2.8.0 直到版本 2.9.1。

template_url

(可选)定义指向Amazon CloudFormation模板,用于创建集群。

更新使用最初用于创建堆栈的模板。

默认值为 https://aws_region_name-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-version.cfn.json

警告

这是一个高级参数。任何更改此设置均由您自行承担风险。

template_url = https://us-east-1-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-2.11.0.cfn.json

更新策略:在更新过程中不会分析此设置。

vpc_settings

(必需)标识[vpc]部分,以及将在其中部署集群的 Amazon VPC 配置。节名称必须以字母开始,包含不超过 30 个字符,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[vpc]部分

例如,以下设置指定将以[vpc public]用于亚马逊 VPC 配置。

vpc_settings = public

更新策略:如果更改此设置,则不允许更新。