[cluster] 部分 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

[cluster] 部分

定义可用于创建集群的集群模板。一个配置文件可以包含多个[cluster]部分。

同一个集群模板可用于创建多个集群。

格式为 [cluster cluster-template-name]。这些区域有:[cluster]部分由... 命名cluster_template设置[global]部分默认情况下使用,但可以在pcluster命令行。

cluster-template-name必须以字母开头,不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

[cluster default]

additional_cfn_template

(可选)定义一个额外的Amazon CloudFormation模板与集群一起启动。此附加模板用于创建集群外部但属于集群生命周期一部分的资源。

该值必须是指向公共模板的 HTTP URL,并提供所有参数。

没有默认值。

additional_cfn_template = https://<bucket-name>.s3.amazonaws.com/my-cfn-template.yaml

更新:如果更改此设置,则不允许更新。

additional_iam_policies

(可选)指定 Amazon EC2 的 Amazon 资源名称(ARN)的列表。除了所需的权限外,此列表还附加到集群中使用的根角色上Amazon ParallelCluster用逗号分隔。IAM 策略名称和其 ARN 不同。名称不能用作参数additional_iam_policies.

如果您打算在集群节点的默认设置中添加额外的策略,我们建议您将额外的自定义 IAM 策略传递给additional_iam_policies设置而不是使用ec2_iam_role设置以添加您的特定 EC2 策略。这是因为additional_iam_policies已添加到默认权限中Amazon ParallelCluster要求。EXISTSec2_iam_role必须包含所需的所有权限。但是,由于随着功能的添加,所需的权限通常会因版本而异,因此现有的ec2_iam_role可能会过时。

没有默认值。

additional_iam_policies = arn:aws:iam::123456789012:policy/CustomEC2Policy
注意

对该项的支持additional_iam_policies已添添添添添加Amazon ParallelCluster版本 2.5.5.0 版本 2.5.5.

更新:此设置可以在更新期间更改。

base_os

(必需)指定在集群中使用的操作系统类型。

可用的选项为:

  • alinux2

  • centos7

  • ubuntu1804

  • ubuntu2004

注意

对于Amazon仅限基于引力的实例alinux2,ubuntu1804,或ubuntu2004支持。

注意

对该项的支持centos8已删除Amazon ParallelCluster版本 2.11.4 版本版本 2.11.4 对该项的支持ubuntu2004已添加并支持alinuxubuntu1604已删除Amazon ParallelCluster版本 2.11.0 版本版本 2.11.0 对该项的支持centos8已添加并支持centos6已删除Amazon ParallelCluster版本 2.10.0 版本版本 2.10.0 对该项的支持alinux2已添添添添添加Amazon ParallelCluster版本 2.6.6.0 版本 2.6.6. 对该项的支持ubuntu1804已添加,并支持ubuntu1404已删除Amazon ParallelCluster版本 2.5.5.0 版本 2.5.5.

下表中提到的不支持的特定区域除外centos7. 所有其他Amazon商业区域支持以下所有操作系统。

分区(区域) alinux2 centos7 ubuntu1804ubuntu2004
商业(未特别提及所有区域) True True True
Amazon GovCloud (美国东部)us-gov-east-1) True False True
Amazon GovCloud (美国西部)us-gov-west-1) True False True
中国(北京) (cn-north-1) True False True
中国(宁夏) (cn-northwest-1) True False True
注意

这些区域有:base_os参数还确定用于登录集群的用户名。

  • centos7: centos

  • ubuntu1804ubuntu2004ubuntu

  • alinux2: ec2-user

注意

前Amazon ParallelCluster版本 2.7.0base_os参数是可选的,默认为alinux. StartsAmazon ParallelCluster版本 2.7.0base_os参数是必需的。

注意

如果 scheduler 参数为 awsbatch,则仅支持 alinux2

base_os = alinux2

更新:如果更改此设置,则不允许更新。

cluster_resource_bucket

(可选)指定 Amazon S3 存储桶的名称,用于托管创建集群时生成的资源。存储桶必须已启用版本控制。有关更多信息,请参阅使用版本控制Amazon Simple Storage S. 此存储桶可用于多个集群。存储桶必须与集群位于同一区域。

如果未指定此参数,则在创建集群时创建一个新的存储桶。新存储桶的名称为parallelcluster-random_string. 用这个名字,random_string是一个由字母数字字符组成的随机字符串。所有集群资源都存储在此存储桶中,路径的形式为bucket_name/resource_directory.resource_directory有表格stack_name-random_string、、、、、stack_name是其中一个的名称Amazon CloudFormation使用的堆栈Amazon ParallelCluster. 适用于的值bucket_name可以在中找到ResourcesS3Bucket输出中的值parallelcluster-clustername堆栈。适用于的值资源_目录可以在以下值中找到ArtifactS3RootDirectory来自同一堆栈的输出。

默认值为 parallelcluster-random_string

cluster_resource_bucket = my-s3-bucket
注意

对该项的支持cluster_resource_bucket已添添添添添加Amazon ParallelCluster版本 2.10.0 版本版本 2.10.0

更新:如果更改此设置,则不允许更新。无法强制更新此设置。

cluster_type

(可选)定义要启动的集群的类型。如果queue_settings设置已定义,则必须将此设置替换为compute_type设置[queue]部分.

有效的选项为:ondemandspot

默认值为 ondemand

有关 Spot 实例的更多信息,请参阅 使用竞价型实例

注意

使用竞价型实例要求AWSServiceRoleForEC2Spot您的账户中存在服务相关角色。要在您的账户中创建此角色,请使用Amazon CLI,运行以下命令:

aws iam create-service-linked-role --aws-service-name spot.amazonaws.com

有关更多信息,请参阅竞价型实例请求的服务相关角色适用于Linux 实例的 Amazon EC2 用户指南.

cluster_type = ondemand

更新:必须停止计算队列才能更改此设置以进行更新。

compute_instance_type

(可选)定义用于集群计算节点的 Amazon EC2 实例类型。实例类型的架构必须与用于实例类型的架构相同master_instance_type设置。如果queue_settings设置已定义,则必须将此设置替换为instance_type设置[compute_resource]部分.

如果您使用的是awsbatch调度程序,请参阅中的计算环境创建Amazon Batch用户界面,获取受支持实例类型列表。

默认值为 t2.micro;当计划程序为 awsbatch 时,为 optimal

compute_instance_type = t2.micro
注意

对该项的支持Amazon基于引力的实例(包括A1C6g实例)已添加到Amazon ParallelCluster版本 2.8.8.0 版本 2.8.8.

更新:必须停止计算队列才能更改此设置以进行更新。

compute_root_volume_size

(可选)指定 ComputeFleet 根卷大小(以吉字节(GiB)。AMI 必须支持 growroot

默认值为 35

注意

对于Amazon ParallelCluster版本介于 2.5.0 和 2.10.4 之间,默认值为 25。前Amazon ParallelCluster版本 2.5.0

compute_root_volume_size = 35

更新:必须停止计算队列才能更改此设置以进行更新。

custom_ami

(可选)指定用于头部和计算节点的自定义 AMI 的 ID,而不是默认发布的 AMI 发布. 有关更多信息,请参阅 修改 AMI构建自定义 Amazon ParallelCluster AMI

没有默认值。

custom_ami = ami-00d4efc81188687a0

如果自定义 AMI 需要额外的启动权限,则必须将这些权限同时添加到用户和头节点策略中。

例如,如果自定义 AMI 有与之关联的加密快照,则用户和头节点策略中都需要以下额外策略:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "kms:DescribeKey", "kms:ReEncrypt*", "kms:CreateGrant", "kms:Decrypt" ], "Resource": [ "arn:aws:kms:<AWS_REGION>:<AWS_ACCOUNT_ID>:key/<AWS_KMS_KEY_ID>" ] } ] }

更新:如果更改此设置,则不允许更新。

cw_log_settings

(可选)标识符[cw_log]部分,提供 CloudWatch 日志配置。章节名称必须以字母开头,包含不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[cw_log]部分,亚马逊 CloudWatch 仪表板,以及与 Amazon 集成 CloudWatch 日志.

例如,下面指定了开始[cw_log custom-cw]用于 CloudWatch 日志配置。

cw_log_settings = custom-cw
注意

对该项的支持cw_log_settings已添添添添添加Amazon ParallelCluster版本 2.6.6.0 版本 2.6.6.

更新:如果更改此设置,则不允许更新。

dashboard_settings

(可选)标识符[dashboard]部分,提供 CloudWatch控制面板配置。章节名称必须以字母开头,包含不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[dashboard]部分.

例如,下面指定了开始[dashboard custom-dashboard用于 CloudWatch 控制面板配置。

dashboard_settings = custom-dashboard
注意

对该项的支持dashboard_settings已添添添添添加Amazon ParallelCluster版本 2.10.0 版本版本 2.10.0

更新:此设置可以在更新期间更改。

dcv_settings

(可选)标识符[dcv]部分采用了 NICE DCV 配置。章节名称必须以字母开头,包含不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[dcv]部分.

例如,下面指定了开始[dcv custom-dcv]用于 NICE DCV 配置。

dcv_settings = custom-dcv
注意

开启Amazon基于 Gravity 的实例,仅支持 NICE DCValinux2.

注意

对该项的支持dcv_settings已添添添添添加Amazon ParallelCluster版本 2.5.5.0 版本 2.5.5.

更新:如果更改此设置,则不允许更新。

desired_vcpus

(可选)指定计算环境中所需的 vCPUs 数。仅在计划程序为 awsbatch 时使用。

默认值为 4

desired_vcpus = 4

更新:更新期间不分析此设置。

disable_cluster_dns

(可选)指定是否不应创建集群的 DNS 条目。默认情况下Amazon ParallelCluster创建一个 Route 53 托管区域。如果disable_cluster_dns将设置为true,未创建托管区域。

默认值为 false

disable_cluster_dns = true
警告

集群需要名称解析系统才能正常运行。如果disable_cluster_dns将设置为true,还必须提供额外的名称解析系统。

重要

disable_cluster_dns=true仅在以下情况下才支持queue_settings已指定设置。

注意

对该项的支持disable_cluster_dns已添添添添添加Amazon ParallelCluster版本 2.9.1.9.1 版本 2.9.

更新:如果更改此设置,则不允许更新。

disable_hyperthreading

(可选)在头部和计算节点上禁用超线程。并非所有实例类型都可以禁用超线程。有关支持禁用超线程的实例类型的列表,请参阅每种实例类型每个 CPU 核心的 CPU 核心和线程数适用于Linux 实例的 Amazon EC2 用户指南. 如果queue_settings设置已定义,要么可以定义此设置,要么disable_hyperthreading设置[queue]部分可以定义。

默认值为 false

disable_hyperthreading = true
注意

disable_hyperthreading仅在以下情况下影响头节点scheduler = awsbatch.

注意

对该项的支持disable_hyperthreading已添添添添添加Amazon ParallelCluster版本 2.5.5.0 版本 2.5.5.

更新:如果更改此设置,则不允许更新。

ebs_settings

(可选)标识符[ebs]包含挂载在头节点上的 Amazon EBS 卷的部分。使用多个 Amazon EBS 卷时,请在列表中输入这些参数,每个参数以逗号分隔。章节名称必须以字母开头,包含不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

最多支持五 (5) 个额外的 Amazon EBS 卷。

有关更多信息,请参阅 。[ebs]部分.

例如,下面设置指定了开始[ebs custom1][ebs custom2]用于Amazon EBS 卷。

ebs_settings = custom1, custom2

更新:如果更改此设置,则不允许更新。

ec2_iam_role

(可选)定义附加到集群中所有实例的 Amazon EC2 现有 IAM 角色的名称。IAM 角色名称及其 Amazon 资源名称 (ARN) 是不同的。ARN 不能用作参数ec2_iam_role.

如果指定了此选项,则忽略 additional_iam_policies 设置。如果您打算在集群节点的默认设置中添加额外的策略,我们建议您将额外的自定义 IAM 策略传递给additional_iam_policies设置而不是使用ec2_iam_role设置。

如果未指定此选项,则默认值Amazon ParallelCluster使用 Amazon EC2 的 IAM 角色。有关更多信息,请参阅 Amazon Identity and Access Management的角色Amazon ParallelCluster

没有默认值。

ec2_iam_role = ParallelClusterInstanceRole

更新:如果更改此设置,则不允许更新。

efs_settings

(可选)指定与 Amazon EFS 文件系统相关的设置。章节名称必须以字母开头,包含不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[efs]部分.

例如,下面指定了开始[efs customfs]用于 Amazon EFS 文件系统配置。

efs_settings = customfs

更新:如果更改此设置,则不允许更新。

enable_efa

(可选)如果存在,请指定为计算节点启用Elastic Fabric Adapter (EFA)。要查看支持 EFA 的 EC2 实例列表,请参阅支持的实例类型适用于Linux 实例的 Amazon EC2 用户指南. 有关更多信息,请参阅 Elastic Fabric Adapter。如果queue_settings设置已定义,要么可以定义此设置,要么enable_efa设置[queue]部分可以定义。应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placementplacement_group

enable_efa = compute
注意

中添加了对基于 ARM 的 Graviton2 实例上的 EFA SupportAmazon ParallelCluster版本 2.10.1 版本版本 2.10.1

更新:如果更改此设置,则不允许更新。

enable_efa_gdr

(可选)启动Amazon ParallelCluster版本 2.11.3,此设置不起作用。如果实例类型和操作系统都支持 GpuDirect RDMA(远程直接内存访问)的 Elastic Fabric Adapter (EFA) 支持,则始终处于启用状态。

注意

Amazon ParallelCluster版本 2.10.2 如果compute,指定为计算节点启用 GpuDirect RDMA(远程直接内存访问)的Elastic Fabric Adapter (EFA) 支持。将此设置设置为compute要求enable_efa设置已设置为compute. 特定实例类型支持 GpuDirect RDMA 的 EFA 支持 (p4d.24xlarge) 在特定操作系统上 (base_osalinux2,centos7,ubuntu1804,或ubuntu2004)。如果queue_settings设置已定义,要么可以定义此设置,要么enable_efa_gdr设置[queue]部分可以定义。应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placementplacement_group

enable_efa_gdr = compute
注意

对该项的支持enable_efa_gdr已添添添添添加Amazon ParallelCluster版本 2.10.0 版本版本 2.10.0

更新:必须停止计算队列才能更改此设置以进行更新。

enable_intel_hpc_platform

(可选)如果存在,则表示最终用户许可协议英特尔并行工作室已接受。这会导致英特尔 Parallel Studio 安装在头节点上并与计算节点共享。这使头节点引导所需的时间增加了几分钟。仅 CentOS 7 (base_os = centos7) 上支持 enable_intel_hpc_platform 设置。

默认值为 false

enable_intel_hpc_platform = true
注意

这些区域有:enable_intel_hpc_platform参数与不兼容Amazon基于引力的实例。

注意

对该项的支持enable_intel_hpc_platform已添添添添添加Amazon ParallelCluster版本 2.5.5.0 版本 2.5.5.

更新:如果更改此设置,则不允许更新。

encrypted_ephemeral

(可选)使用 LUKS(Linux Unified Key Setup)使用不可恢复的内存密钥对临时实例存储卷进行加密。

有关更多信息,请参阅 https://gitlab.com/cryptsetup/cryptsetup/blob/master/README.md

默认值为 false

encrypted_ephemeral = true

更新:如果更改此设置,则不允许更新。

ephemeral_dir

(可选)定义使用实例存储卷时的挂载路径。

默认值为 /scratch

ephemeral_dir = /scratch

更新:如果更改此设置,则不允许更新。

extra_json

(可选)定义合并到的额外 JSONChef dna.json. 有关更多信息,请参阅 构建自定义 Amazon ParallelCluster AMI

默认值为 {}

extra_json = {}
注意

启动Amazon ParallelCluster版本 2.6.1 中,启动节点时默认会跳过大多数安装配方以缩短启动时间。要以牺牲启动时间为代价运行所有安装方法以获得更好的向后兼容性,请添加"skip_install_recipes" : "no"cluster键入extra_json设置。例如:

extra_json = { "cluster" : { "skip_install_recipes" : "no" } }

更新:必须停止计算队列才能更改此设置以进行更新。

fsx_settings

(可选)指定定义 FSx for Lustre 配置的部分。章节名称必须以字母开头,包含不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[fsx]部分.

例如,下面指定了开始[fsx fs]用于 FSx for Lustre 配置。

fsx_settings = fs

更新:如果更改此设置,则不允许更新。

iam_lambda_role

(可选)定义现有的名称Amazon Lambda执行角色。该角色附加到集群中所有 Lambda 函数。有关更多信息,请参阅Amazon Lambda执行角色Amazon Lambda开发人员指南.

注意

从版本 2.11.5Amazon ParallelCluster不支持使用SGE要么Torque调的调的调的调

IAM 角色名称及其 Amazon 资源名称 (ARN) 是不同的。ARN 不能用作参数iam_lambda_role. 如果两者都有ec2_iam_roleiam_lambda_role已定义,并且schedulersge,slurm,或torque,则不会创建任何角色。如果schedulerawsbatch,然后将在此期间创建角色pcluster start. 有关示例策略,请参阅。ParallelClusterLambdaPolicy使用SGE,Slurm,或TorqueParallelClusterLambdaPolicy,使用 awsbatch.

没有默认值。

iam_lambda_role = ParallelClusterLambdaRole
注意

对该项的支持iam_lambda_role已添添添添添加Amazon ParallelCluster版本 2.10.1 版本版本 2.10.1

更新:此设置可以在更新期间更改。

initial_queue_size

(可选)设置作为集群中的计算节点启动的 Amazon EC2 实例的初始数目。如果queue_settings设置已定义,则必须删除此设置并将其替换为initial_count设置[compute_resource]部分.

注意

从版本 2.11.5Amazon ParallelCluster不支持使用SGE要么Torque调的调的调的调

此设置仅适用于传统计划程序(SGE、Slurm 和 Torque)。如果maintain_initial_size设置true,然后是initial_queue_size设置必须至少为一 (1)。

如果计划程序是 awsbatch,请改用 min_vcpus

默认值为 2

initial_queue_size = 2

更新:此设置可以在更新期间更改。

key_name

(可选)命名用于支持对实例进行 SSH 访问的现有 Amazon EC2 key pair。

key_name = mykey
注意

前Amazon ParallelCluster版本 2.11.0 版本版本 2.11.0key_name是必需的设置。

更新:如果更改此设置,则不允许更新。

maintain_initial_size

注意

从版本 2.11.5Amazon ParallelCluster不支持使用SGE要么Torque调的调的调的调

(可选)保持传统调度器的 Auto Scaling 组的初始大小(SGE,Slurm,以及Torque)。

如果计划程序是 awsbatch,请改用 desired_vcpus

此设置是一个布尔标记。如果将设置为true,Auto Scaling 组的成员数量从未少于的值initial_queue_size,以及的值initial_queue_size必须大于一 (1)。集群仍可以扩展到 max_queue_size 的值。如果cluster_type = spot那么 Auto Scaling 组可能会中断实例,并且大小可能会降至initial_queue_size.

如果将设置为false,Auto Scaling 组可以缩减到零 (0) 个成员,以防止资源在不需要时处于闲置状态。

如果queue_settings设置已定义则必须删除此设置并将其替换为initial_countmin_count设置[compute_resource]部分.

默认值为 false

maintain_initial_size = false

更新:此设置可以在更新期间更改。

master_instance_type

(可选)定义用于头节点的 Amazon EC2 实例类型。实例类型的架构必须与用于实例类型的架构相同compute_instance_type设置。

在有免费套餐的区域中,默认为免费套餐实例类型 (t2.micro要么t3.micro)。在没有免费套餐的区域中,默认为t3.micro. 有关以下内容的更多信息Amazon免费套餐,请参阅免费套餐Amazon免费套餐常见问题.

master_instance_type = t2.micro
注意

前Amazon ParallelCluster版本 2.10.1t2.micro在所有区域。中Amazon ParallelCluster版本 2.10.0p4d.24xlarge不支持头节点。对该项的支持Amazon基于 Gravity 的实例(例如A1C6g) 已添加到Amazon ParallelCluster版本 2.8.8.0 版本 2.8.8.

更新:如果更改此设置,则不允许更新。

master_root_volume_size

(可选)以吉字节 (GiB) 为单位指定头节点根卷大小。AMI 必须支持 growroot

默认值为 35

注意

对于Amazon ParallelCluster版本介于 2.5.0 和 2.10.4 之间,默认值为 25。前Amazon ParallelCluster版本 2.5.0

master_root_volume_size = 35

更新:如果更改此设置,则不允许更新。

max_queue_size

(可选)设置可以在集群中启动的 Amazon EC2 实例的最大数目。如果queue_settings设置已定义,则必须删除此设置并将其替换为max_count设置[compute_resource]部分.

注意

从版本 2.11.5Amazon ParallelCluster不支持使用SGE要么Torque调的调的调的调

此设置仅适用于传统计划程序(SGE、Slurm 和 Torque)。

如果计划程序是 awsbatch,请改用 max_vcpus

默认值为 10

max_queue_size = 10

更新策略:更新策略:此设置可以在更新期间更改,但如果该值降低,则应停止计算队列。否则,现有节点可能会被终止。

max_vcpus

(可选)指定计算环境中的 vCPUs 的最大数目。仅在计划程序为 awsbatch 时使用。

默认值为 20

max_vcpus = 20

更新:更新期间不能降低此设置。

min_vcpus

(可选)保持 Auto Scaling 组的初始大小awsbatch调的调资源。

注意

从版本 2.11.5Amazon ParallelCluster不支持使用SGE要么Torque调的调的调的调

如果计划程序是 SGE、Slurm 或 Torque,请改用 maintain_initial_size

计算环境中的成员数绝不会少于 min_vcpus 的值。

默认值为 0

min_vcpus = 0

更新:此设置可以在更新期间更改。

placement

(可选)定义集群置放群组逻辑,允许整个集群或仅允许计算实例使用集群置放群组。

如果queue_settings设置已定义,则应删除此设置并将其替换为placement_group每个的设置[queue]部分. 如果将同一个置放群组用于不同的实例类型,则请求更有可能由于容量不足错误而失败。有关更多信息,请参阅实例容量不足适用于Linux 实例的 Amazon EC2 用户指南. 只有事先创建了置放群组并在其中进行了配置,则多个队列才能共享该置放群组placement_group为每个队列设置。如果每个[queue]部分定义的placement_group设置,则头节点不能在队列的置放群组中。

有效选项是 clustercompute

当调度器处于运行状态时,不使用此参数awsbatch.

默认值为 compute

placement = compute

更新:如果更改此设置,则不允许更新。

placement_group

(可选)定义集群置放群组。如果queue_settings设置已定义,则应删除此设置并将其替换为placement_group设置[queue]部分.

有效选项为以下值:

  • DYNAMIC

  • 现有的 Amazon EC2 集群置放群组名称

当设置为 DYNAMIC 时,将唯一置放群组作为集群堆栈的一部分进行创建和删除。

当调度器处于运行状态时,不使用此参数awsbatch.

有关置放组的更多信息,请参阅置放群组适用于Linux 实例的 Amazon EC2 用户指南. 如果将同一个置放群组用于不同的实例类型,则请求更有可能由于容量不足错误而失败。有关更多信息,请参阅实例容量不足适用于Linux 实例的 Amazon EC2 用户指南.

没有默认值。

并非所有实例类型都支持集群置放群组。例如,默认实例类型为t3.micro不支持集群置放群组。有关支持集群置放群组的实例类型列表的信息,请参阅集群置放群组规则和限制适用于Linux 实例的 Amazon EC2 用户指南. 有关使用置放群组时的提示,请参阅置放群组和实例启动问题

placement_group = DYNAMIC

更新:如果更改此设置,则不允许更新。

post_install

(可选)指定在所有节点引导操作完成后运行的安装后脚本的 URL。有关更多信息,请参阅 自定义引导操作

使用时awsbatch作为调度程序,安装后脚本仅在头节点上运行。

参数格式可以是 http://hostname/path/to/script.shs3://bucketname/path/to/script.sh

没有默认值。

post_install = s3://<bucket-name>/my-post-install-script.sh

更新:必须停止计算队列才能更改此设置以进行更新。

post_install_args

(可选)指定要传递给安装后脚本的参数列表。

没有默认值。

post_install_args = "argument-1 argument-2"

更新:必须停止计算队列才能更改此设置以进行更新。

pre_install

(可选)指定在启动任何节点部署引导操作之前运行的预安装脚本的 URL。有关更多信息,请参阅 自定义引导操作

使用时awsbatch作为调度程序,预安装脚本仅在头节点上运行。

参数格式可以是 http://hostname/path/to/script.shs3://bucketname/path/to/script.sh

没有默认值。

pre_install = s3://<bucket-name>/my-pre-install-script.sh

更新:必须停止计算队列才能更改此设置以进行更新。

pre_install_args

(可选)指定要传递给预安装脚本的参数列表。

没有默认值。

pre_install_args = "argument-3 argument-4"

更新:必须停止计算队列才能更改此设置以进行更新。

proxy_server

(可选)定义 HTTP 或 HTTPS 代理服务器,通常是http://x.x.x.x:8080.

没有默认值。

proxy_server = http://10.11.12.13:8080

更新:如果更改此设置,则不允许更新。

queue_settings

(可选)指定集群使用队列而不是同构计算队列,以及哪个[queue]部分已添加。Fists[queue]部分列出的是默认的调度器队列。这些区域有:queue部分名称必须以小写字母开头,包含不超过 30 个字符,并且只能包含小写字母、数字和连字符 (-)。

重要

queue_settings仅在以下情况下才支持scheduler将设置为slurm. 这些区域有:cluster_type,compute_instance_type,initial_queue_size,maintain_initial_size,max_queue_size,placement,placement_group,以及spot_price不得指定设置。这些区域有:disable_hyperthreadingenable_efa设置可以在中指定[cluster]部分或者[queue]部分,但不能同时两者。

最多五 (5)[queue]部分支持。

有关更多信息,请参阅 。[queue]部分.

例如,下面设置指定了开始[queue q1][queue q2]已添加。

queue_settings = q1, q2
注意

对该项的支持queue_settings已添添添添添加Amazon ParallelCluster版本 2.9.0 版本 2.9.0 版本 2.9.

更新:必须停止计算队列才能更改此设置以进行更新。

raid_settings

(可选)标识符[raid]部分,采用Amazon EBS 卷 RAID 配置。章节名称必须以字母开头,包含不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[raid]部分.

例如,下面指定了开始[raid rs]用于Auto Scaling 配置。

raid_settings = rs

更新:如果更改此设置,则不允许更新。

s3_read_resource

(可选)指定 Amazon S3 资源Amazon ParallelCluster节点被授予只读访问权限。

例如,arn:aws:s3:::my_corporate_bucket*提供对我的公司_bucket存储桶和存储桶内的对象。

请参阅使用 Amazon S3了解有关格式的详细信息。

没有默认值。

s3_read_resource = arn:aws:s3:::my_corporate_bucket*

更新:此设置可以在更新期间更改。

s3_read_write_resource

(可选)指定 Amazon S3 资源Amazon ParallelCluster节点被授予读取/写入权限。

例如,arn:aws:s3:::my_corporate_bucket/Development/*提供对中所有对象的读/写访问权限Development适用于的文件夹我的公司_bucket存储桶。

请参阅使用 Amazon S3了解有关格式的详细信息。

没有默认值。

s3_read_write_resource = arn:aws:s3:::my_corporate_bucket/*

更新:此设置可以在更新期间更改。

scaling_settings

标识符[scaling]部分包含Auto Scaling 配置。章节名称必须以字母开头,包含不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[scaling]部分.

例如,下面指定了开始[scaling custom]用于Auto Scaling 配置。

scaling_settings = custom

更新:如果更改此设置,则不允许更新。

scheduler

(必需)定义集群计划程序。

有效选项为以下值:

awsbatch

Amazon Batch

有关以下内容的更多信息awsbatch调度器,请参见网络设置Amazon Batch (awsbatch).

sge
注意

从版本 2.11.5Amazon ParallelCluster不支持使用SGE要么Torque调的调的调的调

Son of Grid Engine (SGE)

slurm

Slurm Workload Manager (Slurm)

torque
注意

从版本 2.11.5Amazon ParallelCluster不支持使用SGE要么Torque调的调的调的调

Torque Resource Manager (Torque)

注意

前Amazon ParallelCluster版本 2.7.0scheduler参数是可选的,默认为sge. StartsAmazon ParallelCluster版本 2.7.0scheduler参数是必需的。

scheduler = slurm

更新:如果更改此设置,则不允许更新。

shared_dir

(可选)定义共享的 Amazon EBS 卷的安装路径。

不要将此选项用于多个 Amazon EBS 卷。相反,提供 Phithshared_dir每个值之下[ebs]部分.

请参[ebs]部分了解有关使用多个 Amazon EBS 卷的详细信息。

默认值为 /shared

以下示例显示了安装在的共享 Amazon EBS 卷/myshared.

shared_dir = myshared

更新:如果更改此设置,则不允许更新。

spot_bid_percentage

(可选)设置用于计算最高现货价格的按需百分比 ComputeFleet、、、、、awsbatch是调度器。

如果未指定,则选择当前 Spot 市场价格,最高为按需价格。

spot_bid_percentage = 85

更新:此设置可以在更新期间更改。

spot_price

注意

从版本 2.11.5Amazon ParallelCluster不支持使用SGE要么Torque调的调的调的调

(可选)设置最高现货价格 ComputeFleet 在传统调度器上 (SGE,Slurm,以及Torque)。仅当 cluster_type 设置设为 spot 时使用。如果您未指定值,将按现货价格(上限为按需价格)。如果queue_settings设置已定义,则必须删除此设置并将其替换为spot_price设置[compute_resource]部分.

如果计划程序为 awsbatch,请改用 spot_bid_percentage

有关查找符合要求的 Spot 实例的帮助,请参阅竞价型实例顾问.

spot_price = 1.50
注意

中Amazon ParallelCluster版本 2.5.0 版本 2.5.0 版本 2.5.cluster_type = spot但是spot_price未指定,实例开始 ComputeFleet 失败。中修复的版本,中修复的Amazon ParallelCluster版本 2.5.5.1 版本 2.5.5.

更新:此设置可以在更新期间更改。

tags

(可选)定义要使用的标签Amazon CloudFormation.

如果通过 --tags 指定了命令行标签,则它们将与配置标签合并。

命令行标签覆盖具有相同键的配置标签。

标签是 JSON 格式的。不要在大括号之外使用引号。

有关更多信息,请参阅Amazon CloudFormation资源标签类型Amazon CloudFormation用户指南.

tags = {"key" : "value", "key2" : "value2"}

更新:如果更改此设置,则不允许更新。

注意

更新策略不支持更改tags适用于Amazon ParallelCluster版本 2.8.0

对于版本 2.10.0 到版本 2.11.7,列出的更新策略支持更改tags设置不准确。不支持修改此设置时的集群更新。

template_url

(可选)定义路径Amazon CloudFormation用于创建集群的模板。

更新使用最初用于创建堆栈的模板。

默认值为 https://aws_region_name-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-version.cfn.json

警告

这是一个高级参数。对此设置的任何更改需自行承担风险。

template_url = https://us-east-1-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-2.11.7.cfn.json

更新:更新期间不分析此设置。

vpc_settings

((必需)标识符[vpc]部分,其中包含部署集群的 Amazon VPC 配置。章节名称必须以字母开头,包含不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

有关更多信息,请参阅 。[vpc]部分.

例如,下面指定了开始[vpc public]用于亚马逊 VPC 配置。

vpc_settings = public

更新:如果更改此设置,则不允许更新。