本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
[cluster]
部分
主题
- additional_cfn_template
- additional_iam_policies
- base_os
- cluster_resource_bucket
- cluster_type
- compute_instance_type
- compute_root_volume_size
- custom_ami
- cw_log_settings
- dashboard_settings
- dcv_settings
- desired_vcpus
- disable_cluster_dns
- disable_hyperthreading
- ebs_settings
- ec2_iam_role
- efs_settings
- enable_efa
- enable_efa_gdr
- enable_intel_hpc_platform
- encrypted_ephemeral
- ephemeral_dir
- extra_json
- fsx_settings
- iam_lambda_role
- initial_queue_size
- key_name
- maintain_initial_size
- master_instance_type
- master_root_volume_size
- max_queue_size
- max_vcpus
- min_vcpus
- placement
- placement_group
- post_install
- post_install_args
- pre_install
- pre_install_args
- proxy_server
- queue_settings
- raid_settings
- s3_read_resource
- s3_read_write_resource
- scaling_settings
- scheduler
- shared_dir
- spot_bid_percentage
- spot_price
- tags
- template_url
- vpc_settings
定义可用于创建集群的集群模板。配置文件可以包含多个[cluster]
部分。
同一群集模板可用于创建多个集群。
格式为 [cluster
。这些区域有:[cluster]部分由cluster_template在[global]部分默认情况下使用,但可以在pcluster命令行。cluster-template-name
]
cluster-template-name
必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。
[cluster default]
additional_cfn_template
(可选)定义一个额外的Amazon CloudFormation与集群一起启动的模板。此附加模板用于创建属于集群外部但属于集群生命周期一部分的资源。
此值必须是到公有模板的 HTTP URL,带有提供的所有参数。
没有默认值。
additional_cfn_template = https://
<bucket-name>
.s3.amazonaws.com/my-cfn-template.yaml
additional_iam_policies
(可选)指定适用于 Amazon EC2 的 IAM 策略的 Amazon 资源名称 (ARN) 的列表。除了所需的权限之外,此列表还附加到集群中使用的 root 角色。Amazon ParallelCluster用逗号隔开。IAM 策略名称及其 ARN 不相同。名字不能用作参数additional_iam_policies.additional_iam_policies应该用来代替ec2_iam_role. 这是因为已经将 additional_iam_policies 添加到 Amazon ParallelCluster 所需的权限中,而 ec2_iam_role 必须包含所有必需的权限。随着功能的不断添加,所需权限通常会随版本发生变化。
没有默认值。
additional_iam_policies = arn:aws:iam::aws:policy/AdministratorAccess
对该项的支持additional_iam_policies增加了Amazon ParallelCluster版本 2.5.0。
base_os
(必需)指定在集群中使用的操作系统类型。
可用的选项为:
-
alinux2
-
centos7
-
ubuntu1804
-
ubuntu2004
适用于Amazon仅限基于 Graviton 的实例alinux2
、ubuntu1804
,或者ubuntu2004
支持。
对该项的支持centos8
已在中删除Amazon ParallelCluster版本 2.11.4。对该项的支持ubuntu2004
已添加并支持alinux
和ubuntu1604
已删除Amazon ParallelCluster版本 2.11.0。对该项的支持centos8
已添加并支持centos6
已删除Amazon ParallelCluster版本 2.10.0。对该项的支持alinux2
增加了Amazon ParallelCluster版本 2.6.0。对该项的支持ubuntu1804
已添加,并支持ubuntu1404
已在中删除Amazon ParallelCluster版本 2.5.0。
除了下表中提到的不支持的特定区域之外centos7
. 所有其他Amazon商业区域支持以下所有操作系统。
分区(区域) | alinux2 |
centos7 |
ubuntu1804 和 ubuntu2004 |
---|---|---|---|
商业(未具体提及的所有区域) | True | True | True |
Amazon GovCloud(美国东部)us-gov-east-1 ) |
True | False | True |
Amazon GovCloud(美国西部)us-gov-west-1 ) |
True | False | True |
中国(北京) (cn-north-1 ) |
True | False | True |
中国(宁夏) (cn-northwest-1 ) |
True | False | True |
这些区域有:base_os参数还确定用于登录到集群的用户名。
-
centos7
:centos
-
ubuntu1804
和ubuntu2004
:ubuntu
-
alinux2
:ec2-user
优化前Amazon ParallelCluster版本 2.7.0base_os参数是可选的,默认值为alinux
. 从启动Amazon ParallelCluster版本 2.7.0base_os参数是必需的。
如果 scheduler 参数为 awsbatch
,则仅支持 alinux2
。
base_os = alinux2
cluster_resource_bucket
(可选)指定用于托管创建集群时生成的资源的 Amazon S3 存储桶的名称。该存储桶必须已启用版本控制。有关更多信息,请参阅 。使用版本控制中的Amazon Simple Storage Service 用户指南. 此存储桶可用于多个集群。存储桶必须与集群位于同一区域中。
如果未指定此参数,则在创建集群时创建一个新的存储桶。新存储桶的名称为parallelcluster-
. 以这个名字,random_string
random _string
是字母数字字符串的随机字符串。所有集群资源都以带有表单的路径存储在此存储桶中
.bucket_name
/resource_directory
resource_directory
有表单
,其中,stack_name
-random_string
stack_name
是其中之一的名称Amazon CloudFormation使用的堆栈Amazon ParallelCluster. 的价值bucket_name
可以在ResourcesS3Bucket
的输出中的值parallelcluster-
堆栈。的价值clustername
资源ce_目录
可以在的值中找到ArtifactS3RootDirectory
来自同一堆栈的输出。
默认值为 parallelcluster-
。random_string
cluster_resource_bucket = my-s3-bucket
对该项的支持cluster_resource_bucket增加了Amazon ParallelCluster版本 2.10.0。
更新策略:如果更改此设置,则不允许进行更新。无法强制更新此设置。
cluster_type
(可选)定义要启动的集群的类型。如果queue_settings设置已定义,那么必须将此设置替换为compute_type settings in the [queue]部分.
有效的选项为:ondemand
和 spot
。
默认值为 ondemand
。
有关 Spot 实例的更多信息,请参阅 使用竞价型实例。
使用 Spot 实例需要AWSServiceRoleForEC2Spot
您的账户中存在与服务相关的角色。使用在账户中创建此角色Amazon CLI中,运行以下命令:
aws iam create-service-linked-role --aws-service-name spot.amazonaws.com
有关更多信息,请参阅 。竞价型实例请求的服务相关角色中的适用于 Linux 实例的 Amazon EC2 用户指南.
cluster_type = ondemand
compute_instance_type
(可选)定义用于集群计算节点的 Amazon EC2 实例类型。实例类型的体系结构必须与用于master_instance_type设置设置。如果queue_settings设置已定义,那么必须将此设置替换为instance_type settings in the [compute_resource]部分.
如果您使用awsbatch
调度程序,请参阅中的计算环境创建Amazon Batch用于获取受支持实例类型的列表。
默认值为 t2.micro
;当计划程序为 awsbatch
时,为 optimal
。
compute_instance_type = t2.micro
对该项的支持Amazon基于 Graviton 的实例(包括A1
和C6g
实例)已添加到Amazon ParallelCluster版本 2.8.0。
compute_root_volume_size
(可选)指定ComputeFleet根卷大小(以 GiB 为单位)。AMI 必须支持 growroot
。
默认值为 35
。
适用于Amazon ParallelCluster在 2.5.0 和 2.10.4 之间的版本,默认值为 25。优化前Amazon ParallelCluster版本 2.5.0,默认值为 20。
compute_root_volume_size = 35
custom_ami
(可选)指定要用于头部和计算节点的自定义 AMI 的 ID,而非默认值。已发布的 AMI
没有默认值。
custom_ami = ami-00d4efc81188687a0
如果自定义 AMI 需要其他权限才能启动,则必须将这些权限添加到用户和头节点策略中。
例如,如果自定义 AMI 具有与其关联的加密快照,则用户和头节点策略中都需要以下附加策略:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "kms:DescribeKey", "kms:ReEncrypt*", "kms:CreateGrant", "kms:Decrypt" ], "Resource": [ "arn:aws:kms:
<AWS_REGION>
:<AWS_ACCOUNT_ID>
:key/<AWS_KMS_KEY_ID>
" ] } ] }
cw_log_settings
(可选)标识[cw_log]
部分CloudWatch记录配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅 。[cw_log]部分、亚马逊CloudWatch仪表板, 和与亚马逊集成CloudWatch日志.
例如,以下设置指定将以开始的部分。[cw_log custom-cw]
用于CloudWatch记录配置。
cw_log_settings = custom-cw
对该项的支持cw_log_settings增加了Amazon ParallelCluster版本 2.6.0。
dashboard_settings
(可选)标识[dashboard]
部分CloudWatch控制面板配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅 。[dashboard]部分.
例如,以下设置指定将以开始的部分。[dashboard
custom-dashboard
用于CloudWatch控制面板配置。
dashboard_settings = custom-dashboard
对该项的支持dashboard_settings增加了Amazon ParallelCluster版本 2.10.0。
dcv_settings
(可选)标识[dcv]
部分带有 NICE DCV 配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅 。[dcv]部分.
例如,以下设置指定将以开始的部分。[dcv custom-dcv]
用于 NICE DCV 配置。
dcv_settings = custom-dcv
在 上Amazon基于 Graviton 的实例,NICE DCV 仅在alinux2
.
对该项的支持dcv_settings增加了Amazon ParallelCluster版本 2.5.0。
desired_vcpus
(可选)指定计算环境中所需的 vCPU 数。仅在计划程序为 awsbatch
时使用。
默认值为 4
。
desired_vcpus = 4
disable_cluster_dns
(可选)指定是否不应创建集群的 DNS 条目。默认情况下,Amazon ParallelCluster创建 Route 53 托管区域。如果disable_cluster_dns
设置为true
,未创建托管区域。
默认值为 false
。
disable_cluster_dns = true
集群需要名称解析系统才能正常运行。如果disable_cluster_dns
设置为true
, 还必须提供额外的名称解析系统.
disable_cluster_dns=true
只有在queue_settings已指定设置。
对该项的支持disable_cluster_dns增加了Amazon ParallelCluster版本 2.9.1。
disable_hyperthreading
(可选)禁用在头和计算节点上的超线程。并非所有实例类型都可以禁用超线程。有关支持禁用超线程的实例类型的列表,请参阅。每种实例类型的 CPU 核心和每个 CPU 核心的线程中的适用于 Linux 实例的 Amazon EC2 用户指南. 如果queue_settings设置已定义,可以定义此设置,也可以定义disable_hyperthreading settings in the [queue]部分可以定义。
默认值为 false
。
disable_hyperthreading = true
disable_hyperthreading只会在以下情况下影响头节点scheduler = awsbatch
.
对该项的支持disable_hyperthreading增加了Amazon ParallelCluster版本 2.5.0。
ebs_settings
(可选)标识[ebs]
部分中有挂载在头节点上的 Amazon EBS 卷。使用多个 Amazon EBS 卷时,请在列表中输入这些参数,每个卷用逗号分隔。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。
支持最多五 (5) 个额外的 Amazon EBS 卷。
有关更多信息,请参阅 。[ebs]部分.
例如,以下设置指定将以开始的部分。[ebs custom1]
和[ebs custom2]
用于 Amazon EBS 卷。
ebs_settings = custom1, custom2
ec2_iam_role
(可选)定义附加到集群中所有实例的 Amazon EC2 的现有 IAM 角色的名称。IAM 角色名称及其 Amazon 资源名称 (ARN) 是不同的。ARN 不能用作的参数ec2_iam_role. 如果指定了此选项,则忽略 additional_iam_policies 设置。建议您使用additional_iam_policies,而不是ec2_iam_role,因为添加了功能Amazon ParallelCluster通常需要新的权限。
没有默认值。
ec2_iam_role = ParallelClusterInstanceRole
efs_settings
(可选)指定与 Amazon EFS 文件系统相关的设置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅 。[efs]部分.
例如,以下设置指定将以开始的部分。[efs customfs]
用于 Amazon EFS 文件系统配置。
efs_settings = customfs
enable_efa
(可选)如果存在,则指定为计算节点启用 Elastic Fabric Adapter (EFA)。EFA 由特定实例类型支持(c5n.18xlarge
、c5n.metal
、g4dn.metal
、i3en.24xlarge
、i3en.metal
、m5dn.24xlarge
、m5n.24xlarge
、m5zn.12xlarge
、m5zn.metal
、r5dn.24xlarge
、r5n.24xlarge
、p3dn.24xlarge
, 和p4d.24xlarge
对于 x86-64 实例,c6gn.16xlarge
对于特定操作系统上的基于 ARM 的 Graviton2 实例)(base_os是alinux2
、centos7
、ubuntu1804
,或者ubuntu2004
对于 x86-64 实例,alinux2
、ubuntu1804
,或者ubuntu2004
对于基于 ARM 的 Graviton2 实例)。有关更多信息,请参阅 Elastic Fabric Adapter。如果queue_settings设置已定义,可以定义此设置,也可以定义enable_efa settings in the [queue]部分可以定义。应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placement 和 placement_group。
enable_efa = compute
在基于 ARM 的 Graviton2 实例上添加了对全民教育的 SupportAmazon ParallelCluster版本 2.10.1。
enable_efa_gdr
(可选) 从启动Amazon ParallelCluster版本 2.11.3,此设置无效。如果实例类型和操作系统都支持 Elastic Fabric Adapter (EFA),则始终启用对 gpudDirect RDMA(远程直接内存访问)的支持。
Amazon ParallelCluster版本 2.10.0 到 2.11.2:如果compute
,指定为计算节点启用对 GPudirect RDMA(远程直接内存访问)的 Elastic Fabric Adapter (EFA)) 支持。将此设置设置为compute
要求enable_efa设置compute
. EFA 对 GpuDirect RDMA 的支持由特定实例类型(p4d.24xlarge
) 在特定操作系统上 (base_os是alinux2
、centos7
、ubuntu1804
,或者ubuntu2004
)。如果queue_settings设置已定义,可以定义此设置,也可以定义enable_efa_gdr settings in the [queue]部分可以定义。应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placement 和 placement_group。
enable_efa_gdr = compute
对该项的支持enable_efa_gdr
增加了Amazon ParallelCluster版本 2.10.0。
enable_intel_hpc_platform
(可选)如果存在,则表示最终用户许可协议 = centos7
) 上支持 enable_intel_hpc_platform 设置。
默认值为 false
。
enable_intel_hpc_platform = true
这些区域有:enable_intel_hpc_platform参数不兼容Amazon基于 Graviton 的实例。
对该项的支持enable_intel_hpc_platform增加了Amazon ParallelCluster版本 2.5.0。
encrypted_ephemeral
(可选)使用 LUKS (Linux Unified Key Setup),通过无法恢复的内存中密钥对临时实例存储卷进行加密。
有关更多信息,请参阅 https://gitlab.com/cryptsetup/cryptsetup/blob/master/README.md
默认值为 false
。
encrypted_ephemeral = true
ephemeral_dir
(可选)定义将在其中挂载实例存储卷的路径(如果使用它们)。
默认值为 /scratch
。
ephemeral_dir = /scratch
extra_json
(可选)定义合并到Chef dna.json
. 有关更多信息,请参阅 构建自定义 Amazon ParallelCluster AMI。
默认值为 {}
。
extra_json = {}
从启动Amazon ParallelCluster为缩短启动时间,在启动节点时将默认跳过大多数安装配方以缩短启动时间。要以牺牲启动时间为代价运行所有安装配方以获得更好的向后兼容性,请添加"skip_install_recipes" : "no"
到cluster
键入extra_json设置设置。例如:
extra_json = { "cluster" : { "skip_install_recipes" : "no" } }
fsx_settings
(可选)指定用于定义 Lustre 配置的 FSx 的部分。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅 。[fsx]部分.
例如,以下设置指定将以开始的部分。[fsx fs]
用于 Lustre 配置的 FSx。
fsx_settings = fs
iam_lambda_role
(可选)定义现有的名称Amazon Lambda执行角色。此角色附加到集群中的所有 Lambda 函数。有关更多信息,请参阅 。Amazon Lambda执行角色中的Amazon Lambda开发人员指南.
从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。
IAM 角色名称及其 Amazon 资源名称 (ARN) 是不同的。ARN 不能用作的参数iam_lambda_role
. 如果两者都ec2_iam_role和iam_lambda_role
已定义,并且scheduler是sge
、slurm
,或者torque
,那么就不会创建任何角色。如果scheduler是awsbatch
,那么将在期间创建角色pcluster start. 有关示例策略,请参阅ParallelClusterLambdaPolicy使用SGE、Slurm,或者Torque和ParallelClusterLambdaPolicy,使用 awsbatch.
没有默认值。
iam_lambda_role = ParallelClusterLambdaRole
对该项的支持iam_lambda_role
增加了Amazon ParallelCluster版本 2.10.1。
initial_queue_size
(可选)设置要作为集群中的计算节点启动的 Amazon EC2 实例的初始数量。如果queue_settings设置已定义,那么必须删除此设置并替换为initial_count settings in the [compute_resource]部分.
从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。
此设置仅适用于传统计划程序(SGE、Slurm 和 Torque)。如果maintain_initial_size设置设置true
,然后initial_queue_size设置必须至少为一 (1)。
如果计划程序是 awsbatch
,请改用 min_vcpus。
默认值为 2
。
initial_queue_size = 2
key_name
(可选)命名用于启用对实例进行 SSH 访问的现有 Amazon EC2 key pair 的名称。
key_name = mykey
优化前Amazon ParallelCluster版本 2.11.0key_name
是必需的设置。
maintain_initial_size
从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。
(可选)为传统计划程序保持 Auto Scaling 组的初始大小 (SGE、Slurm, 和Torque)。
如果计划程序是 awsbatch
,请改用 desired_vcpus。
此设置是一个布尔标记。如果设置为true
,Auto Scaling 组的成员数量绝不会少于的值。initial_queue_size,以及的价值initial_queue_size必须为 1 (1) 或更大。集群仍可以扩展到 max_queue_size 的值。如果cluster_type = spot
然后 Auto Scaling 组的实例可能会中断,并且大小可能降至以下。initial_queue_size.
如果设置为false
,Auto Scaling 组的成员数可以缩减为零 (0),以防止在不需要资源时闲置。
如果queue_settings设置已定义,则必须删除此设置并替换为initial_count和min_count settings in the [compute_resource]部分.
默认值为 false
。
maintain_initial_size = false
master_instance_type
(可选)定义用于头节点的 Amazon EC2 实例类型。实例类型的体系结构必须与用于compute_instance_type设置设置。
在具有免费套餐的区域中,默认为免费套餐实例类型(t2.micro
要么t3.micro
)。在没有免费套餐的地区中,默认为t3.micro
. 有关的更多信息Amazon免费套餐,请参阅Amazon免费套餐问题
master_instance_type = t2.micro
优化前Amazon ParallelCluster版本 2.10.1,默认为t2.micro
在所有区域。InAmazon ParallelCluster版本 2.10.0,p4d.24xlarge
头节点不支持。对该项的支持Amazon基于 Graviton 的实例(例如A1
和C6g
增加了Amazon ParallelCluster版本 2.8.0。
master_root_volume_size
(可选)指定主节点根卷大小(以 GiB 为单位)。AMI 必须支持 growroot
。
默认值为 35
。
适用于Amazon ParallelCluster在 2.5.0 和 2.10.4 之间的版本,默认值为 25。优化前Amazon ParallelCluster版本 2.5.0,默认值为 20。
master_root_volume_size = 35
max_queue_size
(可选)设置集群中可以启动的 Amazon EC2 实例的最大数量。如果queue_settings设置已定义,那么必须删除此设置并替换为max_count settings in the [compute_resource]部分.
从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。
此设置仅适用于传统计划程序(SGE、Slurm 和 Torque)。
如果计划程序是 awsbatch
,请改用 max_vcpus。
默认值为 10
。
max_queue_size = 10
更新策略:可以在更新期间更改此设置,但如果值降低,则应停止计算队列。否则,可能会终止现有节点。
max_vcpus
(可选)指定计算环境中的最大 vCPU 数。仅在计划程序为 awsbatch
时使用。
默认值为 20
。
max_vcpus = 20
min_vcpus
(可选)保留 Auto Scaling 组的初始大小,以使用awsbatch
计划程序。
从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。
如果计划程序是 SGE、Slurm 或 Torque,请改用 maintain_initial_size。
计算环境中的成员数绝不会少于 min_vcpus 的值。
默认值为 0
。
min_vcpus = 0
placement
(可选)定义集群置放群组逻辑,并使整个集群或仅计算实例能够使用集群置放群组。
如果queue_settings设置已定义,那么应该删除此设置并替换为placement_group每个的设置[queue]部分. 如果同一置放群组用于不同的实例类型,则更有可能由于容量不足错误而导致请求失败。有关更多信息,请参阅 。实例容量不足中的适用于 Linux 实例的 Amazon EC2 用户指南. 多个队列只能共享置放群组,如果事先创建并在placement_group为每个队列设置。如果每个[queue]部分定义placement_group设置,那么头节点不能在队列的置放群组中。
有效选项是 cluster
或 compute
。
当计划程序为时,不使用此参数。awsbatch
.
默认值为 compute
。
placement = compute
placement_group
(可选)定义集群置放群组。如果queue_settings设置已定义,那么应该删除此设置并替换为placement_group settings in the [queue]部分.
有效选项包括以下值:
-
DYNAMIC
-
现有的 Amazon EC2 集群置放群组名称
当设置为 DYNAMIC
时,将唯一置放群组作为集群堆栈的一部分进行创建和删除。
当计划程序为时,不使用此参数。awsbatch
.
有关置放群组的更多信息,请参阅。置放群组中的适用于 Linux 实例的 Amazon EC2 用户指南. 如果同一置放群组用于不同的实例类型,则更有可能由于容量不足错误而导致请求失败。有关更多信息,请参阅 。实例容量不足中的适用于 Linux 实例的 Amazon EC2 用户指南.
没有默认值。
并非所有实例类型都支持集群置放群组。例如,默认实例类型为t3.micro
不支持集群置放群组。有关支持集群置放群组的实例类型列表的信息,请参阅集群置放群组规则和限制中的适用于 Linux 实例的 Amazon EC2 用户指南. 有关使用置放群组时的提示,请参阅置放群组和实例启动问题。
placement_group = DYNAMIC
post_install
(可选)指定在节点引导操作完成之后运行的安装后脚本的 URL。有关更多信息,请参阅 自定义引导操作。
使用时awsbatch
作为计划程序,安装后脚本仅在头节点上运行。
参数格式可以是 http://
或 hostname/path/to/script.sh
s3://
。bucketname/path/to/script.sh
没有默认值。
post_install = s3://
<bucket-name>
/my-post-install-script.sh
post_install_args
(可选)指定要传递到安装后脚本的用双引号引起的参数列表。
没有默认值。
post_install_args = "
argument-1
argument-2
"
pre_install
(可选)指定在任何节点部署引导操作启动之前运行的预安装脚本的 URL。有关更多信息,请参阅 自定义引导操作。
使用时awsbatch
作为计划程序,预安装脚本仅在头节点上运行。
参数格式可以是 http://
或 hostname/path/to/script.sh
s3://
。bucketname/path/to/script.sh
没有默认值。
pre_install = s3://
<bucket-name>
/my-pre-install-script.sh
pre_install_args
(可选)指定要传递到预安装脚本的用双引号引起的参数列表。
没有默认值。
pre_install_args = "
argument-3
argument-4
"
proxy_server
(可选)定义 HTTP 或 HTTPS 代理服务器,通常为http://
.x.x.x.x:8080
没有默认值。
proxy_server = http://
10.11.12.13:8080
queue_settings
(可选)指定集群使用队列而不是同质计算队列,以及[queue]部分被使用。第一个[queue]部分列出的是默认的调度程序队列。这些区域有:queue
段名称必须以小写字母开头,包含不超过 30 个字符,并且只包含小写字母、数字和连字符 (-)。
queue_settings仅在scheduler设置为slurm
. 这些区域有:cluster_type、compute_instance_type、initial_queue_size、maintain_initial_size、max_queue_size、placement、placement_group, 和spot_price不能指定设置。这些区域有:disable_hyperthreading和enable_efa可在中指定设置[cluster]部分或者[queue]部分,但不能同时使用。
最多五 (5)[queue]部分支持。
有关更多信息,请参阅 。[queue]部分.
例如,以下设置指定将以开始的部分。[queue q1]
和[queue q2]
被使用。
queue_settings = q1, q2
对该项的支持queue_settings增加了Amazon ParallelCluster版本 2.9.0。
raid_settings
(可选)标识[raid]
部分与 Amazon EBS 卷 RAID 配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅 。[raid]部分.
例如,以下设置指定将以开始的部分。[raid rs]
用于 Auto Scaling 配置。
raid_settings = rs
s3_read_resource
(可选)指定向的 Amazon S3 资源Amazon ParallelCluster授予节点只读访问权限。
例如,arn:aws:s3:::
提供对的只读访问权限my_corporate_bucket
*my_公司ate_bucket
存储桶以及存储桶中的对象。
请参阅使用 Amazon S3有关格式的详细信息。
没有默认值。
s3_read_resource = arn:aws:s3:::
my_corporate_bucket
*
s3_read_write_resource
(可选)指定 Amazon S3 资源,Amazon ParallelCluster授予节点的读/写访问权限。
例如,arn:aws:s3:::
提供对中的所有对象的读/写访问权限my_corporate_bucket
/Development/*Development
的文件夹my_公司ate_bucket
存储桶。
请参阅使用 Amazon S3有关格式的详细信息。
没有默认值。
s3_read_write_resource = arn:aws:s3:::
my_corporate_bucket
/*
scaling_settings
标识[scaling]
部分带有 Auto Scaling 配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅 。[scaling]部分.
例如,以下设置指定将以开始的部分。[scaling custom]
用于 Auto Scaling 配置。
scaling_settings = custom
scheduler
(必需)定义集群计划程序。
有效选项包括以下值:
awsbatch
-
Amazon Batch
sge
-
注意 从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。
Son of Grid Engine (SGE)
slurm
-
Slurm Workload Manager (Slurm)
torque
-
注意 从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。
Torque Resource Manager (Torque)
有关 awsbatch
计划程序的更多信息,请参阅联网设置。
优化前Amazon ParallelCluster版本 2.7.0scheduler
参数是可选的,默认值为sge
. 从启动Amazon ParallelCluster版本 2.7.0scheduler
参数是必需的。
scheduler = slurm
shared_dir
(可选)定义在其中挂载共享 Amazon EBS 卷的路径。
请勿将此选项与多个 Amazon EBS 卷一起使用。相反,请提供shared_dir每个值下[ebs]部分.
请参阅[ebs]部分有关使用多个 Amazon EBS 卷的详细信息。
默认值为 /shared
。
以下示例显示在上挂载的共享 Amazon EBS 卷。/myshared
.
shared_dir = myshared
spot_bid_percentage
(可选)设置用于计算的最高 Spot 价格的按需百分比。ComputeFleet,何时awsbatch
是调度程序。
如果未指定,则选择当前 Spot 市场价格,最高为按需价格。
spot_bid_percentage = 85
spot_price
从版本 2.11.5 开始,Amazon ParallelCluster不支持使用SGE要么Torque计划程序。
(可选)设置的最高竞价价格ComputeFleet在传统的调度程序上(SGE、Slurm, 和Torque)。仅当 cluster_type 设置设为 spot
时使用。如果您没有指定值,则按 Spot 价格进行收费,最高为按需价格。如果queue_settings设置已定义,那么必须删除此设置并替换为spot_price settings in the [compute_resource]部分.
如果计划程序为 awsbatch
,请改用 spot_bid_percentage。
有关查找满足您需求的 Spot 实例的帮助信息,请参阅Spot 实例顾问
spot_price = 1.50
InAmazon ParallelCluster如果版本 2.5.0cluster_type = spot
但是spot_price未指定,则将以ComputeFleet失败。这已修复Amazon ParallelCluster版本 2.5.1。
tags
(可选)定义要由使用的标签Amazon CloudFormation.
如果通过 --tags 指定了命令行标签,则它们将与配置标签合并。
命令行标签覆盖具有相同键的配置标签。
标签是 JSON 格式的。请勿在大括号外使用引号。
有关更多信息,请参阅 。Amazon CloudFormation资源标签中的Amazon CloudFormation用户指南.
tags = {"key" : "value", "key2" : "value2"}
更新策略不支持更改tags
设置Amazon ParallelCluster版本 2.8.0 到版本 2.9.1。
template_url
(可选)定义的路径Amazon CloudFormation用于创建集群的模板。
更新使用最初用于创建堆栈的模板。
默认值为 https://
。aws_region_name
-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-version
.cfn.json
这是一个高级参数。任何更改此设置均由您自行承担风险。
template_url = https://us-east-1-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-2.11.5.cfn.json
vpc_settings
(必需)标识[vpc]
部分,其中将在其中部署集群的 Amazon VPC 配置。节名称必须以字母开头,包含不超过 30 个字符,并且只包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅 。[vpc]部分.
例如,以下设置指定将以开始的部分。[vpc public]
用于亚马逊 VPC 配置。
vpc_settings = public