文档历史记录 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

文档历史记录

下表描述了 Amazon ParallelCluster 用户指南 的主要更新和新功能。我们还经常更新文档来处理您发送给我们的反馈意见。

变更说明日期

Amazon ParallelCluster版本 3.1.2 已发布

Amazon ParallelCluster版本 3.1.2 已发布。

变化:

  • 将 Surm 升级到版本21.08.6(来自的21.08.5)。

错误修复:

  • 修复的更新/etc/hosts当群集部署在没有互联网访问的子网中时,计算节点上的文件。

  • 修复计算节点引导以在加入群集之前等待临时驱动器初始化。

有关更改的详细信息,请参阅CHANGELOG的文件aws-Parallel集群GitHub 上的软件包。

2022年3月2日

Amazon ParallelCluster版本 2.11.5 已发布

Amazon ParallelCluster版本 2.11.5 已发布。

增强功能:

  • 增加了对 的支持NEW_CHANGED_DELETED作为 FSx for Lustre 的价值AutoImportPolicy选项。

  • 删除对 SGE 和扭矩计划程序的支持。

  • 禁用log4j-cve-2021-44228-hotpatch在 Amazon Linux 上提供服务,以避免潜在的性能下降。

变化:

  • 将 NVIDIA 驱动程序升级到版本470.103.01(来自的470.82.01)。

  • 将 NVIDIA Fabric 管理器升级到版本470.103.01(来自的470.82.01)。

  • 将 CUDA 库升级到版本11.4.4(来自的11.4.3)。

  • Intel MPI更新至 2021 年版更新 4(从 2019 年版更新 8 进行更新)。有关更多信息,请参阅 。英特尔® MPI 库 2021 年更新 4.

  • 将头节点创建超时时间延长至 1 小时。

错误修复:

  • 修复通过浏览器的 DCV 连接。

  • 修复 YAML 引用以防止自定义标签被解析为数字。

有关更改的详细信息,请参阅CHANGELOG的文件aws-Parallel集群GitHub 上的软件包。

2022 年 3 月 1 日

Amazon ParallelCluster版本 3.1.1 已发布

Amazon ParallelCluster版本 3.1.1 已发布。

  • 添加对多个用户群集环境的支持与 Active Directory (AD) 域集成通过管理Amazon Directory Service.

  • 增加了对 的支持UseEc2Hostnames在集群配置文件中。如果设置为 true,则为计算节点使用 EC2 默认主机名(例如 ip-1-2-3-4)。

  • 添加对集群创建的支持无法访问互联网的子网.

  • 为每个队列添加对多种计算实例类型的支持。

  • 在使用 NVIDIA 卡的 ARM 实例上添加对使用 Surm 进行 GPU 调度的支持。

  • 添加缩写标志cluster-name(-n),region(-r),image-id(-i) 和cluster-configuration/image-configuration(-c) 到Amazon ParallelClusterCLI。

  • 增加了对 的支持NEW_CHANGED_DELETEDFSx for LustreAutoImportPolicy参数。

  • Addparallelcluster:compute-resource-name标签到 EC2LaunchTemplates计算节点使用的资源。

  • 改进在群集中创建的安全组,以便允许来自定义安全组的入站连接SecurityGroups为某些头节点和/或队列指定了参数。

  • 为 ARM 安装 NVIDIA 驱动程序和 CUDA 库。

变化:

  • 将 Surm 升级到版本21.08.5(来自的20.11.8)。

  • 将 Surm 插件升级到版本21.08(来自的20.11)。

  • 将 NICE DCV 升级到版本2021.3-11591(来自的2021.1-10851)。

  • 将 NVIDIA 驱动程序升级到版本470.103.01(来自的470.57.02)。

  • 将 NVIDIA Fabric 管理器升级到版本470.103.01(来自的470.57.02)。

  • 将 CUDA 升级到版本11.4.4(来自的11.4.0)。

  • Intel MPI更新至 2021 年版更新 4(从 2019 年版更新 8 进行更新)。有关更多信息,请参阅 。英特尔® MPI 库 2021 年更新 4.

  • 将 pMix 升级到版本3.2.3(来自的3.1.5)。

  • 删除故障计算节点的转储/home/logs/compute. 计算节点日志文件可在 CloudWatch 和 EC2 控制台日志中找到。

  • 启用抑制的潜力SlurmQueuesComputeResources长度验证器。

  • 在 Amazon Linux 2 上的实例启动时禁用包更新。

  • 构建时禁用 EC2 ImageBuilder 增强的图像元数据Amazon ParallelCluster自定义镜像。

  • 显式设置cloud-init要成为 EC2 的数据源。这可以节省 Ubuntu 和 CentOS 平台的启动时间。

  • 在计算队列启动模板名称中使用计算资源名称而不是实例类型。

  • 将 stderr 和 stdout 重定向到 CLI 日志文件,以防止 pcluster CLI 输出中出现不需要的文本。

  • 将配置/安装配方移动到将调用的食谱与主食谱分开。维护现有入口点并向后兼容。

  • 在 AMI 构建时下载英特尔 HPC 平台的依赖关系,以避免在群集创建期间联系互联网。

  • 请勿剥离-来自配置 Surm 节点时的计算资源名称。

  • 没有安装 NVIDIA 驱动程序时,不要在 Surm 中配置 GPU。

  • Fixecs:ListContainerInstances进行权限BatchUserRole.

  • 修复在没有指定前缀时导出集群日志的问题,之前导出到Noneprefix.

  • 修复群集更新失败的情况下不执行回滚。

  • Fixecs:ListContainerInstances进行权限BatchUserRole.

  • FixRootVolume的模式HeadNode如果不受支持,则提出错误KmsKeyId已指定。

  • 修复亚马逊 FSx 缺少要在 CloudWatch 控制面板中显示的指标。

  • FixEfaSecurityGroupValidator. 以前,当提供自定义安全组并启用 EFA 时,它有可能产生错误失败。

有关更改的详细信息,请参阅CHANGELOG的文件aws-Parallel集群aws-并行群集-食谱, 和aws-并行群集节点GitHub 上的软件包。

2022 年 2 月 10 日

Amazon ParallelCluster版本 3.0.3 已发布

Amazon ParallelCluster版本 3.0.3 已发布。

有关更改的详细信息,请参阅CHANGELOG的文件aws-Parallel集群aws-并行群集-食谱GitHub 上的软件包。

2022年1月17 日

Amazon ParallelCluster版本 2.11.4 已发布

Amazon ParallelCluster版本 2.11.4 已发布。

更改包括:

  • CentOS已删除 8 支持。CentOS8 将于 2021 年 12 月 31 日到达寿命结束(EOL)。

  • 升级Slurm Workload Manager到 20.11.8 版本。

  • 将 Cinc 客户端升级为17.2.29.

  • NICE DCV已更新至尼斯 DCV 2021.2-11190。有关更多信息,请参阅 。DCV 2021.2-11190— 2021 年 10 月 11 日中的NICE DCV 管理员指南.

  • 将 NVIDIA 驱动程序升级到版本470.82.01(来自的460.73.01)。

  • 将 CUDA 库升级到版本11.4.3(来自的11.3.0)。

  • 将 NVIDIA 结构管理器升级为470.82.01.

  • 在 Amazon Linux 2 上的实例启动时禁用包更新。

  • 禁用无人值守的软件包更新UbuntuAmazon Linux 2.

  • 安装 Python 3Amazon CloudFormation帮助程序脚本上CentOS7 和Ubuntu18.04。(这些已经在亚马逊 Linux 2 上使用过,Ubuntu20.04。)

修复包括:

  • 禁用更新ec2_iam_role参数。

  • 修复CpuOptions在启动模板中的配置T2实例。

有关更改的详细信息,请参阅CHANGELOG的文件aws-Parallel集群aws-并行群集-食谱aws-并行群集节点GitHub 上的软件包。

2021 年 12 月 20 日

Amazon ParallelCluster版本 3.0.2 已发布

Amazon ParallelCluster版本 3.0.2 已发布。

升级Elastic Fabric Adapter安装到 1.14.1
  • EFA 配置:efa-config-1.9-1(来自的efa-config-1.9

  • EFA 配置文件:efa-profile-1.5-1(来自的efa-profile-1.5

  • EFA 内核模块:efa-1.14.2(来自的efa-1.13.0

  • RDMA 核心:rdma-core-37.0(来自的rdma-core-35

  • Libfabric:libfabric-1.13.2(来自的libfabric-1.13.0

  • Open MPI:openmpi40-aws-4.1.1-2(没有变化)

如果实例类型支持,则始终启用 gpuDirect RDMA。这些区域有:gdrSupport配置选项没有效果。

.

有关更改的详细信息,请参阅CHANGELOG的文件aws-Parallel集群aws-并行群集-食谱aws-并行群集节点GitHub 上的软件包。

2021 年 11 月 5 日

Amazon ParallelCluster版本 2.11.3 已发布

Amazon ParallelCluster版本 2.11.3 已发布。

Fixpcluster createami因为失败Son of Grid Engine来源不在arc.liv.ac.uk.
升级Elastic Fabric Adapter安装程序到 1.14.1(从 1.13.0 起)
  • EFA 配置:efa-config-1.9-1(来自的efa-config-1.9

  • EFA 配置文件:efa-profile-1.5-1(没有变化)

  • EFA 内核模块:efa-1.14.2(来自的efa-1.13.0

  • RDMA 核心:rdma-core-37.0(来自的rdma-core-35.0amzn

  • Libfabric:libfabric-1.13.2(来自的libfabric-1.13.0amzn1.0

  • Open MPI:openmpi40-aws-4.1.1-2(没有变化)

如果实例类型支持,则始终启用 gpuDirect RDMA。

这些区域有:enable_efa_gdrenable_efa_gdr配置选项没有效果.

有关更改的详细信息,请参阅CHANGELOG的文件aws-Parallel集群aws-并行群集-食谱aws-并行群集节点GitHub 上的软件包。

2021 年 11 月 3 日

Amazon ParallelCluster版本 3.0.1 已发布

Amazon ParallelCluster版本 3.0.1 已发布。

集群配置迁移工具

客户现在可以从Amazon ParallelCluster基于 YAML 的版本 2 格式Amazon ParallelCluster版本 3 格式。有关更多信息,请参阅 pcluster3-config-converter

头节点可以停止

停止计算队列后,头节点可以停止并稍后使用 Amazon EC2 控制台或停止实例 Amazon CLI命令。

默认区域从中读取~/.aws/config文件

对于pcluster命令,如果在配置文件、环境中或命令行中未指定 Region,则在region设置在[default]的 部分~/.aws/config已使用文件。

有关更改的详细信息,请参阅CHANGELOG的文件aws-Parallel集群aws-并行群集-食谱aws-并行群集节点GitHub 上的软件包。

2021 年 10 月 27 日

Amazon ParallelCluster版本 3.0.0 已发布

Amazon ParallelCluster版本 3.0.0 已发布。

通过 Amazon API Gateway Support 集群管理

客户现在可以使用 Amazon API Gateway 通过 HTTP 终端节点管理和部署集群。这为脚本化或事件驱动的工作流开辟了新的可能性。

这些区域有:Amazon ParallelCluster为了与此 API 的兼容性,命令行界面 (CLI) 也进行了重新设计,并包括了一个新的 JSON 输出选项。此新功能使客户也可以使用 CLI 实施类似的构建块功能。

改进了自定义 AMI 创建

客户现在可以使用 EC2 Image Builder 访问更强大的流程来创建和管理自定义 AMI。自定义 AMI 现在可以通过单独的Amazon ParallelCluster配置文件,可以使用pcluster build-image中的命令Amazon ParallelCluster命令行界面。

有关更改的详细信息,请参阅CHANGELOG的文件aws-Parallel集群aws-并行群集-食谱aws-并行群集节点GitHub 上的软件包。

2021 年 9 月 10 日

Amazon ParallelCluster版本 2.11.2 已发布

Amazon ParallelCluster版本 2.11.2 已发布。

更改包括:

  • 如果在基本 AMI 中安装了 EFA,则不要在引导时启用 gpudDirect RDMA (GDR) 的情况下安装 EFA。

  • 的锁定版本nvidia-fabricmanager软件包与安装的 NVIDIA 驱动程序版本保持同步Amazon ParallelCluster.

  • Slurm:修复节点开机时集群停止并重新启动时引起的问题。

  • Elastic Fabric Adapter安装程序更新为 1.13.0:

    • EFA 配置:efa-config-1.9(没有变化)

    • EFA 配置文件:efa-profile-1.5-1(没有变化)

    • EFA 内核模块:efa-1.13.0(没有变化)

    • RDMA 核心:rdma-core-35.0amzn(来自的rdma-core-32.1amzn

    • Libfabric:libfabric-1.13.0amzn1.0(来自的libfabric-1.11.2amzn1.1

    • Open MPI:openmpi40-aws-4.1.1-2(没有变化)

  • 将自定义 AMI 与预安装的 EFA 软件包结合使用时,在节点引导时不会对 EFA 进行任何更改。原始的 EFA 软件包部署将被保留。

有关更改的更多详细信息,请参阅aws-Parallel集群aws-并行群集-食谱GitHub 上的软件包。

2021 年 8 月 27 日

Amazon ParallelCluster版本 2.11.1 已发布

Amazon ParallelCluster版本 2.11.1 已发布。

更改包括:

  • 使用装载文件系统noatimemount 选项可在读取文件时停止录制上次访问时间。这提高了远程文件系统的性能。

  • Elastic Fabric Adapter安装程序更新为 1.12.3:

    • EFA 配置:efa-config-1.9(来自的efa-config-1.8-1

    • EFA 配置文件:efa-profile-1.5-1(没有变化)

    • EFA 内核模块:efa-1.13.0(来自的efa-1.12.3

    • RDMA 核心:rdma-core-32.1amzn(无更改)

    • Libfabric:libfabric-1.11.2amzn1.1(无更改)

    • Open MPI:openmpi40-aws-4.1.1-2(没有变化)

  • 重试安装aws-parallelcluster使用时在头节点上打包Amazon Batch作为调度程序。

  • 在建造时避免失败SGE在具有超过 31 个 vCPUs 的实例类型上。

  • 已固定至 Amazon CloudWatch 代理版本 1.247347.6,以避免版本 1.247348.0 中出现的问题。

有关更改的更多详细信息,请参阅aws-Parallel集群aws-并行群集-食谱GitHub 上的软件包。

2021 年 7 月 23 日

Amazon ParallelCluster版本 2.11.0 已发布

Amazon ParallelCluster版本 2.11.0 已发布。

更改包括:

  • 添加了对 的支持Ubuntu20.04 (ubuntu2004) 并删除了对Ubuntu16.04 (ubuntu1604)和 Amazon Linux (alinux)。Amazon Linux 2 (alinux2)仍完全受支持。有关更多信息,请参阅 base_os

  • 删除了对 3.6 以下 Python 版本的支持。

  • 默认的根卷大小增加到 35 GiB (GiB)。有关更多信息,请参阅 compute_root_volume_sizemaster_root_volume_size

  • Elastic Fabric Adapter安装程序更新为 1.12.2:

    • EFA 配置:efa-config-1.8-1(来自的efa-config-1.7

    • EFA 配置文件:efa-profile-1.5-1(来自的efa-profile-1.4

    • EFA 内核模块:efa-1.12.3(来自的efa-1.10.2

    • RDMA 核心:rdma-core-32.1amzn(来自的rdma-core-31.2amzn

    • Libfabric:libfabric-1.11.2amzn1.1(来自的libfabric-1.11.1amzn1.0

    • Open MPI:openmpi40-aws-4.1.1-2(来自的openmpi40-aws-4.1.0

  • 升级Slurm到版本20.11.7(来自的20.02.7)。

  • 在上安装 SSM 代理centos7centos8. (SSM 代理程序已预装在alinux2ubuntu1804, 和ubuntu2004。)

  • SGE:始终使用短名作为主机名过滤器qstat.

  • 使用实例元数据服务版本 2 (IMDSv2) 而不是实例元数据服务版本 1 (IMDSv1) 来检索实例元数据。有关更多信息,请参阅适用于 Linux 的 Amazon EC2 用户指南 中的实例元数据和用户数据

  • 将 NVIDIA 驱动程序升级到版本460.73.01(来自的450.80.02)。

  • 将 CUDA 库升级到版本11.3.0(来自的11.0)。

  • 将 NVIDIA 结构管理器升级为nvidia-fabricmanager-460.

  • 升级中使用的 PythonAmazon ParallelClustervirtualenv3.7.10(来自的3.6.13)。

  • 将 Cinc 客户端升级为16.13.16.

  • 升级第三方依赖项aws-并行群集-食谱

    • apt-7.4.0(来自的apt-7.3.0)。

    • iptables-8.0.0(来自的iptables-7.1.0)。

    • line-4.0.1(来自的line-2.9.0)。

    • openssh-2.9.1(来自的openssh-2.8.1)。

    • pyenv-3.4.2(来自的pyenv-3.1.1)。

    • selinux-3.1.1(来自的selinux-2.1.1)。

    • ulimit-1.1.1(来自的ulimit-1.0.0)。

    • yum-6.1.1(来自的yum-5.1.0)。

    • yum-epel-4.1.2(来自的yum-epel-3.3.0)。

有关更改的更多详细信息,请参阅aws-Parallel集群aws-并行群集-食谱, 和aws-并行群集节点GitHub 上的软件包。

2021 年 7 月 1 日

Amazon ParallelCluster版本 2.10.4 已发布

Amazon ParallelCluster版本 2.10.4 已发布。

更改包括:

  • 升级Slurm到版本20.02.7(来自的20.02.4)。

有关更改的更多详细信息,请参阅 CHANGELLOG 文件以获取aws-Parallel集群GitHub 上的软件包。

2021 年 5 月 15 日

Amazon ParallelCluster版本 2.10.3 已发布

Amazon ParallelCluster版本 2.10.3 已发布。

更改包括:

  • 添加了对 的支持Ubuntu基于 ARM 的 18.04 和 Amazon Linux 2Amazon中的引力实例Amazon中国Amazon GovCloud (US)地区。

  • Elastic Fabric Adapter安装程序更新为 1.11.2:

    • EFA 配置:efa-config-1.7(没有变化)

    • EFA 配置文件:efa-profile-1.4(来自的efa-profile-1.3

    • EFA 内核模块:efa-1.10.2(没有变化)

    • RDMA 核心:rdma-core-31.2amzn(无更改)

    • Libfabric:libfabric-1.11.1amzn1.0(无更改)

    • Open MPI:openmpi40-aws-4.1.0(没有变化)

有关更改的更多详细信息,请参阅 CHANGELLOG 文件以获取aws-Parallel集群GitHub 上的软件包。

2021 年 3 月 18 日

Amazon ParallelCluster版本 2.10.2 已发布

Amazon ParallelCluster版本 2.10.2 已发布。

更改包括:

  • 改进群集配置验证以在调用 Amazon EC2 时使用集群目标 AMIRunInstances中的 API 操作--dry-run来自的。

  • 更新中使用的 Python 版本Amazon ParallelCluster虚拟环境升至 3.6.13。

  • Fixsanity_check对于 Arm 实例类型。

  • Fixenable_efa使用时centos8使用Slurm调度程序或 Arm 实例类型。

  • 运行apt update在非交互模式下 (-y)。

  • Fixencrypted_ephemeral= truealinux2centos8.

有关更改的更多详细信息,请参阅 CHANGELLOG 文件以获取aws-Parallel集群GitHub 上的软件包。

2021 年 3 月 2 日

Amazon ParallelCluster版本 2.10.1 已发布

Amazon ParallelCluster版本 2.10.1 已发布。

更改包括:

  • 增加了对非洲(开普敦)的支持(af-south-1),欧洲(米兰)(me-south-1)和中东(巴林)(me-south-1) 地区。启动时,支持在以下方面受到限制:

    • 这些区域中的任何一个都不支持 Lustre 和基于 ARM 的 Graviton 实例的 FSx。

    • Amazon Batch非洲(开普敦)不支持。

    • Amazon EBSio2gp3非洲(开普敦)和欧洲(米兰)区域不支持卷类型。

  • 添加了对 Amazon EBS 的支持io2gp3卷类型。有关更多信息,请参阅 。[ebs]部分[raid]部分.

  • 添加了对 的支持Elastic Fabric Adapter在基于 ARM 的 Graviton2 实例上运行alinux2ubuntu1804,或者ubuntu2004. 有关更多信息,请参阅 Elastic Fabric Adapter

  • 在 Arm AMI 上安装 Arm 性能库 20.2.1 (alinux2centos8, 和ubuntu1804)。有关更多信息,请参阅 Arm 性能库

  • Intel MPI更新至 2019 年版更新 8(从 2019 年版更新 7 进行更新)。有关更多信息,请参阅 。英特尔® MPI 库 2019 更新 8.

  • 已删除Amazon CloudFormation DescribeStacks来自的 API 操作调用Amazon BatchDocker 入口点来结束因限制导致的作业失败Amazon CloudFormation.

  • 改进了对 Amazon EC2 的调用DescribeInstanceTypes验证集群配置时调用 API 操作。

  • 在为awsbatch计划程序。

  • 默认的实例类型从硬编码t2.micro实例类型改为该地区的免费套餐实例类型(t2.micro要么t3.micro,取决于地区)。没有免费套餐的地区默认为t3.micro实例类型。

  • Elastic Fabric Adapter安装程序更新为 1.11.1:

    • EFA 配置:efa-config-1.7(来自的efa-config-1.5

    • EFA 配置文件:efa-profile-1.3(来自的efa-profile-1.1

    • EFA 内核模块:efa-1.10.2(没有变化)

    • RDMA 核心:rdma-core-31.2amzn(来自的rdma-core-31.amzn0

    • Libfabric:libfabric-1.11.1amzn1.0(来自的libfabric-1.10.1amzn1.1

    • Open MPI:openmpi40-aws-4.1.0(来自的openmpi40-aws-4.0.5

  • 这些区域有:vpc_settingsvpc_id, 和master_subnet_id现在需要参数。

  • 这些区域有:nfsd头节点中的守护进程现在设置为至少使用 8 个线程。如果有 8 个以上的内核,它将使用与核心一样多的线程。何时ubuntu1604使用,设置仅在重新启动节点后才会更改。

  • NICE DCV已更新至尼斯 DCV 2020.2-9662。有关更多信息,请参阅 。DCV 2020.2-9662— 2020 年 12 月 4 日中的NICE DCV 管理员指南.

  • 英特尔 MPI 和 HPC 软件包Amazon ParallelCluster从 Amazon S3 中提取。它们不再是从英特尔 yum 回购库中提取的。

  • 更改了默认设置systemd运行级别到multi-user.target在创建官方期间在所有操作系统上Amazon ParallelClusterAMI。运行级别设置为graphical.target仅当启用 DCV 时才在头节点上。这可以防止图形服务(例如x/gdm) 不需要它们的时候运行。

  • 启用了支持p4d.24xlarge头节点上的实例。

  • 注册时增加最大重试次数Slurm在 Amazon Route 53 中。

有关更改的更多详细信息,请参阅aws-Parallel集群aws-并行群集-食谱, 和aws-并行群集节点GitHub 上的软件包。

2020 年 12 月 22 日

Amazon ParallelCluster版本 2.10.0 已发布

Amazon ParallelCluster版本 2.10.0 已发布。

更改包括:

  • 添加了对 的支持CentOS总共 8Amazon Web Services 区域(之外的Amazon中国AmazonGovCloud (US) 区域)。删除了对CentOS6.

  • 添加了对 的支持p4d.24xlarge计算节点的实例。

  • 通过使用新的在 EFA 上增加了对 NVIDIA gpuDirect RDMA 的支持enable_efa_gdr设置。

  • 增加了对 Amazon FSx Lustre 功能的支持。

  • 添加了 Amazon CloudWatch 控制面板,其中包括头节点指标和轻松访问群集日志。有关更多信息,请参阅 亚马逊CloudWatch仪表板

  • 添加了对使用现有 Amazon S3 存储桶存储群集配置信息的支持,使用cluster_resource_bucket设置。

  • 增强pcluster createami命令。

    • 添加了--post-install参数以在构建 AMI 时使用安装后脚本。

    • 添加了一个验证步骤,当使用由其他版本创建的基本 AMI 时失败Amazon ParallelCluster.

    • 添加了在所选操作系统与基本 AMI 中的操作系统不同时失败的验证步骤。

    • 添加了对使用Amazon ParallelCluster基本 AMI。

  • 增强pcluster update命令。

    • 这些区域有:tags现在可以在更新期间更改设置。

    • 现在可以在更新期间调整队列的大小,而无需停止计算队列

  • 添加了all_or_nothing_batch为的配置参数slurm_resume脚本。何时Trueslurm_resume只有在中的所有待处理作业所需的所有实例时才会成功Slurm将可用。有关更多信息,请参阅 。简介all_or_nothing_batch启动中的Amazon ParallelClusterGitHub 上的 Wiki。

  • Elastic Fabric Adapter安装程序更新为 1.10.1:

    • EFA 配置:efa-config-1.5(来自的efa-config-1.4

    • EFA 配置文件:efa-profile-1.1(来自的efa-profile-1.0.0

    • EFA 内核模块:efa-1.10.2(来自的efa-1.6.0

    • RDMA 核心:rdma-core-31.amzn0(来自的rdma-core-28.amzn0

    • Libfabric:libfabric-1.11.1amzn1.0(来自的libfabric-1.10.1amzn1.1

    • Open MPI:openmpi40-aws-4.0.5(来自的openmpi40-aws-4.0.3

  • 在Amazon GovCloud (US)地区,启用对 NICE DCV 的支持和Amazon Batch.

  • 在Amazon中国地区,启用对 Amazon FSx for Lustre 的支持。

  • 将 NVIDIA 驱动程序升级到 450.80.02 版本(从 450.51.05 起)。

  • 安装 NVIDIA 结构管理器以在支持的平台上启用 NVIDIA nvSwitch。

  • 已删除默认区域us-east-1. 默认使用此查找顺序。

    • 在中指定的区域-r要么--region参数。

    • AWS_DEFAULT_REGION环境变量。

    • aws_region_name设置在[aws]部分的Amazon ParallelCluster配置文件(默认为~/.parallelcluster/config)。

    • region设置在[default]的 部分Amazon CLI配置文件(默认为~/aws/config)。

有关更改的更多详细信息,请参阅aws-Parallel集群aws-并行群集-食谱, 和aws-并行群集节点GitHub 上的软件包。

2020 年 11 月 18 日

Amazon ParallelCluster版本 2.9.0 已发布

Amazon ParallelCluster版本 2.9.0 已发布。

更改包括:

  • 添加了对计算队列中的多个队列和多个实例类型的支持,当与Slurm Workload Manager. 使用队列时,不再使用 Auto Scaling 组Slurm. 现在,随集群创建了 Amazon Route 53 托管区域,用于计算节点的 DNS 解析时Slurm使用调度程序。有关更多信息,请参阅 多队列模式

  • 添加了对 的支持NICE DCV在基于 ArmaAmazon基于 Graviton 的实例。

  • 添加了对在启动模板中不支持 CPU 选项的实例类型禁用超线程的支持(例如*.metal实例类型)。

  • 为从头节点共享的文件系统添加了对 NFS 4 的支持。

  • 删除了依赖项cfn-init当引导计算节点以避免限制时Amazon CloudFormation当大量节点加入群集时。

  • Elastic Fabric Adapter安装程序更新为 1.9.5:

    • EFA 配置:efa-config-1.4(来自的efa-config-1.3

    • EFA 配置文件:efa-profile-1.0.0(new)

    • 内核模块:efa-1.6.0(无更改)

    • RDMA 核心:rdma-core-28.amzn0(无更改)

    • Libfabric:libfabric-1.10.1amzn1.1(无更改)

    • Open MPI:openmpi40-aws-4.0.3(没有变化)

  • 升级Slurm到版本20.02.4(来自的19.05.5)。

  • NICE DCV已更新至尼斯 DCV 2020.1-9012。有关更多信息,请参阅 。DCV 2020.1-9012— 2020 年 8 月 24 日发行说明中的NICE DCV 管理员指南.

  • 装载共享 NFS 驱动器时,请使用头节点私有 IP 地址而不是主机名。

  • 在 CloudWatch Logs 中添加了新的日志流:chef-clientclustermgtdcomputemgtdslurm_resume, 和slurm_suspend.

  • 增加了对预安装和安装后脚本中的队列名称的支持。

  • 在Amazon GovCloud (US)区域,请使用 Amazon DynamoDB 按需计费选项。有关更多信息,请参阅 。按需模式中的Amazon DynamoDB 开发人员指南.

有关更改的更多详细信息,请参阅aws-Parallel集群aws-并行群集-食谱, 和aws-并行群集节点GitHub 上的软件包。

2020 年 9 月 11 日

Amazon ParallelCluster版本 2.8.1 已发布

Amazon ParallelCluster版本 2.8.1 已发布。

更改包括:

  • 禁用 NICE DCV 会话的屏幕锁定以防止用户被锁定。

  • Fixpcluster configure包括基于 ARM 的时候Amazon基于 Graviton 的实例类型。

有关更改的更多详细信息,请参阅aws-Parallel集群aws-并行群集-食谱, 和aws-并行群集节点GitHub 上的软件包。

2020 年 8 月 4 日

Amazon ParallelCluster版本 2.8.0 已发布

Amazon ParallelCluster版本 2.8.0 已发布。

更改包括:

  • 添加了对基于 ARM 的支持Amazon基于 Graviton 的实例(例如A1C6g)。

  • 增加了对 Amazon FSx for Lustre 的自动每日备份功能的支持。有关更多信息,请参阅 automatic_backup_retention_dayscopy_tags_to_backupsdaily_automatic_backup_start_timefsx_backup_id

  • 从中删除了对 Berkshelf 的依赖项pcluster createami.

  • 改善了的稳健性和用户体验pcluster update. 有关更多信息,请参阅 使用 pcluster update

  • Elastic Fabric Adapter安装程序更新为 1.9.4:

    • 内核模块:efa-1.6.0(从进行更新efa-1.5.1

    • RDMA 核心:rdma-core-28.amzn0(从进行更新rdma-core-25.0

    • Libfabric:libfabric-1.10.1amzn1.1(从进行更新libfabric-aws-1.9.0amzn1.1

    • Open MPI:openmpi40-aws-4.0.3(没有变化)

  • 将 NVIDIA 驱动程序升级到特斯拉 440.95.01 版CentOS6 和版本 450.51.05 适用于所有其他发行版。

  • 将 CUDA 库升级到版本 11.0 以外的所有发行版CentOS6.

有关更改的更多详细信息,请参阅aws-Parallel集群aws-并行群集-食谱, 和aws-并行群集节点GitHub 上的软件包。

2020 年 7 月 23 日

Amazon ParallelCluster版本 2.7.0 已发布

Amazon ParallelCluster版本 2.7.0 已发布。

更改包括:

2020 年 5 月 19 日

Amazon ParallelCluster版本 2.6.1 已发布

Amazon ParallelCluster版本 2.6.1 已发布。

更改包括:

2020 年 4 月 17 日

Amazon ParallelCluster版本 2.6.0 已发布

Amazon ParallelCluster版本 2.6.0 已发布。

更改包括:

  • 添加了对 Amazon Linux 2 的支持

  • 现在,Amazon CloudWatch Logs 用于收集集群和计划程序日志。有关更多信息,请参阅 与亚马逊集成CloudWatch日志

  • 增加了对 Lustre 部署类型的新 Amazon FSx 的支持。SCRATCH_2PERSISTENT_1. 启用 FSx for LustreUbuntu18.04 和Ubuntu16.04。有关更多信息,请参阅 fsx

  • 添加了对 NICE DCV 的支持Ubuntu18.04。有关更多信息,请参阅 通过 NICE DCV Connect 到头节点

2020 年 2 月 27 日

Amazon ParallelCluster版本 2.5.1

Amazon ParallelCluster版本 2.5.1 已发布。

2019 年 12 月 13 日

Amazon ParallelCluster版本 2.5.0 已发布

Amazon ParallelCluster版本 2.5.0 已发布。

2019 年 11 月 18 日

Amazon ParallelCluster引入了对 Intel MPI 的支持

Amazon ParallelCluster版本 2.4.1 引入了对 Intel MPI 的支持。

2019 年 7 月 29 日

Amazon ParallelCluster引入了对 EFA 的支持

Amazon ParallelCluster版本 2.4.0 引入了对 Elastic Fabric Adapter (EFA) 的支持。

2019 年 6 月 11 日

Amazon ParallelCluster发布了文档Amazon文档网站

Amazon ParallelCluster 文档现提供 10 种语言版本,并提供 HTML 和 PDF 两种格式。

2018 年 5 月 24 日