使用Slurm记账创建集群 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用Slurm记账创建集群

学习如何配置和创建带有Slurm记账功能的集群。有关更多信息,请参阅Slurm会计Amazon ParallelCluster

在本教程中,您将使用CloudFormation 快速创建模板创建Amazon Aurora适用于 MySQL 的无服务器数据库。该模板指示 CloudFormation 创建所有必要的组件,以便在与集群相同的 VPC 上部署Amazon Aurora无服务器数据库。该模板还为集群和数据库之间的连接创建基本的网络和安全配置。

注意

从版本 3.3.0 开始,Amazon ParallelCluster支持使用集群配置参数 SlurmSettings/数据库进行Slurm记账。

注意

快速创建模板就是一个例子。此模板并未涵盖Slurm会计数据库服务器的所有可能用例。您有责任创建具有适合您的生产工作负载的配置和容量的数据库服务器。

先决条件:

步骤:创建适用于:的 VPC 和子网::::::::Amazon ParallelCluster

要使用提供的Slurm会计数据库 CloudFormation 模板,您必须准备好集群的 VPC。您可以手动执行此操作,也可以作为该使用Amazon ParallelCluster命令行界面配置和创建集群过程的一部分进行此操作。如果您已经使用过Amazon ParallelCluster,则可能已准备好用于部署集群和数据库服务器的 VPC。

步骤:创建数据库堆栈:创建数据库堆栈:

使用CloudFormation 快速创建模板创建用于Slurm会计的数据库堆栈。该模板需要以下输入:

  • 数据库服务器凭证,特别是管理员用户名和密码。

  • Amazon Aurora无服务器集群的大小。这取决于预期的集群负载。

  • 网络参数,特别是目标 VPC 和用于创建子网的子网或 CIDR 块。

为您的数据库服务器选择适当的凭据和大小。对于联网选项,您需要使用与Amazon ParallelCluster集群部署到的相同 VPC。您可以为数据库创建子网并将其作为输入传递给模板。或者,为两个子网提供两个不相交的 CIDR 块,让 CloudFormation 模板为 CIDR 块创建两个子网。确保 CIDR 块不与现有子网重叠。如果 CIDR 块与现有子网重叠,则无法创建堆栈。

创建数据库服务器需要几分钟时间。

第 3:创建启用记账的集群:创建启用Slurm记账的集群:

提供的 CloudFormation 模板生成一个包含一些已定义输出的 CloudFormation 堆栈。在中Amazon Web Services Management Console,您可以在 CloudFormation 堆栈视图的 “输” 选项卡中查看输出。要启用Slurm记账,必须在Amazon ParallelCluster群集配置文件中使用其中一些输出:

使用输出值更新集群配置文件Database参数。使用 Cpcluster LI 创建集群。

$ pcluster create-cluster -n cluster-3.x -c path/to/cluster-config.yaml

创建集群后,您可以开始使用Slurm记账命令,例如sacctmgrsacct