构建自定义 Amazon ParallelCluster AMI - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

构建自定义 Amazon ParallelCluster AMI

重要

我们不建议将构建自定义 AMI 作为自定义方法Amazon ParallelCluster。

这是因为,在您构建自己的 AMI 之后,您不会再收到future 版本的更新或错误修复Amazon ParallelCluster。此外,如果您构建自定义 AMI,则必须在每个新Amazon ParallelCluster版本中重复创建自定义 AMI 时所用的步骤。

在继续阅读之前,我们建议您先查看 C ustom Bootstrap Actions 部分,以确定futureAmazon ParallelCluster 版本是否可以编写脚本并支持您要进行的修改。

尽管构建自定义 AMI 并不理想(由于前面提到的原因),但在某些情况下仍需要构建自定义 AMI。Amazon ParallelCluster本教程将指导您完成针对这些场景构建自定义 AMI 的过程。

注意

从Amazon ParallelCluster版本 2.6.1 开始,启动节点时默认跳过大多数安装配方。这是为了缩短启动时间。要以牺牲启动时间为代价运行所有安装配方"skip_install_recipes" : "no"以获得更好的向后兼容性,请在extra_json设置中添加cluster密钥。例如:

extra_json = { "cluster" : { "skip_install_recipes" : "no" } }
先决条件

如何自定义 Amazon ParallelCluster AMI

以下各节将介绍三种使用自定义Amazon ParallelCluster AMI 的方法。这三种方法中有两种要求您构建一个新的 AMI,该新的 AMI 在您的支持下可用Amazon Web Services 账户。第三种方法(在运行时使用自定义 AMI)不需要您事先构建任何东西,但会增加部署风险。请选择最符合您需求的方法。

修改 AMI

这是最安全和最推荐的方法。由于基本Amazon ParallelCluster AMI 通常会使用新版本进行更新,因此此 AMI 具有安装和配置时运行所需Amazon ParallelCluster的所有组件。您可以此为基础开始操作。

New EC2 console
  1. 在Amazon ParallelCluster AMI 列表中,找到与您使用的具体对应Amazon Web Services 区域的 AMI。您选择的 AMI 列表必须与您使用的 AMI 列表的Amazon ParallelCluster版本相匹配。运行 pcluster version 验证版本。有关Amazon ParallelCluster版本 2.11.9,请访问 https://github.com/aws/aws-parallelcluster/blob/v2.11.9/amis.txt。要选择其他版本,请使用相同的链接,选择 T ag: 2.11.9 按钮,选择 “标签” 选项卡,然后选择相应的版本。

  2. 登录到 Amazon Web Services Management Console 并打开 Amazon EC2 控制台(https://console.aws.amazon.com/ec2/)。

  3. Amazon EC2 控制面板中,选择启动实例

  4. 应用程序和操作系统映像中,选择浏览更多 AMI,导航到社区Amazon ParallelCluster AM I,然后在搜索框中Amazon Web Services 区域输入您的 AMI ID。

  5. 选择 AMI,选择您的实例类型和属性,选择您的密钥对,然后启动实例

  6. 使用操作系统用户和您的 SSH 密钥登录您的实例。有关更多信息,请导航到实例,选择新实例,然后 Connect

  7. 根据需要自定义您的实例。

  8. 运行以下命令以准备实例来创建 AMI:

    sudo /usr/local/sbin/ami_cleanup.sh
  9. 导航到实例,选择新实例,选择实例状态停止实例

  10. 使用 EC2 控制台或创建Amazon CLI映像从实例创建新 AMI。

    从 EC2 控制台运行
    1. 在导航窗格中选择 Instances(实例)。

    2. 选择您创建和修改的实例。

    3. 在 “操作” 中,选择 “图像和模板”,然后选择 “创建图像”。

    4. 选择 Create Image

  11. 在集群配置的 custom_ami 字段中输入新的 AMI ID。

Old EC2 console
  1. 在Amazon ParallelCluster AMI 列表中,找到与您使用的具体对应Amazon Web Services 区域的 AMI。您选择的 AMI 列表必须与您使用的 AMI 列表的Amazon ParallelCluster版本相匹配。运行 pcluster version 验证版本。有关Amazon ParallelCluster版本 2.11.9,请访问 https://github.com/aws/aws-parallelcluster/blob/v2.11.9/amis.txt。要选择其他版本,请使用相同的链接,选择 T ag: 2.11.9 按钮,选择 “标签” 选项卡,然后选择相应的版本。

  2. 登录到 Amazon Web Services Management Console 并打开 Amazon EC2 控制台(https://console.aws.amazon.com/ec2/)。

  3. Amazon EC2 控制面板中,选择启动实例

  4. 选择社区 AMAmazon ParallelCluster I,搜索 AMI ID,然后选择它。

  5. 选择您的实例类型,然后选择 “下一步:配置实例详情” 或 “查看并启动” 以启动您的实例。

  6. 选择 Launch,选择您的密钥对,然后启动实例

  7. 使用操作系统用户和您的 SSH 密钥登录您的实例。有关更多信息,请导航到实例,选择新实例,然后 Connect

  8. 根据需要自定义您的实例。

  9. 运行以下命令以准备实例来创建 AMI:

    sudo /usr/local/sbin/ami_cleanup.sh
  10. 导航到实例,选择新实例,选择实例状态,然后停止

  11. 使用 EC2 控制台或创建Amazon CLI映像从实例创建新 AMI。

    从 EC2 控制台运行
    1. 在导航窗格中选择 Instances(实例)。

    2. 选择您创建和修改的实例。

    3. 在 “操作” 中,选择 “图像”,然后选择 “创建图像”。

    4. 选择 Create Image

  12. 在集群配置的 custom_ami 字段中输入新的 AMI ID。

构建自定义 Amazon ParallelCluster AMI

如果您已具有自定义的 AMI 和软件,则可以在其基础之上应用 Amazon ParallelCluster 所需的更改。

  1. 将以下内容与Amazon ParallelCluster CLI 一起安装在本地系统中:

    • Packer:从 Packer 网站查找并安装最新的操作系统版本。版本必须至少为 1.4.0,但建议使用最新版本。验证该packer命令在您的 PATH 中是否可用。

    注意

    在Amazon ParallelCluster版本 2.8.0 之前,需要使用 Berkshelf(使用安装gem install berkshelfpcluster createami

  2. 配置您的Amazon Web Services 账户证书,以便 Packer 可以代表您调用Amazon API 操作。Packer 工作所需的最低权限集记录在 Packer 文档中 A mazon AMI Build er 主题的 IAM 任务或实例角色部分中。

  3. 可以使用 Amazon ParallelCluster CLI 中的 createami 命令以您作为基础的 Amazon ParallelCluster AMI 为起点构建该 AMI:

    pcluster createami --ami-id <BASE_AMI> --os <BASE_AMI_OS>
    重要

    你不应该像<BASE_AMI>createami命令一样使用来自正在运行的集群的Amazon ParallelCluster AMI。否则,命令将失败。

    有关其他参数,请参阅pcluster createami

  4. 步骤 4 中的命令运行 Packer,它专门执行以下操作:

    1. 使用提供的基础 AMI 启动实例。

    2. 将Amazon ParallelCluster食谱应用到实例以安装相关软件和执行其他必要的配置任务。

    3. 停止实例。

    4. 从实例创建新的 AMI。

    5. 创建 AMI 之后终止该实例。

    6. 输出用于创建集群的新的 AMI ID 字符串。

  5. 要创建集群,请在集群配置内的 custom_ami 字段中输入 AMI ID。

注意

用于构建自定义Amazon ParallelCluster AMI 的实例类型是t2.xlarge。此实例类型不符合Amazon免费套餐的条件,因此您需要为构建此 AMI 时创建的任何实例付费。

在运行时使用自定义 AMI

警告

为避免使用与不兼容的 AMI 的风险Amazon ParallelCluster,我们建议您避免使用此方法。

在运行时使用可能未经测试的 AMI 启动计算节点时,与所需软件Amazon ParallelCluster的运行时安装不兼容可能会Amazon ParallelCluster导致停止工作。

如果您不想提前创建任何内容,则可以使用您的 AMI 并Amazon ParallelCluster从该 AMI 创建一个。

使用这种方法,创建需要更长的时间,因为创建群集Amazon ParallelCluster时需要的所有软件都必须安装。Amazon ParallelCluster此外,扩大规模也需要更长的时间。

  • 在集群配置内的 custom_ami 字段中输入 AMI ID。