转换Amazon ParallelCluster托管存储到外部存储 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

转换Amazon ParallelCluster托管存储到外部存储

学习如何转换Amazon ParallelCluster托管存储到外部存储。

这些过程基于以下示例配置文件片段。

... - MountDir: /fsx Name: fsx StorageType: FsxLustre FsxLustreSettings: StorageCapacity: 1200 DeletionPolicy: Delete ...
转换Amazon ParallelCluster托管存储到外部存储
  1. 设置DeletionPolicyRetain在集群配置文件中。

    ... - MountDir: /fsx Name: fsx StorageType: FsxLustre FsxLustreSettings: StorageCapacity: 1200 DeletionPolicy: Retain ...
  2. 要设置DeletionPolicy更改,运行以下命令。

    pcluster update-cluster -n cluster-name -c cluster-config.yaml
  3. 移除SharedStorage集群配置文件中的部分。

    ... ...
  4. 要更改托管的SharedStorage到外部SharedStorage然后将其与集群分离,运行以下命令。

    pcluster update-cluster -n cluster-name -c cluster-config.yaml
  5. 现在,您的共享存储位于外部,并且已与集群分离。

  6. 要将外部文件系统连接到原始群集或其他群集,请按照以下步骤操作。

    1. 获取 FSx for Lustre 文件系统 ID。

      1. 要使用Amazon CLI运行以下命令并找到名称包含原始群集名称的文件系统并记下文件系统 ID。

        aws fsx describe-file-systems
      2. 要使用Amazon Web Services Management Console,登录并导航到https://console.aws.amazon.com/fsx/。在文件系统列表中,找到名称包含原始群集名称的文件系统,并记下文件系统 ID。

    2. 更新文件系统安全组规则,以提供对文件系统和集群子网的访问权限。您可以在 Amazon FSx 控制台中找到文件系统安全组的名称和 ID。

      向文件系统安全组添加规则,允许来自头节点和计算节点 IP CIDR 范围或前缀的入站和出站 TCP 流量。为入站和出站 TCP 流量指定 TCP 端口 988、1021、1022 和 1023。

      有关更多信息,请参阅SharedStorage/FsxLustreSettings/FileSystemId为 Amazon EC2 创建、配置和删除安全组Amazon Command Line Interface版本 2 的用户指南

    3. 添加SharedStorage集群配置部分。

      ... - MountDir: /fsx Name: fsx-external StorageType: FsxLustre FsxLustreSettings: FileSystemId: fs-02e5b4b4abd62d51c ...
    4. 要将外部共享存储添加到集群,请运行以下命令。

      pcluster update-cluster -n cluster-name -c cluster-config.yaml