Amazon 使用的服务 Amazon ParallelCluster - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon 使用的服务 Amazon ParallelCluster

使用以下亚马逊 Web Services (Amazon) 服务 Amazon ParallelCluster。

Amazon API Gateway

Amazon API Gateway 是一项用于创建、发布、维护、监控和保护任何规模的 REST、HTTP 和 WebSocket API 的 Amazon 服务

Amazon ParallelCluster 使用 API Gateway 来托管 Amazon ParallelCluster API。

有关的更多信息 Amazon Batch,请参阅 https://aws.amazon.com/api-gateway/https://docs.aws.amazon.com/apigateway/

Amazon Batch

Amazon Batch 是一项 Amazon 托管作业调度器服务。它可以动态配置集群中计算资源的最佳数量和类型(例如 CPU 或内存优化型实例)。 Amazon Batch 这些资源是根据批处理作业的特定要求(包括卷要求)预置的。使用 Amazon Batch,您无需安装或管理额外的批处理计算软件或服务器集群即可有效地运行作业。

Amazon Batch 仅用于集 Amazon Batch 群。

有关的更多信息 Amazon Batch,请参阅 https://aws.amazon.com/batch/https://docs.aws.amazon.com/batch/

Amazon CloudFormation

Amazon CloudFormation 是一项为云环境中的第三方应用程序资源建模 Amazon 和配置的通用语言的 infrastructure-as-code 服务。它是使用的主要服务 Amazon ParallelCluster。中的每个集群 Amazon ParallelCluster 都表示为一个堆栈,每个群集所需的所有资源都在 Amazon ParallelCluster Amazon CloudFormation 模板中定义。在大多数情况下, Amazon ParallelCluster CLI 命令直接对应 Amazon CloudFormation 堆栈命令,例如创建、更新和删除命令。在集群内启动的实例会对启动集群的 Amazon CloudFormation 终端节点进行 Amazon Web Services 区域 HTTPS 调用。

有关的更多信息 Amazon CloudFormation,请参阅 https://aws.amazon.com/cloudformation/https://docs.aws.amazon.com/cloudformation/

亚马逊 CloudWatch

Amazon CloudWatch (CloudWatch) 是一项监控和可观察性服务,可为您提供数据和可操作的见解。这些见解可用于监控您的应用程序、响应性能变化和服务异常以及优化资源利用率。中 Amazon ParallelCluster, CloudWatch 用于仪表板,用于监视和记录 Docker 映像构建步骤和 Amazon Batch 作业输出。

在 2.10.0 Amazon ParallelCluster 版本之前 CloudWatch ,仅用于集群。 Amazon Batch

有关的更多信息 CloudWatch,请参阅 https://aws.amazon.com/cloudwatch/https://docs.aws.amazon.com/cloudwatch/

亚马逊 CloudWatch 活动

Amazon CloudWatch Ev CloudWatch ents(Events)提供近乎实时的系统事件流,这些事件描述了亚马逊 Web Services (Amazon) 资源的变化。通过使用可快速设置的简单规则,您可以匹配事件并将事件路由到一个或多个目标函数或流。在中 Amazon ParallelCluster, CloudWatch 事件用于 Amazon Batch 作业。

有关 CloudWatch 活动的更多信息,请参阅 https://docs.aws.amazon.com//eventbridge/latest/userguide/ eb-cwe-now-eb

亚马逊 CloudWatch 日志

亚马逊 CloudWatch 日CloudWatch 志(日志)是亚马逊的核心功能之一 CloudWatch。您可以使用它来监控、存储、查看和搜索 Amazon ParallelCluster中使用的众多组件的日志文件。

在 2.6.0 Amazon ParallelCluster 版本之前, CloudWatch 日志仅用于集群。 Amazon Batch

有关更多信息,请参阅 与 Amazon CloudWatch Logs 集成

Amazon CodeBuild

Amazon CodeBuild (CodeBuild) 是一项 Amazon 托管的持续集成服务,它符合源代码、运行测试并生成随时可以部署的软件包。中 Amazon ParallelCluster, CodeBuild 用于在创建集群时自动透明地构建 Docker 镜像。

CodeBuild 仅用于集 Amazon Batch 群。

有关的更多信息 CodeBuild,请参阅 https://aws.amazon.com/codebuild/https://docs.aws.amazon.com/codebuild/

Amazon DynamoDB

Amazon DynamoDB (DynamoDB) 是一项快速灵活的 NoSQL 数据库服务。它用于存储集群的最小状态信息。头节点跟踪 DynamoDB 表中的预置实例。

DynamoDB 不适用于集群。 Amazon Batch

有关 DynamoDB 的更多信息,请参阅 https://aws.amazon.com/dynamodb/https://docs.aws.amazon.com/dynamodb/

Amazon Elastic Block Store

Amazon Elastic Block Store (Amazon EBS) 是一项高性能块存储服务,可为共享卷提供永久性存储。所有 Amazon EBS 设置都可以通过配置进行传递。Amazon EBS 卷可以初始化为空,也可以从现有的 Amazon EBS 快照进行初始化。

有关 Amazon EBS 的更多信息,请参阅 https://aws.amazon.com/ebs/https://docs.aws.amazon.com/ebs/

Amazon Elastic Compute Cloud

亚马逊弹性计算云 (Amazon EC2) 为提供计算能力 Amazon ParallelCluster。头节点和计算节点是 Amazon EC2 实例。可以选择支持 HVM 的任何实例类型。头节点和计算节点可以是不同的实例类型。此外,如果使用多个队列,则部分或全部计算节点也可以作为竞价型实例启动。在实例上找到的实例存储卷作为条带化 LVM 卷挂载。

有关亚马逊 EC2 的更多信息,请参阅 https://aws.amazon.com/ec2/https://docs.aws.amazon.com/ec2/

Amazon Elastic Container Registry

Amazon Elastic Container Registry(Amazon ECR)是一个完全托管式 Docker 容器注册表,可让开发人员轻松地存储、管理和部署 Docker 容器映像。在中 Amazon ParallelCluster,Amazon ECR 存储了创建集群时生成的 Docker 镜像。然后,使用 Docker 镜像为提交的作业运行容器。 Amazon Batch

Amazon ECR 仅适用于 Amazon Batch 集群。

有关更多信息,请参阅 https://aws.amazon.com/ecr/https://docs.aws.amazon.com/ecr/

Amazon EFS

Amazon Elastic File System (Amazon EFS) 提供了一种简单、可扩展并且完全托管的弹性 NFS 文件系统,可用于 Amazon Web Services 云 服务和本地资源。当指定了 EfsSettings 时,将会使用 Amazon EFS。2.1.0 Amazon ParallelCluster 版本中增加了对 Amazon EFS 的支持。

有关 Amazon EFS 的更多信息,请参阅 https://aws.amazon.com/efs/https://docs.aws.amazon.com/efs/

适用于 Lustre 的 Amazon FSx

FSx for Lustre 提供了一个使用开源 Lustre 文件系统的高性能文件系统。当指定了 FsxLustreSettings 属性 时,将会使用 FSx for Lustre。2.2.1 版本中 Amazon ParallelCluster 增加了对 FSx for Lustre 的支持。

有关 FSx for Lustre 的更多信息,请参阅 https://aws.amazon.com/fsx/lustre/https://docs.aws.amazon.com/fsx/

适用于 ONTAP 的亚马逊 FSx NetApp

FSx for ONTAP 提供了一个完全托管的共享存储系统,该系统建立在广受欢迎 NetApp的 ONTAP 文件系统之上。当指定了 FsxOntapSettings 属性 时,将会使用适用于 ONTAP 的 FSx。版本 3.2.0 中增加了对 ONTAP 的 FSx 的 Amazon ParallelCluster 支持。

有关适用于 ONTAP 的 FSx 的更多信息,请参阅 https://aws.amazon.com/fsx/netapp-ontap/https://docs.aws.amazon.com/fsx/

适用于 OpenZFS 的 Amazon FSx

适用于 OpenZFS 的 FSx 提供了一个完全托管的共享存储系统,该系统基于广受欢迎的 OpenZFS 文件系统而构建。当指定了 FsxOpenZfsSettings 属性 时,将会使用适用于 OpenZFS 的 FSx。3.2.0 版本中增加了对 OpenZFS 版 FSX 的支持。 Amazon ParallelCluster

有关适用于 OpenZFS 的 FSx 的更多信息,请参阅 https://aws.amazon.com/fsx/openzfs/https://docs.aws.amazon.com/fsx/

Amazon Identity and Access Management

Amazon Identity and Access Management (IAM) 用于在 Amazon ParallelCluster Amazon EC2 中为每个单独集群特定的实例提供权限最低的 IAM 角色。 Amazon ParallelCluster 实例只能访问部署和管理集群所需的特定 API 调用。

对于 Amazon Batch 集群,还会为创建集群时与 Docker 映像构建过程相关的组件创建 IAM 角色。这些组件包括允许在 Amazon ECR 存储库中添加和删除 Docker 映像的 Lambda 函数。它们还包括允许删除为集群和 CodeBuild 项目创建的 Amazon S3 存储桶的功能。还有 Amazon Batch 资源、实例和作业的角色。

有关 IAM 的更多信息,请参阅 https://aws.amazon.com/iam/https://docs.aws.amazon.com/iam/

Amazon Lambda

Amazon Lambda (Lambda) 运行编排 Docker 镜像创建的函数。Lambda 还管理自定义集群资源的清理,如 Amazon ECR 存储库中和 Amazon S3 上存储的 Docker 映像。

有关 Lambda 的更多信息,请参阅 https://aws.amazon.com/lambda/https://docs.aws.amazon.com/lambda/

Amazon RDS

Amazon Relational Database Service (Amazon RDS) 是一项网络服务,可以更轻松地在 Amazon 云中设置、操作和扩展关系数据库。

Amazon ParallelCluster 将 Amazon RDS 用于 Amazon Batch 和Slurm。

有关 Amazon RDS 的更多信息,请参阅 https://aws.amazon.com/rds/https://docs.aws.amazon.com/rds/

Amazon Route 53

Amazon Route 53 (Route 53) 用于使用每个计算节点的主机名和完全限定域名创建托管区。

有关 Route 53 的更多信息,请参阅 https://aws.amazon.com/route53/https://docs.aws.amazon.com/route53/

Amazon Simple Notification Service

Amazon Simple Notification Service (Amazon SNS) 是一项托管服务,提供从发布者向订阅用户(也称为创建者和使用者)的消息传输。

Amazon ParallelCluster 使用亚马逊 SNS 进行 API 托管。

有关 Amazon SNS 的更多信息,请参阅 https://aws.amazon.com/sns/https://docs.aws.amazon.com/sns/

Amazon Simple Storage Service

亚马逊简单存储服务 (Amazon S3) Service 存储的模板位于 Amazon ParallelCluster 每个服务中。 Amazon Web Services 区域 Amazon ParallelCluster 可以配置为允许 CLI/SDK 工具使用 Amazon S3。

Amazon ParallelCluster 还会在中创建一个 Amazon S3 存储桶,用于存储集群使用的资源,例如集群配置文件。 Amazon Web Services 账户 Amazon ParallelCluster 在您创建集群的每个存储桶中 Amazon Web Services 区域 都保留一个 Amazon S3 存储桶。

当您使用 Amazon Batch 集群时,将使用您账户中的 Amazon S3 存储桶来存储相关数据。例如,该存储桶会存储根据提交的作业创建 Docker 映像和脚本时创建的构件。

有关更多信息,请参阅 https://aws.amazon.com/s3/https://docs.aws.amazon.com/s3/

Amazon VPC

Amazon VPC 定义集群中节点使用的网络。

有关 Amazon VPC 的更多信息,请参阅 https://aws.amazon.com/vpc/https://docs.aws.amazon.com/vpc/

Elastic Fabric Adapter

Elastic Fabric Adapter (EFA) 是一个用于实例的网络接口,客户可以使用它来大规模运行需要高水平节点间通信的应用程序。 Amazon

有关 Elastic Fabric Adapter 的更多信息,请参阅 https://aws.amazon.com/hpc/efa/

EC2 Image Builder

EC2 Image Builder 是一项完全托管的 Amazon 服务,可帮助您自动创建、管理和部署自定义、安全的 up-to-date 服务器映像。

Amazon ParallelCluster 使用 Image Builder 创建和管理 Amazon ParallelCluster 图像。

有关 EC2 Image Builder 的更多信息,请参阅 https://aws.amazon.com/image-builder/https://docs.aws.amazon.com/imagebuilder/

NICE DCV

NICE DCV 是一种高性能远程显示协议,它是一种可在不同网络条件下向任何设备提供远程桌面和应用程序流的安全方式。当指定了 HeadNode 部分/Dcv 设置时,将会使用 NICE DCV。2.5.0 Amazon ParallelCluster 版本中增加了对 NICE DCV 的支持。

有关 NICE DCV 的更多信息,请参阅 https://aws.amazon.com/hpc/dcv/https://docs.aws.amazon.com/dcv/