什么是 Amazon FSx for Lustre?
FSx for Lustre 可帮助您轻松、经济高效地启动和运行常用的高性能 Lustre 文件系统。您可以将 Lustre 用于速度至关重要的工作负载,例如机器学习、高性能计算(HPC)、视频处理和财务建模。
开源 Lustre 文件系统专为需要快速存储的应用程序而设计,快速存储指希望存储能跟上计算速度。构建 Lustre 为了解决快速、经济地处理全球不断增长的数据集的问题。它是一个广泛使用的文件系统,专为世界上速度最快的计算机而设计。它提供亚毫秒级延迟、高达数百 Gbps 的吞吐量和高达数百万 IOPS。有关 Lustre 更多信息,请参阅 Lustre 网站
作为一项完全托管式服务,Amazon FSx 使您可以更轻松地将 Lustre 用于存储速度至关重要的工作负载。FSx for Lustre 消除了设置和管理 Lustre 文件系统的传统复杂性,使您能够在几分钟内启动并运行经过实战考验的高性能文件系统。此外,还提供了多种部署选项,因此您可以根据需要优化成本。
FSx for Lustre 符合 POSIX 标准,因此您无需进行任何更改即可使用当前基于 Linux 的应用程序。FSx for Lustre 提供了一个本机文件系统接口,并且可以像任何文件系统在 Linux 操作系统中一样工作。此外,还提供了先写后读一致性,并支持文件锁定。
主题
多种存储选项
Amazon FSx for Lustre 提供固态硬盘(SSD)和硬盘驱动器(HDD)存储类型供您选择,且这些存储类型针对不同的数据处理要求进行了优化:
SSD 存储选项 – 对于通常具有小型随机文件操作的低延迟、IOPS 密集型工作负载,选择 SSD 存储选项。
HDD 存储选项 – 对于通常具有大型顺序文件操作的吞吐量密集型工作负载,选择 HDD 存储选项。
如果要为文件系统预调配 HDD 存储选项,可以选择预调配大小为 HDD 存储容量 20% 的只读 SSD 缓存。这样可以为经常访问的文件提供亚毫秒级延迟和更高的 IOPS。基于 SSD 的文件系统和基于 HDD 的文件系统都预调配了基于 SSD 的元数据服务器。因此,所有元数据操作(代表大多数文件系统操作)都以亚毫秒级延迟传送。
有关这些存储选项的性能的更多信息,请参阅 Amazon FSx for Lustre 性能。
FSx for Lustre 和数据存储库
您可以将 FSx for Lustre 文件系统关联到 Amazon S3 上的数据存储库或本地数据存储。
FSx for Lustre S3 数据存储库集成
FSx for Lustre 已与 Amazon S3 集成,因此可以更轻松地使用 Lustre 高性能文件系统处理云数据集。关联到 Amazon S3 桶后,FSx for Lustre 文件系统会透明地将 S3 对象显示为文件。Amazon FSx 可以在创建文件系统时导入 S3 桶中的所有现有文件列表。Amazon FSx 还可以在创建文件系统后导入添加到数据存储库中的文件列表。您可以设置导入首选项以满足您的工作流程需求。文件系统还允许将文件系统数据写回 S3。数据存储库任务简化了 FSx for Lustre 文件系统与其在 Amazon S3 上的持久数据存储库之间的数据和元数据传输。有关更多信息,请参阅将数据存储库与 Amazon FSx for Lustre 结合使用 和数据存储库任务。
FSx for Lustre 和本地数据存储库
借助 Amazon FSx for Lustre,您可以通过使用 Amazon Direct Connect 或 Amazon VPN 导入数据,将数据处理工作负载从本地扩展到 Amazon Web Services 云。有关更多信息,请参阅 将 Amazon FSx 用于您的本地数据。
访问 FSx for Lustre 文件系统
您可以混合搭配连接到单个 FSx for Lustre 文件系统的计算实例类型和 Linux 亚马逊机器映像(AMI)。
Amazon FSx for Lustre 文件系统可以从 Amazon Elastic Compute Cloud(Amazon EC2)实例上运行的计算工作负载、Amazon Elastic Container Service(Amazon ECS)Docker 容器和 Amazon Elastic Kubernetes Service(Amazon EKS)上运行的容器进行访问。
Amazon EC2 – 可以使用开源 Lustre 客户端从 Amazon EC2 计算实例访问文件系统。Amazon EC2 实例可以从同一 Amazon Virtual Private Cloud(Amazon VPC)内的其他可用区访问您的文件系统,但前提是您的联网配置允许在 VPC 内跨子网访问。挂载 Amazon FSx for Lustre 文件系统后,就可以像使用本地文件系统一样使用其文件和目录。
Amazon EKS – 可以使用开源 FSx for Lustre CSI 驱动程序从 Amazon EKS 上运行的容器访问 Amazon FSx for Lustre,如《Amazon EKS 用户指南》中所述。在 Amazon EKS 上运行的容器可以使用 Amazon FSx for Lustre 支持的卷。
Amazon ECS – 可以从 Amazon EC2 实例上的 Amazon ECS Docker 容器访问 Amazon FSx for Lustre。有关更多信息,请参阅 从 Amazon Elastic Container Service 挂载。
Amazon FSx for Lustre 兼容最流行的基于 Linux 的 AMI,包括 Amazon Linux 2023 和 Amazon Linux 2、Red Hat Enterprise Linux (RHEL)、CentOS、Ubuntu 和 SUSE Linux。Amazon Linux 2023 和 Amazon Linux 2 提供 Lustre 客户端。对于 RHEL、CentOS 和 Ubuntu,Amazon Lustre 客户端存储库提供了与这些操作系统兼容的客户端。
借助 FSx for Lustre,您可以通过使用 Amazon Direct Connect 或 Amazon Virtual Private Network 导入数据,将计算密集型工作负载从本地扩展到 Amazon Web Services 云。您可以从本地访问 Amazon FSx 文件系统,根据需要将数据复制到文件系统中,并在云端实例上运行计算密集型工作负载。
有关可以访问 FSx for Lustre 文件系统的客户端、计算实例和环境的更多信息,请参阅访问文件系统。
与 Amazon 服务集成
Amazon FSx for Lustre 已与 Amazon SageMaker 集成,作为输入数据来源。将 SageMaker 与 FSx for Lustre 配合使用时,省去了从 Amazon S3 下载的初始步骤,从而加快了机器学习训练作业。此外,在节省 S3 请求成本的同时,还避免了重复下载同一数据集上迭代作业的通用对象,从而降低了总拥有成本(TCO)。有关更多信息,请参阅《Amazon SageMaker 开发人员指南》中的什么是 SageMaker?。有关如何使用 Amazon FSx for Lustre 作为 SageMaker 数据来源的演练,请参阅 Amazon Machine Learning 博客上的 Speed up training on Amazon SageMaker using Amazon FSx for Lustre and Amazon EFS file systems
FSx for Lustre 使用 EC2 启动模板与 Amazon Batch 集成。Amazon Batch 允许在 Amazon Web Services 云 上运行批量计算工作负载,包括高性能计算(HPC)、机器学习(ML)和其他异步工作负载。Amazon Batch 根据任务资源要求自动且动态地调整实例大小。有关更多信息,请参阅《Amazon Batch 用户指南》中的什么是 Amazon Batch?。
FSx for Lustre 已与 Amazon ParallelCluster 集成。Amazon ParallelCluster 是一个 Amazon 提供支持的开源集群管理工具,用于部署和管理 HPC 集群。它可以自动创建 FSx for Lustree 文件系统,也可以在集群创建过程中使用现有文件系统。
安全与合规
FSx for Lustre 文件系统支持静态加密和传输中加密。Amazon FSx 使用在 Amazon Key Management Service(Amazon KMS)中管理的密钥自动对文件系统的静态数据进行加密。从支持的 Amazon EC2 实例访问时,某些 Amazon Web Services 区域 的文件系统上的传输中数据也会自动加密。有关 FSx for Lustre 中数据加密的更多信息(包括支持传输中数据加密的 Amazon Web Services 区域),请参阅 Amazon FSx for Lustre 中的数据加密。Amazon FSx 已通过评测,符合 ISO、PCI-DSS 和 SOC 认证,并且符合 HIPAA 要求。有关更多信息,请参阅 Amazon FSx for Lustre 中的安全性。
假设
在本指南中,我们做出了以下假设:
-
如果您使用 Amazon Elastic Compute Cloud(Amazon EC2),我们假设您熟悉该服务。有关如何使用 Amazon EC2 的更多信息,请参阅 Amazon EC2 文档。
-
我们假设您熟悉使用 Amazon Virtual Private Cloud(Amazon VPC)。有关如何使用 Amazon VPC 的更多信息,请参阅《Amazon VPC 用户指南》。
-
我们假设您没有根据 Amazon VPC 服务更改 VPC 的默认安全组规则。如果更改了,请确保添加必要的规则,允许从 Amazon EC2 实例到 Amazon FSx for Lustre 文件系统的网络流量。有关更多详细信息,请参阅使用 Amazon VPC 进行文件系统访问控制。
Amazon FSx for Lustre 的定价
使用 Amazon FSx for Lustre,无需预付硬件或软件成本。您只需为使用的资源付费,没有最低承付款、设置费用或额外费用。有关与该服务相关的定价和费用的信息,请参阅 Amazon FSx for Lustre 定价
Amazon FSx for Lustre 论坛
如果您在使用 Amazon FSx for Lustre 时遇到问题,请访问论坛
您是 Amazon FSx for Lustre 新用户吗?
如果您是 Amazon FSx for Lustre 新用户,我们建议您按顺序阅读以下内容:
-
如果您已准备好创建第一个 Amazon FSx for Lustre 文件系统,请参阅Amazon FSx for Lustre 入门。
-
有关性能的信息,请参阅 Amazon FSx for Lustre 性能。
-
有关将文件系统关联到 Amazon S3 桶数据存储库的更多信息,请参阅将数据存储库与 Amazon FSx for Lustre 结合使用。
-
有关 Amazon FSx for Lustre 的安全详细信息,请参阅 Amazon FSx for Lustre 中的安全性。
-
有关 Amazon FSx for Lustre 的可扩展性限制(包括吞吐量和文件系统大小)的信息,请参阅Amazon FSx for Lustre 的配额。
-
有关 Amazon FSx for Lustre API 的信息,请参阅《Amazon FSx for Lustre API 参考》。