Performance - Amazon Storage Gateway
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon S3 文件网关文档已移至什么是 Amazon S3 文件网关?

Amazon FSx 文件网关文档已移至什么是 Amazon FSx 文件网关?

卷网关文档已移至什么是卷网关?

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Performance

本节介绍了 Storage Gateway 性能。

磁带网关的性能指导

在本部分中,您可以找到为磁带网关 VM 预配置硬件的配置指南。表中列出的 Amazon EC2 实例大小和类型是示例,仅供参考。

配置 写入吞吐量 Gbps 从缓存读取的吞吐量 Gbps 从 Amazon Web Services 云读取的吞吐量 Gbps

主机平台:Amazon EC2 实例 - c5.4xlarge

CPU:16 个 vCPU | RAM:32 GB

根磁盘:80 GB,io1 SSD,4000 IOPS

缓存磁盘:条带化 RAID(2 x 500 GB,io1 EBS SSD,25000 IOPS)

上传缓冲区磁盘:450 GB,io1 SSD,2000 IOPS

到云的网络带宽:10 Gbps

2.3 4.0 2.2

主机平台:存储网关硬件设备

缓存磁盘:2.5 TB

上传缓冲区磁盘:2 TB

到云的网络带宽:10 Gbps

2.3 8.8 3.8

主机平台:Amazon EC2 实例 - c5d.9xlarge

CPU:36 个 vCPU | RAM:72 GB

根磁盘:80 GB,io1 SSD,4000 IOPS

缓存磁盘:900 GB NVMe 磁盘

上传缓冲区磁盘:900 GB NVMe 磁盘

到云的网络带宽:10 Gbps

5.2 11.6 5.2

主机平台:Amazon EC2 实例 - c5d.metal

CPU:96 个 vCPU | RAM:192 GB

根磁盘:80 GB,io1 SSD,4000 IOPS

缓存磁盘:条带化 RAID(2 x 900 GB NVMe 磁盘)

上传缓冲区磁盘:900 GB NVMe 磁盘

到云的网络带宽:10 Gbps

5.2 11.6 7.2
注意

此性能是通过同时使用 1 MB 块大小和十个磁带驱动器来实现的。

上表中的 EC2 配置仅用于代表您在拥有类似资源的物理服务器上可能获得的性能。例如,使用条带化 RAID 的 EC2 配置是通过一种特殊机制来设置,而我们在 EC2 上的网关通常不支持这种机制。要实现类似的性能,您应该改用连接到运行网关的本地服务器的硬件 RAID 控制器。

您的性能可能因主机平台配置和网络带宽而异。

要提高磁带网关的读写吞吐量性能,请参阅优化 iSCSI 设置让磁带驱动器使用更大的数据块在备份软件中优化虚拟磁带驱动器的性能

优化网关性能

为了使您的网关发挥最佳性能,Storage Gateway 建议您的网关主机服务器采用以下网关配置:

  • 至少 64 个专用的物理 CPU 核心

  • 对于磁带网关,您的硬件应使用以下数量的 RAM:

    • 对于缓存大小不超过 16 TiB 的网关,至少预留 16 GiB 的 RAM

    • 对于缓存大小为 16 TiB 至 32 TiB 的网关,至少预留 32 GiB 的 RAM

    • 对于缓存大小为 32 TiB 至 64 TiB 的网关,至少预留 48 GiB 的 RAM

    注意

    要获得最佳网关性能,您必须预配置至少 32 GiB 的 RAM。

  • 磁盘 1,用作网关缓存,如下所示:

    • 由 NVMe SSD 组成的条带化 RAID(独立磁盘的冗余阵列)。

  • 磁盘 2,用作网关上传缓冲区,如下所示:

    • 由 NVMe SSD 组成的条带化 RAID。

  • 磁盘 3,用作网关上传缓冲区,如下所示:

    • 由 NVMe SSD 组成的条带化 RAID。

  • 在虚拟机网络 1 上配置网络适配器 1:

    • 使用 VM 网络 1 并添加 VMXnet3 (10 Gbps) 以用于提取。

  • 在虚拟机网络 2 上配置网络适配器 2:

    • 使用 VM 网络 2 并添加 VMXnet3 (10 Gbps) 以用于连接到 Amazon。

在网关中添加资源

以下瓶颈可能会使磁带网关卷网关 Amazon 云的带宽)以下:

  • CPU 核心数

  • 缓存/上传缓冲区磁盘吞吐量

  • RAM 总量

  • 网络带宽至 Amazon

  • 从启动程序到网关的网络带宽

本节介绍为优化网关性能而可以采取的步骤。向网关或应用程序服务器添加资源是这些指导的基础。

您可以使用以下一种或多种方法在网关中添加资源以优化网关性能。

使用更高性能的磁盘

缓存和上传缓冲区磁盘吞吐量会限制网关的上传和下载性能。如果您的网关表现出的性能明显低于预期,请考虑通过以下方式提高缓存和上传缓冲区磁盘吞吐量:

  • 使用条带化 RAID(例如 RAID 10)来提高磁盘吞吐量,最好使用硬件 RAID 控制器。

    注意

    RAID(独立磁盘冗余阵列)或专门的磁盘条带化 RAID 配置(如 RAID 10)是将数据主体划分为块并将数据块分布到多个存储设备的过程。您使用的 RAID 级别会影响您可以达到的确切速度和容错能力。通过将 IO 工作负载划分到多个磁盘上,RAID 设备的总体吞吐量远高于任何单个成员磁盘的吞吐量。

  • 使用直接连接的高性能磁盘

    要优化网关性能,您可以添加高性能磁盘,如固态硬盘 (SSD) 和 NVMe 控制器。您还可以直接从存储区域网络 (SAN) 而不是 Microsoft Hyper-V NTFS 将虚拟磁盘连接到 VM。更高的磁盘性能通常可带来更大的吞吐量和更多的每秒输入/输出操作 (IOPS) 次数。

    要衡量吞吐量,请将ReadBytesWriteBytes指标与 Samples Amazon CloudWatch 统计数据结合使用。例如,5 分钟的采样周期内的 Samples 指标的 ReadBytes 统计数据除以 300 秒可以得出 IOPS。一般来说,查看网关的这些指标时,应注意低吞吐量和低 IOPS 趋势,以便显示与磁盘相关的瓶颈。有关网关指标的更多信息,请参阅测量您的磁带网关和之间的性能 Amazon

    注意

    CloudWatch 并非所有网关都提供指标。有关网关指标的信息,请参阅监控 Storage Gateway

添加更多上传缓冲区磁盘

要实现更高的写入吞吐量,请添加至少两个上传缓冲区磁盘。当数据写入网关时,系统会将其写入并本地存储在上传缓冲区磁盘上。之后,将从待处理和上传到 Amazon的磁盘中异步读取存储的本地数据。添加更多上传缓冲区磁盘可以减少对每个磁盘执行的并发 I/O 操作量。这可以增加网关的写入吞吐量。

使用独立物理磁盘支持网关虚拟磁盘

在预配置网关磁盘时,我们强烈建议您不要为使用相同底层物理存储磁盘的上传缓冲区和缓存存储预配置本地磁盘。例如,对于 VMware ESXi,底层物理存储资源表示为数据存储。部署网关 VM 时,您可选择用来存储 VM 文件的数据存储。在预置虚拟磁盘时(例如,作为上传缓冲区),您可以将虚拟磁盘存储在与 VM 相同的数据存储中,也可以将其存储在不同的数据存储中。

如果您有多个数据存储,则强烈建议为要创建的每个类型的本地存储选择一个数据存储。仅由一个底层物理磁盘支持的数据存储可能会导致性能下降。例如,在使用此类磁盘同时支持网关设置中的缓存存储和上传缓冲区时。同样,采用性能不太高的 RAID 配置(如 RAID 1 或 RAID 6)的数据存储可能会导致性能下降。

添加 CPU 资源到您的网关主机

网关主机服务器的最低要求是四个虚拟服务器。要优化网关性能,请确认分配给网关 VM 的每个虚拟处理器均采用一个专用的 CPU 内核。此外,还要确认您没有超额预订主机服务器的 CPU。

在将额外的 CPU 添加到网关主机服务器时,将会增加网关的处理能力。通过执行该操作,您的网关可以并行处理将应用程序中的数据存储到本地存储以及将该数据上传到 Amazon S3 的过程。更多 CPU 还可帮助确保在主机与其他 VM 共享时您的网关获得足够的 CPU 资源。提供足够的 CPU 资源通常能取得增加吞吐量的效果。

增加网关和 Amazon 云之间的带宽

增加进出带宽 Amazon 将提高进入网关和输出到 Amazon 云端的最大数据速率。如果网速是网关配置中的限制因素,而不是磁盘速度慢或网关启动程序连接带宽不足等其他因素,那么这样可以提高网关性能。

往返网络带宽 Amazon 定义了持续工作负载期间磁带网关的理论最大平均性能。

  • 在长时间间隔内,向磁带网关写入数据的平均速率不会超过向 Amazon上传数据的上传带宽。

  • 长时间间隔内从磁带网关读取数据的平均速率不会超过您的下载带宽 Amazon。

注意

由于还存在此处列出的其他限制因素(例如缓存/上传缓冲区磁盘吞吐量、CPU 内核数、RAM 总量或启动程序和网关之间的带宽),您观察到的网关性能很可能会低于您的网络带宽。此外,网关的正常运行涉及为保护数据而执行的许多操作,这可能会导致观察到的性能低于您的网络带宽。

优化 iSCSI 设置

您可以优化 iSCSI 启动程序上的 iSCSI 设置,以实现更高的 I/O 性能。我们建议为 MaxReceiveDataSegmentLengthFirstBurstLength 选择 256 KiB,为 MaxBurstLength 选择 1 MiB。有关配置 iSCSI 设置的更多信息,请参阅自定义 iSCSI 设置

注意

这些建议的设置有助于实现更出色的整体性能。但是,优化性能所需的具体 iSCSI 设置因您使用的备份软件而异。有关详细信息,请参阅备份软件文档。

让磁带驱动器使用更大的数据块

对于磁带网关,磁带驱动器的默认块大小为 64 KB。但是,您可以将块大小增加到最多 1 MB 以提高 I/O 性能。

您选择的块大小取决于备份软件支持的最大块大小。我们建议您在备份软件中将磁带驱动器的块大小尽可能设置为较大的值。但是,该块大小不能大于网关支持的最大大小 (1 MB)。

磁带网关协商虚拟磁带驱动器的块大小,以便自动与备份软件中设置的值相匹配。在备份软件中增加块大小时,我们建议您还要检查这些设置,以确保主机启动程序支持新的块大小。有关更多信息,请参阅备份软件的文档。有关特定网关性能指南的更多信息,请参阅Performance

在备份软件中优化虚拟磁带驱动器的性能

您的备份软件可以同时备份磁带网关上的最多 10 个虚拟磁带驱动器上的数据。我们建议您在备份软件中配置备份任务,从而在磁带网关上同时使用至少 4 个虚拟磁带驱动器。在备份软件同时将数据备份到多个虚拟磁带时,您可以实现更高的写入吞吐量。

通常,您可以通过同时对更多虚拟磁带进行操作(读取或写入)来实现更高的最大吞吐量。通过使用更多的磁带驱动器,可以让您的网关同时处理更多请求,从而有可能提高性能。

向应用程序环境添加资源

提高应用程序服务器和网关之间的带宽

iSCSI 启动程序和网关之间的连接可能会限制您的上传和下载性能。如果您的网关的性能明显低于预期,并且您已经提高了 CPU 核心数量和磁盘吞吐量,请考虑:

  • 升级网络电缆,使启动程序和网关之间具有更高的带宽。

  • 同时使用尽可能多的磁带驱动器。iSCSI 不支持为同一个目标排队多个请求,这意味着您使用的磁带驱动器越多,网关可以同时处理的请求就越多。这将使您能够更充分地利用网关和启动程序之间的带宽,从而提高网关的表观吞吐量。

要优化网关性能,请确保应用程序和网关之间的网络带宽可满足您的应用程序需求。您可以使用网关的 ReadBytesWriteBytes 指标来测量总数据吞吐量。)。有关这些指标的更多信息,请参阅测量您的磁带网关和之间的性能 Amazon

对于您的应用程序,请将测得的吞吐量与所需的吞吐量进行比较。如果测得吞吐量小于预期吞吐量,那么如果网络是瓶颈,提高应用程序和网关间的带宽可改善性能。同样地,您可以增加 VM 和本地磁盘之间的带宽 (如果它们不是直接连接的)。

向应用程序环境添加 CPU 资源

如果您的应用程序可以使用额外的 CPU 资源,则添加更多 CPU 可以帮助您的应用程序扩展其 I/O 负载。

将 VMware vSphere High Availability 与 Storage Gateway 结合使用

Storage Gateway 通过一组与 VMware vSphere High Availability (VMware HA) 集成的应用程序级运行状况检查,在 VMware 上提供高可用性。此方法有助于保护存储工作负载免受硬件、管理程序或网络故障的影响。它还有助于防止软件错误,例如连接超时和文件共享或卷不可用。

vSphere HA 的工作原理是将虚拟机及其所在的主机集中到集群中以实现冗余。集群中的主机将受到监控,如果出现故障,故障主机上的虚拟机将在备用主机上重新启动。通常,恢复速度很快,不会丢失数据。有关 vSphere HA 的更多信息,请参阅 VMware 文档中的 vSphere HA 的工作原理

注意

重新启动出现故障的虚拟机并在新主机上重新建立 iSCSI 连接所需的时间取决于许多因素,例如主机操作系统和资源负载、磁盘速度、网络连接以及 SAN/存储基础架构。要最大限度地减少故障转移停机时间,请实施优化网关性能中概述的建议。

要将 VMware HA 与 Storage Gateway 结合使用,请执行下面列出的步骤。

配置您的 vSphere VMware HA 集群

如果您尚未创建 VMware 集群,请先创建一个。有关如何创建 VMware 集群的信息,请参阅 VMware 文档中的创建 vSphere HA 集群

接下来,配置要与 Storage Gateway 结合使用的 VMware 集群。

配置 VMware 集群
  1. 在 VMware vSphere 的 Edit Cluster Settings (编辑集群设置) 页面上,确保为 VM 和应用程序监控配置 VM 监控。为此,请设置下面列出的选项:

    • Host Failure Response (主机故障响应)Restart VMs (重新启动 VM)

    • Response for Host Isolation (主机隔离的响应)Shut down and restart VMs (关闭并重新启动 VM)

    • Datastore with PDL (具有 PDL 的数据存储)Disabled (已禁用)

    • Datastore with APD (具有 APD 的数据存储)Disabled (已禁用)

    • VM Monitoring (VM 监控)VM and Application Monitoring (VM 和应用程序监控)

    有关示例,请参阅下面的屏幕截图。

    配置了 VM 和应用程序监控选项的 VMware vSphere 编辑集群设置屏幕。
  2. 通过调整以下值来微调集群的敏感度:

    • 故障间隔 - 在此间隔之后,如果未收到 VM 检测信号,则将重新启动 VM。

    • 最短正常运行时间 - 在 VM 开始监控 VM 工具的检测信号之后,集群等待的时间。

    • 每个 VM 的最大重置次数 - 集群在最大重置时段内重启 VM 的最大次数。

    • 最大重置次数的时段 - 计算每个 VM 的最大重置次数的时段。

    如果您不确定要设置的值,请使用以下示例设置:

    • Failure interval (故障间隔)30

    • Minimum uptime (最短正常运行时间)120

    • Maximum per-VM resets (每个 VM 的最大重置次数)3

    • Maximum resets time window (最长重置时段)1 小时

如果您在集群上运行了其他 VM,则可能需要专门为您的 VM 设置这些值。在从 .ova 部署 VM 之前,无法执行此操作。有关设置这些值的更多信息,请参阅 (可选)为集群上的其他 VM 添加覆盖选项

从 Storage Gateway 控制台下载 .ova 映像

下载适用于您的网关的 .ova 映像
  • 在 Storage Gateway 控制台的设置网关页面上,选择您的网关类型和主机平台,然后使用控制台中提供的链接来下载 .ova,如设置磁带网关中所述。

部署网关

在已配置的集群中,将 .ova 映像部署到集群的主机之一。

部署网关 .ova 映像
  1. 将 .ova 映像部署到集群中的主机之一。

  2. 确保为根磁盘和缓存选择的数据存储对集群中的所有主机可用。在 VMware 或本地环境中部署 Storage Gateway .ova 文件时,这些磁盘描述为半虚拟化 SCSI 磁盘。半虚拟化 是一种模式,在此模式下,网关 VM 使用主机操作系统来让控制台标识您添加到 VM 的虚拟磁盘。

    如需将 VM 配置为使用半虚拟化的控制器

    1. 在 VMware vSphere 客户端中,打开网关 VM 的上下文 (右键单击) 菜单,然后选择 Edit Settings

    2. Virtual Machine Properties 对话框中,选择 Hardware 选项卡,再选择 SCSI controller 0,然后选择 Change Type

    3. Change SCSI Controller Type 对话框中,选择 VMware Paravirtual SCSI 控制器类型,然后选择 OK

(可选)为集群上的其他 VM 添加覆盖选项

如果您在集群上运行了其他 VM,则可能需要专门为每个 VM 设置集群值。

为集群上的其他 VM 添加覆盖选项
  1. 在 VMware vSphere 中的 Summary (摘要) 页面上,选择您的集群以打开集群页面,然后选择 Configure (配置)

  2. 选择 Configuration (配置) 选项卡,然后选择 VM Overrides (VM 覆盖)

  3. 添加新的 VM 覆盖选项来更改每个值。

    有关覆盖选项,请参阅下面的屏幕截图。

    配置了覆盖选项的 VMware vSphere 添加虚拟机覆盖集群屏幕。

激活网关

在部署适用于网关的 .ova 后,激活网关。有关每个网关类型的不同之处的说明。

激活网关

测试您的 VMware High Availability 配置

激活网关后,请测试您的配置。

测试 VMware HA 配置
  1. 打开 Storage Gateway 控制台,网址为 https://console.aws.amazon.com/storagegateway/home

  2. 在导航窗格上,选择 Gateways (网关),然后选择要针对 VMware HA 测试的网关。

  3. 对于 Actions (操作),请选择 Verify VMware HA (验证 VMware HA)

  4. 在显示的 Verify VMware High Availability Configuration (验证 VMware High Availability 配置) 框中,选择 OK (确定)

    注意

    测试 VMware HA 配置将重新启动网关 VM 并中断与网关的连接。该测试可能需要几分钟才能完成。

    如果测试成功,则控制台中网关的详细信息选项卡中将显示 Verified (已验证) 状态。

  5. 请选择 Exit(退出)。

您可以在 Amazon CloudWatch 日志组中找到有关 VMware HA 事件的信息。有关更多信息,请参阅使用日志组获取 Tape Gateway Health CloudWatch 日志通过 CloudWatch 日志组