AWS Storage Gateway
用户指南 (API 版本 2013-06-30)
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

监控网关和资源

在这一部分中,您可以找到有关如何监控网关的信息,包括监控与网关关联的资源以及监控上传缓冲区和缓存存储。使用 AWS 管理控制台可查看网关的指标。例如,您可以查看读写操作中使用的字节数、读写操作耗费的时间以及从 AWS 云检索数据耗费的时间。借助指标,您可以跟踪网关的运行状况并设置警报,以便在一个或多个指标超出定义的阈值时通知您。

AWS Storage Gateway 将提供 Amazon CloudWatch 指标而不会加收任何费用。Storage Gateway 指标将会保留两周的时间。通过使用这些指标,您可以访问历史信息并更好地了解您的网关和卷的表现。有关 CloudWatch 的更多详细信息,请参阅 Amazon CloudWatch 用户指南

了解网关指标

在本主题的讨论中,我们将 gateway (网关) 指标定义为范围限定到网关的指标,即这些指标用来衡量网关的某个方面。由于一个网关包含一个或多个卷,因此网关特定的指标代表网关上的所有卷。例如,CloudBytesUploaded 指标是网关在报告期间发送给云的字节的总数。该指标包括网关上所有卷的活动。

使用网关指标数据时,应指定您希望查看其指标的网关的唯一标识。为此,您可指定 GatewayIdGatewayName 值。希望使用网关的指标时,您在指标命名空间中指定网关维度,该维度将网关专属的指标从卷专属的指标区分开。有关更多信息,请参阅使用 Amazon CloudWatch 指标

AWS Storage Gateway 指标

AWS Storage Gateway 服务提供以下指标。

下表描述了可用来获取网关相关信息的 AWS Storage Gateway 指标。可指定每个指标的 GatewayIdGatewayName 维度来查看网关的数据。请注意,这些指标是以 5 分钟为间隔测量的。

指标 说明 网关缓存 网关存储 网关 VTL
CacheHitPercent

缓存传送的应用程序读取率。该指标仅适用网关缓存卷的设置。样本在报告周期结束时采用。

单位:百分比

CachePercentUsed

网关的缓存存储的使用率。该指标仅适用网关缓存卷的设置。样本在报告周期结束时采用。

单位:百分比

CachePercentDirty

尚未持续到 AWS 的网关缓存百分率。该指标仅适用网关缓存卷的设置。样本在报告周期结束时采用。

单位:百分比

CloudBytesDownloaded

网关在报告期间从 AWS 下载的压缩字节的总数。

将此指标与 Sum 统计数据结合使用来测量吞吐量,并将其与 Samples 统计数据结合使用来测量每秒输入/输出操作次数 (IOPS)。

单位:字节

CloudDownloadLatency

报告期间从 AWS 读取数据耗费的总毫秒数。

将该指标与 Average 统计数据结合使用以测量延迟。

单位:毫秒

CloudBytesUploaded

网关在报告期间上传到 AWS 的压缩字节的总数。

将此指标与 Sum 统计数据结合使用来测量吞吐量,将其与 Samples 统计数据结合使用来测量 IOPS。

单位:字节

UploadBufferFree

网关的上传缓冲区未使用字节的总量。样本在报告周期结束时采用。

单位:字节

CacheFree

网关的缓存存储中未使用的空间总量。样本在报告周期结束时采用。

单位:字节

UploadBufferPercentUsed

网关上传缓冲区的使用率。样本在报告周期结束时采用。

单位:百分比

UploadBufferUsed

网关的上传缓冲区正在使用的总字节数。样本在报告周期结束时采用。

单位:字节

CacheUsed

网关的缓存存储中正在使用的字节总数。样本在报告周期结束时采用。

单位:字节

QueuedWrites

等待写入 AWS 的字节的数目,网关中的所有卷在报告周期结束时采样所得。这些字节保存在网关的工作存储空间中。

单位:字节

ReadBytes

报告周期内网关中的所有卷从场内应用程序读取的总字节数。

将此指标与 Sum 统计数据结合使用来测量吞吐量,将其与 Samples 统计数据结合使用来测量 IOPS。

单位:字节

ReadTime

报告周期内网关中所有卷从本地应用程序进行读取操作所耗费的总毫秒数。

将该指标与 Average 统计数据结合使用以测量延迟。

单位:毫秒

TotalCacheSize

以字节为单位的缓存总大小。该指标仅适用网关缓存卷的设置。样本在报告周期结束时采用。

单位:字节

WriteBytes

报告周期内网关中所有卷写入场内应用程序的总字节数。

将此指标与 Sum 统计数据结合使用来测量吞吐量,将其与 Samples 统计数据结合使用来测量 IOPS。

单位:字节

WriteTime

报告周期内网关中所有卷从本地应用程序进行写入操作所耗费的总毫秒数。

将该指标与 Average 统计数据结合使用以测量延迟。

单位:毫秒

TimeSinceLastRecoveryPoint

自上次可用还原点以来的时间。

单位:秒

WorkingStorageFree

网关的工作存储空间中未使用的总空间量。样本在报告周期结束时采用。

注意

工作存储空间仅适用于网关存储卷设置。上传缓冲区适用于网关存储和网关缓存卷设置。如果您同时使用两种类型的网关设置,可能会发现仅使用相应的上传缓冲区指标 UploadBufferFree 更为方便。

单位:字节

WorkingStoragePercentUsed

网关上传缓冲区的使用率。样本在报告周期结束时采用。

注意

工作存储空间仅适用于网关存储卷设置。上传缓冲区适用于网关存储和网关缓存卷设置。如果您同时使用两种类型的网关设置,可能会发现仅使用相应的上传缓冲区指标 UploadBufferPercentUsed 更为方便。

单位:百分比

WorkingStorageUsed

网关的上传缓冲区正在使用的总字节数。样本在报告周期结束时采用。

注意

工作存储空间仅适用于网关存储卷设置。上传缓冲区适用于网关存储和网关缓存卷设置。如果您同时使用两种类型的网关设置,可能会发现仅使用相应的上传缓冲区指标 UploadBufferUsed 更为方便。

单位:字节

下表描述了可用来获取存储卷相关信息的 AWS Storage Gateway 指标。可指定每个指标的 VolumeId 维度来查看存储卷的数据。

指标 说明 网关缓存 网关存储
CacheHitPercent

应用程序从卷中读取的百分率,由缓存传送。该指标仅适用于缓存卷。样本在报告周期结束时采用。

在没有应用程序从卷读取时,该指标报告 100%。

单位:百分比

CachePercentUsed

卷对网关缓存存储空间的总体使用率占比。该指标仅适用于缓存卷。样本在报告周期结束时采用。

使用网关的 CachePercentUsed 指标来查看网关缓存存储空间的总体使用率。

单位:百分比

CachePercentDirty

卷在尚未传送到 AWS 的网关缓存的总体比例中的占比。该指标仅适用于网关缓存设置中的卷。样本在报告周期结束时采用。

使用网关的 CachePercentDirty 指标来查看尚未传送到 AWS 的网关缓存总体比例。

单位:百分比

ReadBytes

报告周期内从场内应用程序读取的总字节数。

将此指标与 Sum 统计数据结合使用来测量吞吐量,将其与 Samples 统计数据结合使用来测量 IOPS。

单位:字节

ReadTime

报告周期内从本地应用程序进行读取操作所耗费的总毫秒数。

将该指标与 Average 统计数据结合使用以测量延迟。

单位:毫秒

WriteBytes

报告周期内写入到场内应用程序的总字节数。

将此指标与 Sum 统计数据结合使用来测量吞吐量,将其与 Samples 统计数据结合使用来测量 IOPS。

单位:字节

WriteTime

报告周期内从本地应用程序进行写入操作所耗费的总毫秒数。

将该指标与 Average 统计数据结合使用以测量延迟。

单位:毫秒

QueuedWrites

等待写入到 AWS 的字节的数目,采样于报告周期结束时。

单位:字节

AWS Storage Gateway 指标的维度

AWS Storage Gateway 服务的 Amazon CloudWatch 命名空间为 AWS/StorageGateway。数据在 5 分钟期间内自动可用,无需收费。

维度

说明

GatewayIdGatewayName

这些维度会将您请求的数据筛选为特定于网关的指标。您可以通过网关的 GatewayIdGatewayName 来标识要工作的网关。但请注意,如果在您需要查看指标的这段时间范围内,网关的名称已更改,则您应使用 GatewayId

网关的吞吐量和延迟数据基于网关的所有卷。有关使用网关指标的信息,请参阅测量网关与 AWS 之间的性能

VolumeId

该维度会将您请求的数据限定为特定于卷的指标。通过卷的 VolumeId 标识要使用的存储卷。有关使用卷指标的信息,请参阅测量应用程序与网关之间的性能

监控上传缓冲区

您可以在下面找到有关如何监控网关的上传缓冲区以及如何创建警报以便您在缓冲区超出指定阈值时收到通知的信息。通过使用此方法,您可以在缓冲区存储空间充满并且存储应用程序停止备份到 AWS 前,主动向网关添加缓冲区容量。

您将在缓存卷和磁带网关架构中以相同的方式监控上传缓冲区。有关更多信息,请参阅 AWS Storage Gateway 的工作原理 (架构)

注意

WorkingStoragePercentUsedWorkingStorageUsedWorkingStorageFree 指标代表 Storage Gateway 中的缓存卷功能发布前,仅适用于存储卷设置的上传缓冲区。现在您应使用等效上传缓冲区指标 UploadBufferPercentUsedUploadBufferUsedUploadBufferFree。这些指标适用于两种网关架构。

关注项 如何测量
上传缓冲区使用率

UploadBufferPercentUsedUploadBufferUsedUploadBufferFree 指标与 Average 统计数据结合使用。例如,将 UploadBufferUsedAverage 结合使用,以分析一段时间内的存储使用率。

如需测量上传缓冲区使用率

  1. 通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/

  2. 选择 StorageGateway: Gateway Metrics 维度并找到要使用的网关。

  3. 选择 UploadBufferPercentUsed 指标。

  4. 对于 Time Range,请选择一个值。

  5. 选择 Average 统计数据。

  6. 对于 Period,请选择值 5 分钟以匹配默认报告时间。

得出的按时间排序的数据点集包含上传缓冲区的使用率。

利用以下过程,您可以使用 CloudWatch 控制台创建警报。如需更多了解警报和阈值,请参阅创建 CloudWatch 警报

如需为网关的上传缓冲区设置上阈值警报

  1. 通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/

  2. 选择 Create Alarm 以启动“Create Alarm Wizard”。

  3. 为您的警报指定指标。

    1. 在“Create Alarm Wizard”的 Select Metric 页面上,选择 AWS/StorageGateway:GatewayId,GatewayName 维度,然后找到要使用的网关。

    2. 选择 UploadBufferPercentUsed 指标。使用 Average 统计数据和 5 分钟的周期。

    3. 选择 Continue (继续)

  4. 定义警报名称、描述和阈值。

    1. 在“Create Alarm Wizard”的 Define Alarm 页面上,通过分别在 NameDescription 框中为您的警报提供名称和说明来标识警报。

    2. 定义警报阈值。

    3. 选择 Continue (继续)

  5. 针对该警报配置电子邮件操作。

    1. 在“Create Alarm Wizard”的 Configure Actions 页面上,为 Alarm State 选择 Alarm

    2. Topic 选择 Choose or create email topic

      创建电子邮件主题意味着设置 Amazon Simple Notification Service (Amazon SNS) 主题。有关 Amazon SNS 的更多信息,请参阅设置 Amazon SNS

    3. 对于 Topic,请为主题键入一个描述性名称。

    4. 选择 Add Action

    5. 选择 Continue (继续)

  6. 检查警报设置,然后创建警报。

    1. 在“Create Alarm Wizard”的 Review 页面中,检查警报定义、指标以及此步骤中的关联操作。例如,关联操作包括发送电子邮件通知。

    2. 检查警报摘要后,选择 Save Alarm

  7. 确认您对警报主题的订阅。

    1. 打开发送到您创建主题时提供的电子邮件地址的 Amazon Simple Notification Service (Amazon SNS) 电子邮件主题。

      下图显示了一个通知。

    2. 单击电子邮件中的链接,确认您的订阅。

      将显示订阅确认。

监控缓存卷

您可以在下面找到有关如何监控网关的缓存存储以及如何创建警报以便您在缓存参数超过指定阈值时收到通知的信息。通过使用此警报,您可以了解何时主动向网关添加缓存存储。

您只能监控缓存卷架构中的缓存存储。有关更多信息,请参阅 AWS Storage Gateway 的工作原理 (架构)

关注项 如何测量
缓存总使用率

CachePercentUsedTotalCacheSize 指标结合 Average 统计数据使用。例如,将 CachePercentUsedAverage 统计数据结合使用,以分析一段时间内的缓存使用率。

TotalCacheSize 指标仅在您向网关添加缓存时变化。

网关送达的读取请求百分率。

CacheHitPercent 指标与 Average 统计数据结合使用。

通常,您希望 CacheHitPercent 保持较高。

缓存废数据率 — 即包含未上传到 AWS 的内容

CachePercentDirty 指标与 Average 统计数据结合使用。

一般而言,您希望 CachePercentDirty 保持较低。

测量网关及其所有卷的缓存废数据率

  1. 通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/

  2. 选择 StorageGateway: Gateway Metrics 维度并找到要使用的网关。

  3. 选择 CachePercentDirty 指标。

  4. 对于 Time Range,请选择一个值。

  5. 选择 Average 统计数据。

  6. 对于 Period,请选择值 5 分钟以匹配默认报告时间。

得出的按时间排序的数据点集包含 5 分钟以上的时间内的缓存废数据率。

测量卷的缓存废数据率

  1. 通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/

  2. 选择 StorageGateway: Volume Metrics 维度,然后找到要使用的卷。

  3. 选择 CachePercentDirty 指标。

  4. 对于 Time Range,请选择一个值。

  5. 选择 Average 统计数据。

  6. 对于 Period,请选择值 5 分钟以匹配默认报告时间。

得出的按时间排序的数据点集包含 5 分钟以上的时间内的缓存废数据率。