本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
监控您的磁带网关
在本节中,您可以找到有关如何监控磁带网关、与磁带网关关联的虚拟磁带、缓存存储和上传缓冲区的信息。使用 AWS 管理控制台可查看您的磁带网关的指标。借助指标,您可以跟踪磁带网关的运行状况并设置警报,以便在一个或多个指标超出定义的阈值时通知您。
Storage Gateway 将提供 CloudWatch 指标而不会加收任何费用。Storage Gateway 指标将会保留两周的时间。通过使用这些指标,您可以访问历史信息并更好地了解您的磁带网关和虚拟磁带的性能。有关 CloudWatch 的详细信息,请参阅 Amazon CloudWatch 用户指南。
通过 CloudWatch 日志组获取磁带网关运行状况日志
您可以使用 Amazon CloudWatch Logs 获取有关磁带网关和相关资源的运行状况的信息。您可以使用日志来监控网关遇到的错误。此外,您可以使用 Amazon CloudWatch 订阅筛选器来实时自动处理日志信息。有关更多信息,请参阅 https://docs.amazonaws.cn/AmazonCloudWatch/latest/logs/Subscriptions.html 中的使用订阅实时处理日志数据Amazon CloudWatch 用户指南。
例如,假设您的网关部署在启用了 VMware HA 的集群中,并且您需要了解任何错误。您可以配置 CloudWatch 日志组来监控网关,并在网关遇到错误时收到通知。您可以在激活网关时或在激活网关并运行后配置组。有关如何在激活网关时配置 CloudWatch 日志组的信息,请参阅 配置 Amazon CloudWatch 日志记录。有关 CloudWatch 日志组的一般信息,请参阅 中的使用日志组和日志流。Amazon CloudWatch 用户指南
有关如何排查和修复此类错误的信息,请参阅排查虚拟磁带问题。
以下过程显示了激活网关后如何配置 CloudWatch 日志组。
以下是发送到 CloudWatch 的磁带网关事件消息的示例。此示例显示了一条 TapeStatusTransition
消息。
{ "severity": "INFO", "source": "FZTT16FCF5", "type": "TapeStatusTransition", "gateway": "sgw-C51DFEAC", "timestamp": "1581553463831", "newStatus": "RETRIEVED" }
使用 Amazon CloudWatch 指标
您可以使用 AWS 管理控制台或 CloudWatch API 来获得您的磁带网关的监控数据。控制台将根据来自 CloudWatch API 的原始数据显示一系列图表。也可以通过
Amazon AWS 开发工具包 (SDK)
无论选择何种方法使用指标,您都必须指定下列信息:
-
要使用的指标维度。维度 是帮助您对某指标进行唯一标识的名称/值对。Storage Gateway 的维度为
GatewayId
和GatewayName
。在 CloudWatch 控制台中,您可以使用Gateway Metrics
视图来轻松选择特定于网关和特定于磁带的维度。有关维度的更多信息,请参阅 Amazon CloudWatch 用户指南 中的维度。 -
指标名称,如
ReadBytes
。
下表总结了可供您使用的 Storage Gateway 指标数据的类型。
Amazon CloudWatch 命名空间 | 维度 | 说明 |
---|---|---|
AWS/StorageGateway |
GatewayId 、GatewayName
|
这些维度用于筛选说明磁带网关各个方面的指标数据。您可以通过指定 磁带网关的吞吐量和延迟数据基于磁带网关中的所有虚拟磁带。 数据在 5 分钟期间内自动可用,无需收费。 |
网关和磁带指标的使用方式类似于其他服务指标。您可以在下面所列的 CloudWatch 文档中找到一个有关某些最常见的指标任务的讨论:
了解虚拟磁带指标
您可以在下面找到有关包含虚拟磁带的 Storage Gateway 指标的信息。每个磁带均有与其关联的一组指标。
某些特定于磁带的指标可能与某些特定于网关的指标同名。这些指标代表同类度量,但其范围限于磁带,而非网关。在开始工作之前,请指定要使用网关指标还是磁带指标。在使用磁带指标时,请为要查看其指标的磁带指定磁带 ID。有关更多信息,请参阅 使用 Amazon CloudWatch 指标。
下表描述了可用来获取您磁带的相关信息的 Storage Gateway 指标。
指标 | 说明 |
---|---|
CachePercentDirty |
磁带在未传送到 AWS 的网关缓存的总体比例中的占比。样本在报告周期结束时采用。 使用网关的 单位:百分比 |
ClientTraffic |
磁带在本地客户端发送和接收的字节数。也就是说,来自客户端应用程序的 单位:字节 |
CloudTraffic |
上传的字节数以及从云下载到磁带的字节数。 单位:字节 |
CpuUsage |
磁带当前所使用的已分配 CPU 计算单位的百分比。 单位:百分比 |
HealthNotificationCount |
由磁带发送的运行状况通知的数量。 单位:计数 |
MemoryUsage |
磁带当前所使用的已分配内存的百分比。 单位:百分比 |
测量您的磁带网关和 AWS 之间的性能
数据吞吐量、数据延迟和每秒操作数是您可用来理解使用磁带网关的应用程序存储性能状况的三个衡量指标。当您使用正确的聚合统计数据时,可使用提供给您的 Storage Gateway 指标来衡量这些值。
统计数据 是某指标在指定时间内的集合。当您在 CloudWatch 中查看某指标的值时,将 Average
统计数据用于数据延迟(毫秒),将 Samples
统计数据用于每秒输入/输出操作数 (IOPS)。有关更多信息,请参阅 Amazon CloudWatch 用户指南 中的统计数据。
下表总结了用来测量您的磁带网关与 AWS 之间的吞吐量、延迟和 IOPS 的指标以及相应的统计数据。
关注项 | 如何测量 |
---|---|
延迟 | 将 ReadTime 和 WriteTime 指标与 Average CloudWatch 统计数据结合使用。例如,Average 指标的 ReadTime 值为您提供采样周期内的每个操作的延迟时间。
|
到 AWS 的吞吐量 | 将 CloudBytesDownloaded 和 CloudBytesUploaded 指标与 Sum CloudWatch 统计数据结合使用。例如,5 分钟样本周期内的 CloudBytesDownloaded 指标的 Sum 值除以 300 秒,可以得出从 AWS 到磁带网关的吞吐量(以每秒字节数的速率表示)。
|
到 AWS 的数据延迟 | 将 CloudDownloadLatency 指标与 Average 统计数据结合使用。例如,Average 指标的 CloudDownloadLatency 统计数据为您提供每操作延迟。
|
测量从磁带网关到 AWS 的上传数据吞吐量
-
通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/
。 -
选择 Metrics 选项卡。
-
选择 StorageGateway: Gateway Metrics (StorageGateway: 网关指标) 维度并找到要使用的磁带网关。
-
选择
CloudBytesUploaded
指标。 -
对于 Time Range,请选择一个值。
-
选择
Sum
统计数据。 -
对于 Period,请选择值 5 分钟或更长的时间。
-
在得出的按时间排序的数据点集中,将各个数据点除以周期 (以秒为单位) 获得该样本周期当时的吞吐量。
下图使用 CloudBytesUploaded
统计数据显示了网关磁带的 Sum
指标。在图中,将光标悬浮在数据点上就会显示该数据点信息,包括其值和上传的字节数。将该值除以 Period 值 (5 分钟) 得出采样点当时的吞吐量。对于高亮点,从磁带网关到 AWS 的吞吐量为 555,544,576 字节除以 300 秒,即 1.7 MB/s。

测量从磁带网关到 AWS 的数据延迟
-
通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/
。 -
选择 Metrics 选项卡。
-
选择 StorageGateway: GatewayMetrics (StorageGateway: 网关指标) 维度并找到要使用的磁带网关。
-
选择
CloudDownloadLatency
指标。 -
对于 Time Range,请选择一个值。
-
选择
Average
统计数据。 -
对于 Period,请选择值 5 分钟以匹配默认报告时间。
得出的按时间排序的数据点集包含以秒为单位的延迟。
对磁带网关到 AWS 的吞吐量设置上阈值警报
-
通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/
。 -
选择 Create Alarm (创建警报) 可启动“Create Alarm (创建警报)”向导。
-
选择 StorageGateway: Gateway Metrics (StorageGateway: 网关指标) 维度并找到要使用的磁带网关。
-
选择
CloudBytesUploaded
指标。 -
通过定义
CloudBytesUploaded
指标在指定时间段大于或等于指定值时的警报状态,定义警报。例如,可定义CloudBytesUploaded
指标在 60 分钟内大于 10MB 时的警报状态。 -
针对该警报状态配置要采取的行动。例如,可获得向您发送的电子邮件通知。
-
选择 Create Alarm。
如需设置从 AWS 读取数据的上阈值警报
-
通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/
。 -
选择 Create Alarm (创建警报) 可启动“Create Alarm (创建警报)”向导。
-
选择 StorageGateway: Gateway Metrics (StorageGateway: 网关指标) 维度并找到要使用的磁带网关。
-
选择
CloudDownloadLatency
指标。 -
通过定义
CloudDownloadLatency
指标在指定时间段大于或等于指定值时的警报状态,定义警报。例如,您可以定义CloudDownloadLatency
在 2 小时内大于 60000 毫秒时的警报状态。 -
针对该警报状态配置要采取的行动。例如,可获得向您发送的电子邮件通知。
-
选择 Create Alarm。