监控磁带网关 - Amazon Storage Gateway
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

Amazon S3 文件网关文档已移至什么是 Amazon S3 文件网关

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控磁带网关

在本节中,您可以找到有关如何监控磁带网关、与磁带网关相关联的虚拟磁带、缓存存储和上传缓冲区的信息。您可以使用Amazon Web Services Management Console以查看磁带网关的指标。借助指标,您可以跟踪磁带网关的运行状况并设置警报,以便在一个或多个指标超出定义的阈值时通知您。

Storage Gateway 免额外付费提供 CloudWatch 指标。将会保 Storage Gateway 指标的记录期限为两周。通过使用这些指标,您可以访问历史信息并更好地了解您的磁带网关和虚拟磁带的性能。有关 CloudWatch 的详细信息,请参阅Amazon CloudWatch 用户指南.

利用 CloudWatch 日志组获取磁带网关 Health 日

您可以使用 Amazon CloudWatch Logs 获取有关磁带网关和相关资源的运行状况的信息。您可以使用日志来监控网关遇到的错误。此外,您可以使用 Amazon CloudWatch 订阅筛选器来实时自动处理日志信息。有关更多信息,请参阅 。使用订阅实时处理日志数据中的Amazon CloudWatch 用户指南。

例如,假设您的网关已部署到启用了 VMware HA 的集群中,并且您需要了解任何错误。您可以配置 CloudWatch 日志组来监控网关,并在网关遇到错误时收到通知。您可以在激活网关时或在激活网关并运行后配置组。有关如何在激活网关时配置 CloudWatch 日志组的信息,请参阅配置磁带网关. 有关 CloudWatch 日志组的一般信息,请参阅。使用日志组和日志流中的Amazon CloudWatch 用户指南。

有关如何排查和修复此类错误的信息,请参阅解决虚拟磁带问题

以下过程显示了激活网关后如何配置 CloudWatch 日志组。

配置 CloudWatch 日志组以与文件网关一起使用

  1. 登录到Amazon Web Services Management Console然后打开 Storage Gateway 控制台https://console.aws.amazon.com/storagegateway/home.

  2. 在导航窗格中,选择网关,然后选择要为其配置 CloudWatch 日志组的网关。

  3. 适用于操作,选择编辑网关信息或者在详细信息选项卡,下Health 日志未启用,选择配置日志组以打开编辑客户网关名称对话框。

  4. 适用于网关运行状况日志组,选择以下选项之一:

    • Disable logging (禁用日志记录)如果您不想使用 CloudWatch 日志组监控网关。

    • 创建新的日志组以创建新的 CloudWatch 日志组。

    • 使用现有日志组以使用已存在的 CloudWatch 日志组。

      从中选择日志组现有的日志组列表.

  5. 选择保存更改

  6. 要查看网关的运行状况日志,请执行以下操作:

    1. 在导航窗格中,选择网关,然后选择您为其配置 CloudWatch 日志组的网关。

    2. 选择详细信息选项卡和下Health 日志,选择CloudWatch Logs (CloudWatch 日志). 这些区域有:日志组详细信息将在 CloudWatch 控制台中打开页面。

以下是发送到 CloudWatch 的磁带网关事件消息的示例。此示例显示了一条 TapeStatusTransition 消息。

{ "severity": "INFO", "source": "FZTT16FCF5", "type": "TapeStatusTransition", "gateway": "sgw-C51DFEAC", "timestamp": "1581553463831", "newStatus": "RETRIEVED" }

使用 Amazon CloudWatch 指标

您可以使用以下两种方法获得磁带网关的监控数据:Amazon Web Services Management Console或 CloudWatch API。控制台将根据来自 CloudWatch API 的原始数据显示一系列图表。CloudWatch API 也可以通过其中一个亚马逊Amazon软件开发工具包 (SDK)或者Amazon CloudWatch API工具。根据您的需求差异,您可能倾向于使用控制台中显示的图表,也可能倾向于检索自 API 的图表。

无论选择何种方法使用指标,您都必须指定下列信息:

  • 要使用的指标维度。维度 是帮助您对某指标进行唯一标识的名称/值对。Storage Gateway 的维度是GatewayIdGatewayName. 在 CloudWatch 控制台中,您可以使用Gateway Metrics可轻松选择特定于网关和特定于磁带的维度。有关维度的更多信息,请参阅。维度中的Amazon CloudWatch 用户指南.

  • 指标名称,如 ReadBytes

下表总结了可供您使用的 Storage Gateway 指标数据的类型。

Amazon CloudWatch 命名空间 维度 描述
AWS/StorageGateway GatewayId, GatewayName

这些维度筛选描述磁带网关各个方面的指标数据。您可以通过指定要使用的磁带网关指定要使用的GatewayIdGatewayName维度。

磁带网关的吞吐量和延迟数据基于磁带网关中的所有虚拟磁带。

数据在 5 分钟期间内自动可用,无需收费。

网关和磁带指标的使用方式类似于其他服务指标。您可以在下面所列的 CloudWatch 文档中找到一个有关某些最常见的指标任务的讨论:

了解虚拟磁带指标

您可以在下面找到有关包含虚拟磁带的 Storage Gateway 指标的信息。每个磁带均有与其关联的一组指标。

某些特定于磁带的指标可能与某些特定于网关的指标同名。这些指标代表同类度量,但其范围限于磁带,而非网关。在开始工作之前,请指定要使用网关指标还是磁带指标。在使用磁带指标时,请为要查看其指标的磁带指定磁带 ID。有关更多信息,请参阅 使用 Amazon CloudWatch 指标

下表描述了可用来获取您磁带的相关信息的 Storage Gateway 指标。

指标 描述
CachePercentDirty

磁带在未传送到 Amazon 的网关缓存的总体比例中的占比。样本在报告周期结束时采用。

使用网关的 CachePercentDirty 指标来查看未传送到 Amazon 的网关缓存总体比例。有关更多信息,请参阅 了解网关指标

单位:百分比

CloudTraffic

上传的字节数以及从云下载到磁带的字节数。

单位:字节

IoWaitPercent

磁带当前所使用的已分配 IOWatch 单位的百分比。

单位:百分比

HealthNotification

由磁带发送的运行状况通知的数量。

单位:计数

MemUsedBytes

磁带当前所使用的已分配内存的百分比。

单位:百分比

MemTotalBytes

磁带当前所使用的总内存的百分比。

单位:百分比

ReadBytes

报告周期内文件共享从场内应用程序读取的文件共享的总字节数。

将此指标与 Sum 统计数据结合使用可测量吞吐量,将其与 Samples 统计数据结合使用可测量 IOPS。

单位:字节

UserCpuPercent

磁带当前所使用的已分配 CPU 计算单位的百分比。

单位:百分比

WriteBytes

报告周期内写入到场内应用程序的总字节数。

将此指标与 Sum 统计数据结合使用可测量吞吐量,将其与 Samples 统计数据结合使用可测量 IOPS。

单位:字节

测量磁带网关和Amazon

数据吞吐量、数据延迟和每秒操作数是您可用来理解使用磁带网关的应用程序存储性能状况的衡量指标。当您使用正确的聚合统计数据时,可使用提供给您的 Storage Gateway 指标来衡量这些值。

统计数据 是某指标在指定时间内的集合。当您在 CloudWatch 中查看指标的值时,请使用Average有关数据延迟(毫秒)的统计信息,然后使用Samples每秒输入/输出操作数 (IOPS) 统计数据。有关更多信息,请参阅 Amazon CloudWatch 用户指南 中的统计信息

下表总结了可用来衡量磁带网关和之间的吞吐量、延迟和 IOPS 的指标和相应统计数据。Amazon.

关注项 如何测量
延迟 使用ReadTimeWriteTime使用的指标AverageCloudWatch 统计数据。例如,Average 指标的 ReadTime 值为您提供采样周期内的每个操作的延迟时间。
到 Amazon 的吞吐量 使用CloudBytesDownloadedCloudBytesUploaded使用的指标SumCloudWatch 统计数据。例如,Sum的值CloudBytesDownloaded5 分钟样本周期内的指标除以 300 秒可得出以下的吞吐量。Amazon以每秒字节数为单位的速率。
到 Amazon 的数据延迟 CloudDownloadLatency 指标与 Average 统计数据结合使用。例如,Average 指标的 CloudDownloadLatency 统计数据为您提供每操作延迟。

如需衡量从磁带网关到的上传数据吞吐量Amazon

  1. 访问 https://console.aws.amazon.com/cloudwatch/,打开 CloudWatch 控制台。

  2. 选择 Metrics (指标) 选项卡。

  3. 选择StorageGateway: 网关指标维度并找到要使用的磁带网关。

  4. 选择 CloudBytesUploaded 指标。

  5. 对于 Time Range,请选择一个值。

  6. 选择 Sum 统计数据。

  7. 对于 Period,请选择值 5 分钟或更长的时间。

  8. 在得出的按时间排序的数据点集中,将各个数据点除以周期 (以秒为单位) 获得该样本周期当时的吞吐量。

下图使用 CloudBytesUploaded 统计数据显示了网关磁带的 Sum 指标。在图中,将光标悬浮在数据点上就会显示该数据点信息,包括其值和上传的字节数。将该值除以 Period 值 (5 分钟) 得出采样点当时的吞吐量。关于突出显示的问题,从磁带网关到的吞吐量Amazon为 555,544,576 字节除以 300 秒,即 1.7 MB/s。

如需衡量从磁带网关到的数据延迟Amazon

  1. 访问 https://console.aws.amazon.com/cloudwatch/,打开 CloudWatch 控制台。

  2. 选择 Metrics (指标) 选项卡。

  3. 选择StorageGateway: GatewayMetrics维度并找到要使用的磁带网关。

  4. 选择 CloudDownloadLatency 指标。

  5. 对于 Time Range,请选择一个值。

  6. 选择 Average 统计数据。

  7. 对于 Period,请选择值 5 分钟以匹配默认报告时间。

得出的按时间排序的数据点集包含以秒为单位的延迟。

如需将磁带网关吞吐量的上阈值警报设置为Amazon

  1. 访问 https://console.aws.amazon.com/cloudwatch/,打开 CloudWatch 控制台。

  2. 选择 Create Alarm (创建警报) 可启动“Create Alarm (创建警报)”向导。

  3. 选择StorageGateway: 网关指标维度并找到要使用的磁带网关。

  4. 选择 CloudBytesUploaded 指标。

  5. 通过定义 CloudBytesUploaded 指标在指定时间段大于或等于指定值时的警报状态,定义警报。例如,可定义 CloudBytesUploaded 指标在 60 分钟内大于 10MB 时的警报状态。

  6. 针对该警报状态配置要采取的行动。例如,可获得向您发送的电子邮件通知。

  7. 选择 Create Alarm(创建告警)

如需设置从读取数据的上阈值警报Amazon

  1. 访问 https://console.aws.amazon.com/cloudwatch/,打开 CloudWatch 控制台。

  2. 选择 Create Alarm (创建警报) 可启动“Create Alarm (创建警报)”向导。

  3. 选择StorageGateway: 网关指标维度并找到要使用的磁带网关。

  4. 选择 CloudDownloadLatency 指标。

  5. 通过定义 CloudDownloadLatency 指标在指定时间段大于或等于指定值时的警报状态,定义警报。例如,您可以定义 CloudDownloadLatency 在 2 小时内大于 60000 毫秒时的警报状态。

  6. 针对该警报状态配置要采取的行动。例如,可获得向您发送的电子邮件通知。

  7. 选择 Create Alarm(创建告警)