使用亚马逊进行监控 CloudWatch - fsX for Lustre
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用亚马逊进行监控 CloudWatch

您可以使用 Amazon 监控文件系统 CloudWatch,此工具可从 Amazon FSx for Lustre 收集原始数据,并将数据处理为易读、近乎实时的指标。这些统计数据会保留 15 个月,从而使您能够访问历史信息,并能够更好地了解您的 Web 应用程序或服务的运行情况。默认情况下,Amazon FSx for Lustre 指标数据以 1 分钟 CloudWatch 为间隔自动发送到。有关的更多信息 CloudWatch,请参阅什么是亚马逊 CloudWatch?亚马逊 CloudWatch 用户指南中。

CloudWatch 指标以原始字节的形式报告。字节数不会舍入到十进制或二进制单位倍数。

文件系统指标

FsX for Lustre 将以下指标发布到中的FSx命名空间中 CloudWatch。对于每个指标,FsX for Lustre 每分钟都会在每个磁盘上发出一个数据点。要查看聚合文件系统的详细信息,可以使用Sum统计信息。请注意,FsX for Lustre 文件系统背后的文件服务器分布在多个磁盘上。

指标 描述
DataReadBytes

文件系统读取操作的字节数。

Sum统计数据是该周期与读取操作相关的总字节数。Minimum统计数据是与单个磁盘上的读取操作相关的最小字节数。Maximum统计数据是与磁盘上的读取操作相关的最大字节数。Average统计数据是与每个磁盘的读取操作相关的平均字节数。SampleCount统计数据是磁盘数。

要计算该周期的平均吞吐量(每秒字节),请将该Sum统计数据除以总秒数。

单位:

  • 对于 SumMinimumMaximumAverage,单位为字节。

  • SampleCount 的数量。

有效统计数据:SumMinimumMaximumAverageSampleCount

DataWriteBytes

文件系统写入操作的字节数。

Sum 统计数据是与写入操作关联的总字节数。Minimum统计数据是与单个磁盘上的写入操作相关的最小字节数。Maximum统计数据是与磁盘上的写入操作相关的最大字节数。Average统计数据是与每个磁盘的写入操作相关的平均字节数。SampleCount统计数据是磁盘数。

要计算该周期的平均吞吐量(每秒字节),请将该Sum统计数据除以总秒数。

单位:

  • 对于 SumMinimumMaximumAverage,单位为字节。

  • SampleCount 的数量。

有效统计数据:SumMinimumMaximumAverageSampleCount

DataReadOperations

读取操作数。

Sum统计数据是读取操作总数。Minimum统计数据是单个磁盘上的最小读取操作数。Maximum统计数据是磁盘上的最大读取操作数。Average统计数据是每个磁盘的平均读取操作数。SampleCount统计数据是磁盘数。

要计算该周期的平均读取操作数(每秒操作数),请将该Sum统计数据除以总秒数。

单位:

  • 对于 SumMinimumMaximumAverage,单位为字节。

  • SampleCount 的数量。

有效统计数据:SumMinimumMaximumAverageSampleCount

DataWriteOperations

写入操作数。

Sum统计数据是写入操作总数。Minimum统计数据是单个磁盘上的最小写入操作数。Maximum统计数据是磁盘上的最大写入操作数。Average统计数据是每个磁盘的平均写入操作数。SampleCount统计数据是磁盘数。

要计算该周期的平均写入操作数(每秒操作数),请将该Sum统计数据除以总秒数。

单位:

  • 对于 SumMinimumMaximumAverage,单位为字节。

  • SampleCount 的数量。

有效统计数据:SumMinimumMaximumAverageSampleCount

MetadataOperations

元数据操作数。

Sum统计数据是元数据操作的数量。Minimum统计数据是每个磁盘的最小元数据操作数。Maximum统计数据是每个磁盘的最大元数据操作数。Average统计数据是每个磁盘的平均元数据操作数。SampleCount统计数据是磁盘数。

要计算该周期的平均元数据操作数(每秒操作数),请将该Sum统计数据除以总秒数。

单位:

  • 计数SumMinimumMaximumAverage、和SampleCount

有效统计数据:SumMinimumMaximumAverageSampleCount

FreeDataStorageCapacity

可用存储容量。

Sum统计数据是文件系统中可用的总字节数。Minimum统计数据是最大磁盘中可用的总字节数。Maximum统计数据是剩余可用存储空间最多的磁盘中可用的总字节数。Average统计数据是每个磁盘的平均可用字节数。SampleCount统计数据是磁盘数。

单位:

  • SumMinimum、的字节Maximum

  • SampleCount 的数量。

有效统计数据:SumMinimumMaximumAverageSampleCount

LogicalDiskUsage

存储的逻辑数据量(未压缩)。

Sum统计数据是存储在文件系统中的逻辑字节总数。Minimum统计数据是存储在文件系统磁盘中的最小逻辑字节数。Maximum统计数据是存储在文件系统磁盘中的最大逻辑字节数。Average统计数据是每个磁盘存储的平均逻辑字节数。SampleCount统计数据是磁盘数。

单位:

  • SumMinimum、的字节Maximum

  • SampleCount 的数量。

有效统计数据:SumMinimumMaximumAverageSampleCount

PhysicalDiskUsage

文件系统数据(压缩)实际占用的存储量。

Sum统计数据是文件系统中磁盘中占用的总字节数。Minimum统计数据是最空磁盘中占用的总字节数。Maximum统计数据是最大磁盘中占用的总字节数。Average统计数据是每个磁盘占用的平均字节数。SampleCount统计数据是磁盘数。

单位:

  • SumMinimum、的字节Maximum

  • SampleCount 的数量。

有效统计数据:SumMinimumMaximumAverageSampleCount

AutoImport 和 AutoExport 指标

FsX for Lustre 将以下AutoImport(自动导入)和AutoExport(自动导出)指标发布到的FSx命名空间中 CloudWatch。这些指标使用维度来对您的数据进行更精细的测量。所有AutoImportAutoExport指标都具有FileSystemIdPublisher维度。

指标 描述

AgeOfOldestQueuedMessage

维度:AutoExport

等待导出的最早消息的时间,以秒为单位。

Average统计数据是等待导出的最早消息的平均年限。Maximum统计数据是消息在导出队列中存在的最大秒数。Minimum统计数据是消息在导出队列中存在的最小秒数。零值表示未等待导出的消息。

单位:秒

有效统计数据:AverageMinimumMaximum

RepositoryRenameOperations

维度:AutoExport

文件系统为响应更大的目录重命名而处理的重命名数量。

Sum统计数据是目录重命名产生的重命名操作总数。Average统计数据是文件系统的平均重命名操作次数。Maximum统计数据是文件系统上与目录重命名相关的最大重命名操作数。Minimum统计数据是文件系统上与目录重命名相关的最小重命名数。

单位:计数

有效的统计信息:SumMinimumMaximumAverage

AgeOfOldestQueuedMessage

维度:AutoImport

等待导入的最早消息的时间,以秒为单位。

Average统计数据是等待导入的最早消息的平均年限。Maximum统计数据是消息在导入队列中停留的最大秒数。Minimum统计数据是消息在导入队列中存在的最小秒数。零值表示未等待导入的消息。

单位:秒

有效统计数据:AverageMinimumMaximum

Amazon FSx for Lustre

Amazon FSx for Lustre 指标使用FSx命名空间并提供该维度的指标FileSystemId。使用describe-file-systemsAmazon CLI命令可以找到文件系统的 ID,其形式为 fs-01234567890123456

CloudWatch 和中还有一个额外的维度AutoImport,Amazon CLIAutoImport用于表示哪个服务发布了指标。Publisher