

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用 Amazon 进行监控 CloudWatch
<a name="monitoring-cloudwatch"></a>

Amazon CloudWatch 收集来自您 FSx 的 Windows 文件服务器文件系统的原始数据，并将其处理为可读的、近乎实时的指标。这些统计数据会保存 15 个月，从而使您能够访问历史信息，以帮助您了解工作流程或文件系统的执行情况。

FSx 适用于 Windows 文件服务器在以下域中发布 CloudWatch 指标：
+ 网络 I/O 指标衡量访问文件系统的客户端和文件服务器之间的活动。
+ 文件服务器指标衡量网络吞吐量利用率、文件服务器 CPU 和内存，以及文件服务器磁盘吞吐量和 IOPS 利用率。
+ 磁盘 I/O 指标衡量文件服务器和存储卷之间的活动。
+ 存储卷指标衡量 HDD 存储卷的磁盘吞吐量利用率和 SSD 存储卷的 IOPS 利用率。
+ 存储容量指标衡量存储使用量，包括重复数据删除带来的存储节省。

下图说明了 Window FSx s 文件服务器文件系统、其组件和度量域。

![FSx 适用于 Windows 文件服务器的报告指标用于监控网络 I/O、文件服务器性能和存储卷性能。 CloudWatch](http://docs.amazonaws.cn/fsx/latest/WindowsGuide/images/metrics-overview-FSxW.png)


默认情况下，Amazon for Windows 文件服务器以 1 分钟 FSx 为周期发送指标数据，但以下例外情况每隔 5 分钟发送一次： CloudWatch 
+ `FileServerDiskThroughputBalance`
+ `FileServerDiskIopsBalance`

有关的更多信息 CloudWatch，请参阅 [Amazon 是什么 CloudWatch？](https://docs.amazonaws.cn/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 在《*亚马逊 CloudWatch 用户指南》*中。

对于单可用区文件系统，在文件系统维护或基础设施组件更换期间，可能不会发布指标；对于多可用区文件系统，在主文件服务器和辅助文件服务器之间进行失效转移和失效自动恢复期间，可能不会发布指标。

有些 Amazon FSx CloudWatch 指标报告为原始*字节*。字节数不会舍入到十进制或二进制单位倍数。

**Topics**
+ [CloudWatch 指标和维度](#fsx-windows-metrics)
+ [使用文件系统指标](#how_to_use_metrics)
+ [性能警告和建议](#performance-insights-FSxW)
+ [访问文件系统指标](accessingmetrics.md)
+ [创建 CloudWatch 警报](creating_alarms.md)

## CloudWatch 指标和维度
<a name="fsx-windows-metrics"></a>

FSx 适用于 Windows File Server 的所有文件系统将以下指标发布到亚马逊`AWS/FSx` CloudWatch 命名空间中：
+ `DataReadBytes`
+ `DataWriteBytes`
+ `DataReadOperations`
+ `DataWriteOperations`
+ `MetadataOperations`
+ `FreeStorageCapacity`

FSx Windows File Server 针对吞吐量至少为 32 的文件系统，将以下各节所述 CloudWatch 的指标发布到 Amazon 的`AWS/FSx`命名空间中 MBps。

### 网络 I/O 指标
<a name="fsx-networkio-metrics"></a>

`AWS/FSx`命名空间包括以下网络 I/O 指标。


| 指标 | 说明 | 
| --- | --- | 
| DataReadBytes | 访问文件系统的客户端的读取操作字节数。<br />单位：字节<br />有效统计数据：`Sum` | 
| DataWriteBytes | 访问文件系统的客户端的写入操作字节数。<br />单位：字节<br />有效统计数据：`Sum` | 
| DataReadOperations | 访问文件系统的客户端的读取操作数。<br />单位：计数<br />有效统计数据：`Sum` | 
| DataWriteOperations | 访问文件系统的客户端的写入操作数。<br />单位：计数<br />有效统计数据：`Sum` | 
| MetadataOperations | 访问文件系统的客户端的元数据操作数。<br />单位：计数<br />有效统计数据：`Sum` | 
| ClientConnections | 客户端与文件服务器之间的活动连接数。<br />单位：计数 | 

### 文件服务器指标
<a name="fsx-file-server-metrics"></a>

`AWS/FSx` 命名空间包括以下文件服务器指标。


| 指标 | 说明 | 
| --- | --- | 
| NetworkThroughputUtilization | 文件系统的网络吞吐量占预配置限制的百分比。该指标反映了文件系统上的所有网络活动，包括客户端 I/O、重复数据删除等客户计划的任务、支持客户的功能（如影子副本）以及系统后台活动（例如多可用区复制和维护操作）。<br />单位：百分比 | 
| CPUUtilization | 文件服务器 CPU 资源的利用率百分比。<br />单位：百分比 | 
| MemoryUtilization | 文件服务器内存资源的利用率百分比。<br />单位：百分比 | 
| FileServerDiskThroughputUtilization | 文件服务器与其存储卷之间的磁盘吞吐量，表示为由吞吐能力决定的预调配限制的百分比。<br />单位：百分比 | 
| FileServerDiskThroughputBalance | 文件服务器与其存储卷之间磁盘吞吐量的可用突增点数百分比。适用于预置吞吐量为 256 MBps 或更小的文件系统。<br />单位：百分比 | 
| FileServerDiskIopsUtilization | 文件服务器与存储卷之间的磁盘 IOPS，表示为由吞吐能力决定的预调配限制的百分比。<br />单位：百分比 | 
| FileServerDiskIopsBalance | 文件服务器与其存储卷之间磁盘 IOPS 的可用突增点数百分比。适用于预置吞吐量为 256 MBps 或更小的文件系统。<br />单位：百分比 | 

### 磁盘 I/O 指标
<a name="fsx-diskio-metrics"></a>

`AWS/FSx`命名空间包括以下磁盘 I/O 指标。


| 指标 | 说明 | 
| --- | --- | 
| DiskReadBytes | 访问存储卷的读取操作字节数。<br />单位：字节<br />有效统计数据：Sum | 
| DiskWriteBytes | 访问存储卷的写入操作字节数。<br />单位：字节<br />有效统计数据：Sum | 
| DiskReadOperations | 访问存储卷的文件服务器的读取操作数。<br />单位：计数<br />有效统计数据：`Sum` | 
| DiskWriteOperations | 访问存储卷的文件服务器的写入操作数。<br />单位：计数<br />有效统计数据：`Sum` | 

### FSx 适用于 Windows 存储量指标
<a name="fsx-storage-volume-metrics"></a>

`AWS/FSx` 命名空间包括以下存储卷指标。


| 指标 | 说明 | 
| --- | --- | 
| DiskThroughputUtilization | （仅限 HDD）文件服务器与其存储卷之间的磁盘吞吐量，表示为由存储卷决定的预调配限制的百分比。<br />单位：百分比 | 
| DiskThroughputBalance | （仅限 HDD）存储卷磁盘吞吐量和磁盘 IOPS 的可用突增点数百分比。<br />单位：百分比 | 
| DiskIopsUtilization | （仅限 SSD）文件服务器与存储卷之间的磁盘 IOPS，表示为由存储卷决定的预调配 IOPS 的百分比。<br />单位：百分比 | 

### 存储容量指标
<a name="fsx-storage-capacity-metrics"></a>

`AWS/FSx` 命名空间包括以下存储容量指标。


| 指标 | 说明 | 
| --- | --- | 
| FreeStorageCapacity | 可用存储容量的大小。<br />单位：字节<br />有效统计数据：`Average`、`Minimum` | 
| StorageCapacityUtilization | 已用物理存储容量，表示为总存储容量的百分比。<br />单位：百分比 | 
| DeduplicationSavedStorage | 启用了重复数据删除时节省的存储空间量。<br />单位：字节 | 

### Windows 文件服务器指标的 FSx 命名空间和维度
<a name="fsx-dimensions"></a>

FSx 对于 Windows 文件服务器指标，请使用`FSx`命名空间并提供单个维度的指标`FileSystemId`。您可以使用[describe-file-systems](https://docs.amazonaws.cn/cli/latest/reference/fsx/describe-file-systems.html) Amazon CLI 命令或 [DescribeFileSystems](https://docs.amazonaws.cn/fsx/latest/APIReference/API_DescribeFileSystems.html)API 命令查找文件系统的 ID。文件系统 ID 的形式为{{fs-0123456789abcdef0}}。

## 使用文件系统指标
<a name="how_to_use_metrics"></a>

每个 Amazon FSx 文件系统都有两个主要的架构组件：
+ **文件服务器**，用于为访问文件系统的客户端提供数据。
+ **存储卷**，用于托管文件系统中的数据。

FSx 适用于 Windows File Server 的报告指标用于跟踪文件系统的文件服务器和存储卷的性能和资源利用率。 CloudWatch 下图说明了 Amazon FSx 文件系统及其架构组件以及可供监控的性能和资源 CloudWatch 指标。针对一组指标显示的关键属性是文件系统属性，用于确定这些指标的容量。调整该属性会修改该组指标的文件系统性能。

![FSx 适用于 Windows 文件服务器的报告指标用于监控网络 I/O、文件服务器性能和存储卷性能。 CloudWatch](http://docs.amazonaws.cn/fsx/latest/WindowsGuide/images/file-server-metrics-FSxW.png)


使用 Amazon FSx 控制台中的 “**监控和性能**” 面板查看下表中描述的 Windows 文件服务器 CloudWatch 指标。 FSx 



- **Summary**
  - **如何…:** …确定文件系统的总 IOPS？ / **图表:** 总 IOPS / **相关指标:** 总和（`DataReadOperations` \+ `DataWriteOperations` \+ `MetadataOperations`）/周期（以秒为单位）
  - **如何…:** …确定文件系统的总吞吐量？ / **图表:** 总吞吐量 / **相关指标:** 总和（`DataReadBytes` \+ `DataWriteBytes`）/周期（以秒为单位）
  - **如何…:** …确定文件系统上的可用存储容量大小？ / **图表:** 可用存储容量 / **相关指标:** FreeStorageCapacity
  - **如何…:** …客户端与文件服务器之间建立的连接数？ / **图表:** 客户端连接 / **相关指标:** ClientConnections

- **仓储服务**
  - **如何…:** …确定已用物理磁盘空间量（表示为文件系统总存储容量的百分比）？ / **图表:** 存储容量利用率 / **相关指标:** StorageCapacityUtilization
  - **如何…:** …确定通过重复数据删除节省的物理磁盘空间量？ / **图表:** 通过重复数据删除节省的存储容量 / **相关指标:** DeduplicationSavedStorage

- **性能 – 文件服务器**
  - **如何…:** …确定访问文件系统的客户端的网络吞吐量（表示为文件系统预调配吞吐量的百分比）？ / **图表:** 网络吞吐量利用率 / **相关指标:** NetworkThroughputUtilization1
  - **如何…:** …确定文件服务器与其存储卷之间的磁盘吞吐量（表示为由吞吐能力决定的预调配限制的百分比）？ / **图表:** 磁盘吞吐量利用率 / **相关指标:** FileServerDiskThroughputUtilization1
  - **如何…:** …确定文件服务器与其存储卷之间磁盘吞吐量的可用突增点数百分比？ / **图表:** 磁盘吞吐量突增平衡 / **相关指标:** FileServerDiskThroughputBalance
  - **如何…:** …确定文件服务器与存储卷之间的磁盘 IOPS（表示为由吞吐能力决定的预调配限制的百分比）？ / **图表:** 磁盘 IOPS 利用率 / **相关指标:** FileServerDiskIopsUtilization
  - **如何…:** …确定文件服务器与存储卷之间磁盘 IOPS 的可用突增点数百分比？ / **图表:** 磁盘 IOPS 突增平衡 / **相关指标:** FileServerDiskIopsBalance
  - **如何…:** …确定文件服务器的 CPU 利用率百分比？ / **图表:** CPU 使用率 / **相关指标:** CPUUtilization
  - **如何…:** …确定文件服务器的内存利用率百分比？ / **图表:** 内存利用率 / **相关指标:** MemoryUtilization

- **性能 – 存储卷**
  - **如何…:** …确定访问存储卷的操作吞吐量（表示为由 HDD 存储容量决定的预调配限制的百分比）？ / **图表:** 磁盘吞吐量利用率（HDD） / **相关指标:** DiskThroughputUtilization
  - **如何…:** …确定访问 HDD 存储卷的操作可用吞吐量和 IOPS 突增点数百分比？ / **图表:** 磁盘吞吐量突增平衡（HDD） / **相关指标:** DiskThroughputBalance2
  - **如何…:** …确定访问存储卷的操作 IOPS（表示为由 HDD 存储容量决定的预调配限制的百分比）？ / **图表:** 磁盘 IOPS 利用率（HDD） / **相关指标:** SUM（DiskReadOperations \+ DiskWriteOperations）/ Period（秒）/（12 \* 预置 HDD 存储容量（TiB））
  - **如何…:** …确定访问存储卷的操作 IOPS（表示为由 SSD 存储容量决定的预调配限制的百分比）？ / **图表:** 磁盘 IOPS 利用率（SSD） / **相关指标:** DiskIopsUtilization



**注意**  
1我们建议您将平均吞吐能力利用率保持在 50% 以下，以确保有足够的备用吞吐能力来应对工作负载的意外峰值以及任何后台 Windows 存储操作（例如存储同步、重复数据删除或影子复制）。  
2根据工作负载，HDD 存储卷可能会出现显著的性能差异。IOPS 或吞吐量突然激增可能导致磁盘性能下降。有关更多信息，请参阅 [HDD 突增性能](performance.md#hdd-burst-performance)。

## 性能警告和建议
<a name="performance-insights-FSxW"></a>

FSx Windows 版会针对配置为至少 32 的吞吐容量的文件系统提供性能警告 MBps。每当其中一个 CloudWatch 指标连续多个数据点接近或超过预先确定的阈值时，Amazon 就会 FSx 显示一组指标的警告。这些警告会为您提供切实可行的建议，您可以使用这些建议来优化文件系统的性能。

可以在**监控和性能**控制面板的多个区域内访问警告。所有活动或最近的 Amazon FSx 性能警告以及为文件系统配置的处于 CloudWatch 警报状态的所有警报都将显示在 “**监控和性能**” 面板的 “**摘要**” 部分中。仪表板中显示指标图表的部分也会显示警告。

您可以为任何 Amazon FSx 指标创建 CloudWatch 警报。有关更多信息，请参阅 [创建 CloudWatch 警报](creating_alarms.md)。

### 使用性能警告提高文件系统的性能
<a name="resolve-warnings"></a>

Amazon FSx 提供切实可行的建议，您可以使用这些建议来优化文件系统的性能。这些建议介绍了如何解决潜在的性能瓶颈。如果您希望继续进行活动，或者该活动对文件系统的性能造成了影响，您可以采取建议的操作。根据触发警告的指标，您可以通过增加文件系统的吞吐能力或存储容量来解决警告，如下表所述。


<table>
<thead>
  <tr><th>如果有针对此指标的警告</th><th>请执行该操作</th></tr>
</thead>
<tbody>
  <tr><td>网络吞吐量 – 利用率</td><td rowspan="5">[增加吞吐能力](increase-throughput-capacity.md)</td></tr>
  <tr><td>文件服务器 > 磁盘 IOPS – 利用率</td></tr>
  <tr><td>文件服务器 > 磁盘吞吐量 – 利用率</td></tr>
  <tr><td>文件服务器 > 磁盘 IOPS – 突增余额</td></tr>
  <tr><td>文件服务器 > 磁盘吞吐量 – 突增余额</td></tr>
  <tr><td>存储容量利用率</td><td>[增加存储容量](increase-storage-capacity.md)</td></tr>
  <tr><td>存储卷 > 磁盘吞吐量 – 利用率（HDD）</td><td rowspan="2">[增加存储容量](increase-storage-capacity.md)或[切换到 SDD 存储类型](updating-storage-type.md)</td></tr>
  <tr><td>存储卷 > 磁盘吞吐量 – 突增余额（HDD）</td></tr>
  <tr><td>存储卷 > 磁盘 IOPS – 利用率（SSD）</td><td>[提高 SSD IOPS](how-to-provision-ssd-iops.md)</td></tr>
</tbody>
</table>


**注意**  
某些文件系统事件可能会消耗磁盘 I/O 性能资源，并可能触发性能警告。例如：  
存储容量扩展的优化阶段会增加磁盘吞吐量，如 [增加存储容量并提升文件系统性能](managing-storage-configuration.md#storage-capacity-increase-and-performance) 中所述
对于多可用区文件系统，吞吐能力扩展、硬件更换或可用区中断等事件会导致自动失效转移和失效自动恢复事件。在此期间发生的任何数据更改都需要在主文件服务器和辅助文件服务器之间同步，Windows Server 运行的数据同步作业可能会消耗磁盘 I/O 资源。有关更多信息，请参阅 [管理吞吐能力](managing-throughput-capacity.md)。

有关文件系统性能的更多信息，请参阅 [FSx 用于 Windows 文件服务器的性能性能](performance.md)。