

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 增强型监控控制面板
<a name="enhanced-monitoring-dashboard"></a>

增强型监控控制面板可让您全面了解与监控任务和复制实例相关的关键指标。您可以在控制面板中筛选、汇总和可视化要跟踪的特定资源的指标。控制面板直接发布现有的 CloudWatch 指标，使您无需更改数据点采样时间即可监控资源性能。

**Topics**
+ [增强型监控控制面板概览](#overview-enhanced-monitoring-dashboard)
+ [在增强型监控控制面板中查看指标](#access-enhanced-monitoring-dashboard)
+ [增强型监控控制面板视图](#enhanced-monitoring-dashboard-views)
+ [保留增强监测指标](#retention-enhanced-monitoring-metrics)

## 增强型监控控制面板概览
<a name="overview-enhanced-monitoring-dashboard"></a>

Amazon DMS 控制台中提供了增强型监控控制面板。该控制面板提供了一个用户友好的界面，包含直观的可视化内容和图表，使您能够有效地监控、分析和优化数据迁移流程。借助增强型监控功能，您可以通过集中查看所有相关信息来简化监控流程并快速识别潜在问题。

在增强型监控控制面板上，您可以查看任务和复制实例的指标以及端点的详细信息。您还可以跟踪当前区域的活动 CloudWatch 警报数量和服务运行状况。该控制面板可在所有提供 Amazon DMS 的商业区域使用。使用此控制面板不会产生额外费用。

**注意**  
增强型监控控制面板不支持 Amazon DMS Serverless 复制。

## 在增强型监控控制面板中查看指标
<a name="access-enhanced-monitoring-dashboard"></a>

要在增强型监控控制面板中查看指标，请确保您拥有具有 CloudWatch 权限的 IAM 角色。此外，您还需要 `cloudwatch:DescribeAlarms` 和 `health:DescribeEvents` 权限才能查看指标。最后，要在增强型监控控制面板中访问 CloudWatch 指标，您还必须有权访问 IAM 策略中的 [GetMetricData](https://docs.amazonaws.cn/AmazonCloudWatch/latest/APIReference/API_GetMetricData.html) API。如果没有这些权限或仅对一部分 API 具有权限，则将无法在增强型监控控制面板中查看指标。有关所需 IAM 权限的信息，请参阅[使用所需的 IAM 权限 Amazon DMS](security-iam.md#CHAP_Security.IAMPermissions)。

## 增强型监控控制面板视图
<a name="enhanced-monitoring-dashboard-views"></a>

Amazon DMS 增强型监控控制面板有两种类型的视图：“任务”视图和“复制实例”视图。

### “任务”视图
<a name="enhanced-monitoring-dashboard-tasks-view"></a>

Amazon DMS 的增强型控制面板中的**任务**视图全面概述了您的数据迁移任务。此视图提供了一个集中位置，您可以在其中通过直观的图表和可视化内容来监控和分析任务的各个方面。

通过**任务**视图，您可以深入了解与迁移任务相关的关键指标和统计数据，从而能够更好地了解迁移任务的性能、进度和整体运行状况。以下是**任务**视图的一些主要特征和优势：
+ **任务状态摘要**：此图表显示任务在不同状态类别（例如“正在运行”、“已停止”、“失败”或“已完成”）中的分布情况。您可以快速识别需要注意的任务并执行适当的操作。
+ **性能指标**：这些图表说明了任务的性能，包括吞吐量、延迟、CPU 利用率等指标。这些指标可帮助您识别潜在的瓶颈并优化迁移流程。
+ **错误分析**：如果任务失败或出错，**任务**视图会提供有关遇到的错误及其关联日志条目的详细信息。这些信息可帮助您更有效地排查和解决问题。
+ **历史趋势**：该控制面板包含历史数据，允许您分析任务在一段时间内的执行情况。您可以根据这些历史趋势来识别规律，跟踪进度并做出明智的决策。
+ **筛选和排序**：在**任务**视图中，您可以根据各种标准（例如任务名称、标签或特定时间范围）对任务进行筛选和排序。这种灵活性使您可以专注于与您的需求最相关的任务或方面。

以下列表描述了您可以在**任务**视图中看到的指标：
+ **完全加载吞吐量带宽 - 源**：表示从源的完全加载传输的传入数据，以每秒 KB 数为单位。
+ **完全加载吞吐量带宽 - 目标**：表示从目标的完全加载传输的传出数据，以每秒 KB 数为单位。
+ **完全加载吞吐量行数 - 源**：表示从目标的完全加载传入的更改，以每秒行数为单位。
+ **完全加载吞吐量行数 - 目标**：表示从目标的完全加载传出的更改，以每秒行数为单位。
+ **CDC 吞吐量带宽 - 源**：表示源的网络带宽，以每秒 KB 数为单位。

  CDC 吞吐量带宽记录采样点上的带宽。如果未找到网络流量，则该值为零。由于 CDC 不发布长时间运行的事务，可能不会记录网络流量。
+ **CDC 吞吐量带宽 - 目标**：表示目标的网络带宽，以每秒 KB 数为单位。

  CDC 吞吐量带宽记录采样点上的带宽。如果未找到网络流量，则该值为零。由于 CDC 不发布长时间运行的事务，可能不会记录网络流量。
+ **CDC 吞吐量行数 - 源**：表示源的传入任务更改，以每秒行数为单位。
+ **CDC 吞吐量行数 - 目标**：表示目标的传出任务更改，以每秒行数为单位。
+ **CDC 延迟 - 源**：表示从源端点中捕获的最后一个事件与 Amazon DMS 实例的当前系统时间戳之间的间隔（秒）。如果出于任务范围的原因而未从源中捕获任何更改，Amazon DMS 会将该值设置为零。
+ **CDC 延迟 - 目标**：表示在目标上等待提交的第一个事件时间戳与 Amazon DMS 实例的当前系统时间戳之间的间隔（秒）。如果存在未由目标处理的事务，则会发生此值。否则，如果应用了所有事务，目标延迟会与源延迟相同。目标延迟永远不应小于源延迟。
+ **CPU 利用率**：表示任务在多个核心上使用的 CPU 百分比。任务 `CPUUtilization` 的语义与复制实例 `CPUUtilizaiton` 的语义略有不同。如果 1 个 vCPU 已完全使用，则表示 100%；但如果有多个 vCPU 在使用中，则值可能超过 100%。
+ **内存使用率**：表示任务使用的控制组（cgroup）`memory.usage_in_bytes`。Amazon DMS 使用 cgroup 来控制内存和 CPU 等系统资源的使用量。该指标表示在为任务分配的 cgroup 中，该任务的内存使用量，以 MB 为单位。

  cgroup 限制基于可供 Amazon DMS 复制实例类使用的资源。`memory.usage_in_bytes` 由驻留集大小（RSS）、缓存和内存的交换组件组成。如果需要，操作系统可以回收缓存。我们建议您同时监控复制实例指标 AvailableMemory。

  Amazon DMS 根据 CloudWatch 控制台中 `ReplicationTaskIdentifier` 和 `ReplicationInstanceIdentifer` 维度的组合提出这个指标。使用 `ReplicationInstanceIdentifier`、`ReplicationTaskIdentifier` 类别查看此指标。
+ **验证记录数**：只有在为 Amazon DMS 任务启用验证后，才会显示此图表。这是可用于 Amazon DMS 任务的验证指标的组合，包括以下内容：
  + `ValidationSucceededRecordCount` – Amazon DMS 每分钟验证的行数。
  + `ValidationAttemptedRecordCount` – 每分钟尝试验证的行数。
  + `ValidationFailedOverallCount` – 验证失败的行数。
  + `ValidationSuspendedOverallCount` – 验证已暂停的行数。
  + `ValidationPendingOverallCount` – 验证待处理的行数。

除了上述指标外，您还可以自定义**任务**视图，并可以包括其他指标（通过将这些指标添加为小部件）。建议您查看以下文档以了解有关这些指标的信息：
+ 对于 Amazon DMS 迁移和复制任务的所有可用指标，请参阅[监控 Amazon DMS 任务](CHAP_Monitoring.md)。
+ 对于所有可用的验证相关指标，请参阅[数据验证](CHAP_Validating.md)。

### “复制实例”视图
<a name="enhanced-monitoring-dashboard-rep-instance-view"></a>

**复制实例**视图全面概述了您的复制实例，使您能够有效地监控和管理数据复制基础设施。此视图提供了一个集中位置，您可以在其中通过直观的图表和可视化内容来分析复制实例的各个方面。

通过**复制实例**视图，您可以深入了解与复制实例相关的关键指标和统计数据，从而能够更好地了解复制实例的性能、资源利用率和整体运行状况。以下是**复制实例**视图的一些主要特征和优势：
+ **实例状态摘要**：此图表显示所选复制实例的详细信息，例如可用区、实例类、引擎版本、分配的存储空间和当前运行状况。
+ **资源利用率**：该控制面板通过一些图表来说明您的复制实例的资源利用率，包括 CPU、内存和磁盘使用率等指标。这些指标可帮助您确定潜在的资源限制并优化您的复制基础设施。
+ **历史趋势**：该控制面板包含历史数据，允许您分析复制实例在一段时间内的执行情况。您可以根据这些历史趋势来识别规律，跟踪更改并做出明智的决策。
+ **筛选和排序**：在**复制实例**视图中，您可以根据各种标准（例如实例名称或特定时间范围）对复制实例进行筛选和排序。这种灵活性使您可以专注于与您的需求最相关的实例或方面。

以下列表描述了您可以在**复制实例**视图中看到的指标：
+ **CloudWatch 警报**：表示 Amazon/DMS 命名空间中警报的摘要。
+ **CPU 利用率**：表示任务在多个核心上使用的 CPU 百分比。任务 `CPUUtilization` 的语义与复制 `CPUUtilizaiton` 的语义略有不同。如果 1 个 vCPU 已完全使用，则表示 100%；但如果有多个 vCPU 在使用中，则值可能超过 100%。
+ **每个实例按任务的内存使用情况**：表示任务占用的驻留集大小（RSS）。它表示主内存 (RAM) 中保留的任务所占用的内存部分。由于已占用内存的某些部分已被换页，或可执行文件的某些部分从未加载，因此 `MemoryUsage` 不包含交换空间或文件系统中保留的内存。
+ **内存**：表示可用、正在使用或可以腾出的内存量，以及已使用的交换空间量。
+ **可用内存**：表示估计可用于启动新应用程序的内存量（没有交换）。
+ **空闲内存**：表示可供应用程序、页面缓存和内核自身数据结构使用的物理内存量。
+ **可释放内存**：可释放内存并不指示实际可用的空闲内存。它是当前正在使用的可以释放并用于其他用途的内存。它是复制实例上使用的缓冲区和缓存的组合。
+ **交换区使用情况**：表示复制实例上使用的交换空间量。
+ **可用存储**：表示可用存储空间量（以字节为单位）。

除了上述指标外，您还可以自定义**复制实例**视图，并可以包括其他指标（通过将这些指标添加为小部件）。建议您查看以下文档以了解有关这些指标的信息：
+ 对于 Amazon DMS 迁移和复制任务的所有可用指标，请参阅[监控 Amazon DMS 任务](CHAP_Monitoring.md)。
+ 对于所有可用的验证相关指标，请参阅[数据验证](CHAP_Validating.md)。

## 保留增强监测指标
<a name="retention-enhanced-monitoring-metrics"></a>

默认情况下，增强监控指标遵循 CloudWatch 指标的保留策略。有关如何更改保留策略的信息，请参阅《Amazon CloudWatch 用户指南》**中的[更改 CloudWatch Logs 中的日志数据留存](https://docs.amazonaws.cn/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html#SttingLogRetention)。