查看集群性能数据 - Amazon Redshift
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

查看集群性能数据

通过使用 Amazon Redshift 中的集群指标,您可以执行以下常见性能任务:

  • 判断集群指标在指定时间范围内是否异常;如果异常的话,则确定负责这种性能冲击的查询。

  • 查看历史或当前查询是否对集群性能造成了影响。如果您识别出了一个有问题的查询,则可以在查询执行期间查看有关该查询的详细信息 (包括集群性能)。您可以使用此信息来诊断为何查询速度慢以及可以采取哪些措施来提高它的性能。

注意

Amazon Redshift 有新的控制台可用。根据您使用的控制台,选择新控制台原始控制台说明。默认情况下会打开新控制台说明。

查看性能数据

  1. 登录 AWS 管理控制台并通过以下网址打开 Amazon Redshift 控制台:https://console.amazonaws.cn/redshift/

  2. 在导航菜单上,选择 CLUSTERS (集群),然后从列表中选择集群名称以打开其详细信息。此时将显示集群的详细信息,其中包括 Query monitoring (查询监控)Cluster performance (集群性能)Maintenance and monitoring (维护和监控)Backup (备份)Properties (属性)Schedule (计划) 选项卡。

  3. 选择 Cluster performance (集群性能) 选项卡以查看性能信息,其中包括以下信息:

    • CPU 使用率

    • Percentage disk space used (已使用磁盘空间的百分比)

    • 数据库连接

    • 运行状况

    • Query duration (查询持续时间)

    • Query throughput (查询吞吐量)

    • Concurrency scaling activity (并发扩展活动)

    此外,还提供了许多其他指标。要查看可用指标并选择要显示的指标,请选择 Preferences (首选项) 图标。

默认集群视图显示同一个图表中的所有节点、Average 统计数据以及最后一小时的数据。您可以根据需要更改此视图。一些指标(例如 HealthStatus)仅适用于领导节点,还有一些指标(例如 WriteOps)仅适用于计算节点。切换节点显示模式将重置所有筛选条件。

查看集群性能数据

  1. 登录 AWS 管理控制台并通过以下网址打开 Amazon Redshift 控制台:https://console.amazonaws.cn/redshift/

  2. 在导航窗格中,选择 Clusters

  3. 对于 Cluster (集群),选择您要查看其性能数据的集群旁边的放大镜图标。

  4. 选择 Performance (性能) 选项卡。

    默认情况下,性能视图会显示过去一小时的集群性能。如果您需要调整视图,则可以按照下表所述使用筛选条件

    要执行的操作 使用该筛选条件
    更改显示数据的时间范围 Time Range (时间范围) 列表中选择一个时间范围。默认情况下,显示最后一小时这一时间范围。
    更改显示数据的时间段

    Period (时间段) 列表中选择一个时间段。默认情况下,显示 5 分钟这一时间段。如果您在调查某个指标 (深入分析) 和展示较短时间段 (例如 10 分钟) 的指标时需要更多详细信息,请使用少于 5 分钟的时间段。同样,如果您要查看较长时间段 (例如几天) 的指标,请使用长于 5 分钟的时间段。

    更改针对指标显示的统计数据

    Statistic (统计数据) 列表中选择一个统计数据。默认情况下,使用 Average 统计数据。

    更改显示的指标(全部或特定指标)

    Metrics (指标) 列表中选择一个指标。默认情况下,显示所有指标。

    更改节点指标的显示方式,是单独显示还是在同一个图表中一起显示

    选择 Nodes (节点)。默认情况下,指定指标的节点数据显示在组合图表中。如果您选择在单独的图表中显示节点数据,则还可以显示或隐藏单个节点。

集群性能图表

以下示例显示新的 Amazon Redshift 控制台中显示的一些图表。

  • CPU utilization (CPU 利用率) – 显示所有节点(领导节点和计算节点)的 CPU 利用率百分比。要在计划集群迁移或其他资源消耗型操作之前查找集群使用率最低的时间,请监控此图表以查看每个节点或所有节点的 CPU 使用率。

  • Maintenance mode (维护模式) – 通过使用 OnOff 指示灯显示集群在所选时间是否处于维护模式。您可以查看集群正在进行维护的时间。然后,您可以将此时间与对集群执行的操作相关联,以估计其将来发生重复性事件的停机时间。

  • Percentage disk space used (已使用磁盘空间的百分比) – 显示每个计算节点(而不是整个集群)的磁盘空间使用量百分比。您可以浏览此图表来监控磁盘利用率。VACUUM 和 COPY 等维护操作使用中间临时存储空间来执行排序操作,因此预计磁盘使用量会出现峰值。

  • Read throughput (读取吞吐量) – 显示每秒从磁盘读取的平均兆字节数。您可以评估此图表以监控集群的相应物理方面。此吞吐量不包括集群中的实例与集群的卷之间的网络流量。

  • Read latency (读取延迟) – 显示磁盘读取 I/O 操作所花费的平均时间(以毫秒为单位)。您可以查看要返回的数据的响应时间。当延迟很高时,这意味着发送方处于空闲状态的时间会更多(不发送任何新的数据包),这会降低吞吐量的增长速度。

  • Write throughput (写入吞吐量) – 显示每秒写入磁盘的平均兆字节数。您可以评估此指标,以监控集群的相应物理方面。此吞吐量不包括集群中的实例与集群的卷之间的网络流量。

  • Write latency (写入延迟) – 显示磁盘写入 I/O 操作所花费的平均时间(以毫秒为单位)。您可以评估返回写确认的时间。当延迟很高时,这意味着发送方处于空闲状态的时间会更多(不发送任何新的数据包),这会降低吞吐量的增长速度。

  • Database connections (数据库连接数) – 显示到集群的数据库连接数。您可以使用此图表查看与数据库建立的连接数,并查找集群使用率最低的时间。

  • Total table count (总的表计数) – 显示集群内在某个特定时间点打开的用户表的数量。您可以在打开的表计数较高时监控集群性能。

  • Health status (运行状况) – 将集群的运行状况指示为 HealthyUnhealthy。如果集群可以连接到其数据库并成功执行简单查询,则集群将被视为运行状况良好。否则,视为集群运行状况不佳。当数据库集群负载极重,或者集群上的数据库存在配置问题时,集群会出现运营状况不佳的情况。

  • Query duration (查询持续时间) – 显示完成查询的平均时间量(以微秒为单位)。您可以将此图表上的数据作为基准以衡量集群内的 I/O 性能,并在必要时调整其最耗时的查询。

  • Query throughput (查询吞吐量) – 显示每秒完成的查询的平均数。您可以分析此图表上的数据以衡量数据库性能,并表明系统以均衡的方式支持多用户工作负载的能力。

  • Query duration per WLM queue (每个 WLM 队列的查询持续时间) – 显示完成查询的平均时间量(以微秒为单位)。您可以将此图表上的数据作为基准测试,以衡量每个 WLM 队列的 I/O 性能,并在必要时调整其最耗时的查询。

  • Query throughput per WLM queue (每个 WLM 队列的查询吞吐量) – 显示每秒完成的查询的平均数。您可以分析此图表上的数据,以衡量每个 WLM 队列的数据库性能。

  • Concurrency scaling activity (并发扩展活动) – 显示活动的并发扩展集群的数量。启用并发扩展后,Amazon Redshift 会在需要时自动增加额外的集群容量来处理增多的并发读取查询。