Amazon CloudWatch
用户指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

Amazon Redshift 指标和维度

Amazon Redshift 每分钟向 CloudWatch 发送一次每个活动群集的指标。默认情况下启用详细监控。有关更多信息,请参阅 Amazon Redshift Cluster Management Guide 中的监控 Amazon Redshift 群集性能

Amazon Redshift 指标

AWS/Redshift 命名空间包括以下指标。

指标 说明
CPUUtilization

CPU 使用百分率。对于集群,该指标代表所有节点 (领导节点和计算节点) CPU 使用率值的总和。

单位:百分比

维度: NodeID, ClusterIdentifier

DatabaseConnections

集群中的数据库连接数量。

单位:计数

维度: ClusterIdentifier

HealthStatus

表示集群的运行状况检查。每分钟集群连接到其数据库并执行一次简单的查询。如果可以成功执行此操作,则表示集群的运行状况良好。否则,视为集群运行状况不佳。当数据库集群负载极重,或者集群上的数据库存在配置问题时,集群会出现运营状况不佳的情况。

注意

在 Amazon CloudWatch 中,此指标报告为 1 或 0,而在 Amazon CloudWatch 控制台中,为了方便,此指标显示为 HEALTHYUNHEALTHY。当该指标在 Amazon CloudWatch 控制台中显示时,采样平均值会被忽略,仅显示 HEALTHYUNHEALTHY。在 Amazon CloudWatch 中,由于采样问题,可能出现 1 和 0 以外的值。HealthStatus 的所有 1 以下的值均报告为 0 (UNHEALTHY)。

单位:1/0 (Amazon CloudWatch控制台中为 HEALTHY/UNHEALTHY)

维度: ClusterIdentifier

MaintenanceMode

表示集群是否处于维护模式。

注意

在 Amazon CloudWatch 中,此指标报告为 1 或 0,而在 Amazon CloudWatch 控制台中,为了方便,此指标显示为 ONOFF。当该指标在 Amazon CloudWatch 控制台中显示时,采样平均值会被忽略,仅显示 ONOFF。在 Amazon CloudWatch 中,由于采样问题,可能出现 1 和 0 以外的值。MaintenanceMode 的所有 0 以上的值均报告为 1 (ON)。

单位:1/0 (Amazon CloudWatch控制台中为 ON/OFF)。

维度: ClusterIdentifier

NetworkReceiveThroughput

节点或集群接收数据的速率。

单位:字节/秒 (Amazon CloudWatch控制台中为 MB/s)

维度: NodeID, ClusterIdentifier

NetworkTransmitThroughput

节点或集群写入数据的速率。

单位:字节/秒 (Amazon CloudWatch控制台为 MB/s)

维度: NodeID, ClusterIdentifier

PercentageDiskSpaceUsed

目前所用磁盘空间的百分比。

单位:百分比

维度: NodeID, ClusterIdentifier

QueriesCompletedPerSecond

此指标用于确定查询吞吐量。此指标是平均每秒完成的查询数,每隔五分钟报告一次。

单位:计数/秒

维度:延迟

QueryDuration

完成查询的平均时间量。每隔五分钟报告一次。

单位:微秒

维度:延迟

QueryRuntimeBreakdown

前五分钟内,所有活动查询在不同的执行阶段所花的时间量。

单位:毫秒

维度:阶段

ReadIOPS

每秒平均磁盘读取 操作数。

单位:计数/秒

维度: NodeID

ReadLatency

磁盘读取 I/O 操作所需的平均时间。

单位:秒

维度: NodeID

ReadThroughput

每秒从磁盘读取的平均字节数。

单位:字节 (Amazon CloudWatch 控制台中为 GB/s)

维度: NodeID

WLMQueriesCompletedPerSecond

此指标用于确定工作负载管理队列的查询吞吐量。此指标是工作负载管理 (WLM) 队列平均每秒完成的查询数,每隔五分钟报告一次。

单位:计数/秒

维度: wlmid

WLMQueryDuration

为工作负载管理 (WLM) 队列完成查询的平均时间量。每隔五分钟报告一次。

单位:微秒

维度: wlmid

WriteIOPS

每秒平均磁盘写入 操作数。

单位:计数/秒

维度: NodeID

WriteLatency

磁盘写入 I/O 操作所需的平均时间。

单位:秒

维度: NodeID

WriteThroughput

每秒写入磁盘的平均字节数。

单位:字节 (Amazon CloudWatch 控制台中为 GB/s)

维度: NodeID

Amazon Redshift 指标的维度

可以按下表中的任意维度对 Amazon Redshift 数据进行筛选。

维度 描述
latency

值为短、中和长。

“短”是少于 10 秒,“中”是在 10 秒和 10 分钟之间,“长”为超过 10 分钟。

NodeID

筛选条件请求的特定于集群节点的数据。NodeID 是“领导”、“共享”或“N 计算”,其中 N 是集群中节点的数目(0、1 等)。“共享”意味着集群只有一个节点,例如,领导节点和计算节点合并到了一起。

针对领导节点和计算节点报告的指标只适用于 CPUUtilizationNetworkTransmitThroughputReadIOPS。使用 NodeId 维度的其他指标只针对计算节点进行报告。

ClusterIdentifier

筛选条件请求的特定于集群的数据。特定于集群的指标包括 HealthStatusMaintenanceModeDatabaseConnections。此维度的一般指标(例如 ReadIOPS)同样也是代表节点指标数据汇总的节点的指标。在解析这些指标时应该小心,因为它们是领导节点和计算节点的行为汇总。

Stage

查询的执行阶段。可能的值包括:

  • QueryPlanning:分析和优化 SQL 语句所花的时间。

  • QueryWaiting:在 wlm 队列中等待所花的时间。

  • QueryExecutingRead:执行读取查询所花的时间。

  • QueryExecutingInsert:执行插入查询所花的时间。

  • QueryExecutingDelete:执行删除查询所花的时间。

  • QueryExecutingUpdate:执行更新查询所花的时间。

  • QueryExecutingCtas:执行 create table as ... 查询所花的时间。

  • QueryExecutingUnload:执行卸载查询所花的时间。

  • QueryExecutingCopy:执行复制查询所花的时间。

  • QueryCommit:提交所花的时间。

wmlid

工作负载管理队列的标识符。