教程:为 Amazon RDS 的多可用区数据库集群副本滞后创建 Amazon CloudWatch 警报
您可以创建 Amazon CloudWatch 告警,使其在多可用区数据库集群的副本滞后超过阈值时发送 Amazon SNS 消息。告警会在您指定的时间范围内监控 ReplicaLag
指标。操作是向 Amazon SNS 主题或 Amazon EC2 Auto Scaling 策略发送的通知。
为多可用区数据库集群副本滞后设置 CloudWatch 告警
登录 Amazon Web Services Management Console 并打开 CloudWatch 控制台,网址为 https://console.aws.amazon.com/cloudwatch/
。 -
在导航窗格中,依次选择 Alarms(警报)和 All alarms(所有警报)。
-
选择Create alarm(创建警报)。
-
在 Specify metric and conditions (指定指标和条件) 页面上,选择 Select metric (选择指标)。
-
在搜索框中,输入多可用区数据库集群的名称,然后按 Enter。
下图显示 Select metric(选择指标)页面,其中输入了名为
rds-cluster
的多可用区数据库集群。 -
依次选择 RDS、Per-Database Metrics(每个数据库的指标)。
-
在搜索框中,输入
ReplicaLag
并按 Enter,然后选择数据库集群中的每个数据库实例。下图显示 Select metric(选择指标)页面,及为 ReplicaLag 指标选择的数据库实例。
此告警考虑多可用区数据库集群中所有三个数据库实例的副本滞后。任何数据库实例超过阈值时,该告警都会响应。它使用一个数学表达式,返回三个指标的最大值。首先按指标名称排序,然后选择所有三个 RepliaLag 指标。
-
从 Add math(添加数学表达式)中,依次选择 All functions(所有函数)、MAX。
-
选择 Graphed metrics(绘制的指标)选项卡,然后将 Expression1(表达式 1)的详细信息编辑为
MAX([m1,m2,m3])
。 -
对于所有三个 ReplicaLag 指标,将 Period(周期)更改为 1 minute(1 分钟)。
-
清除所有指标的选择, Expression1(表达式 1)除外。
Select metric(选择指标)页面应类似于以下图像。
-
选择选择指标。
-
在 Specify metric and conditions(指定指标和条件)页面中,将标签更改为有意义的名称(例如
ClusterReplicaLag
),然后在 Define the threshold value(定义阈值)中输入秒数。对于本教程,请输入1200
秒(20 分钟)。您可以根据工作负载要求调整该值。Specify metric and conditions(指定指标和条件)页面应类似于以下图像。
-
选择 Next(下一步),随即显示 Configure actions(配置操作)页面。
-
保持选中 In alarm(处于告警中),选择 Create new topic(创建新主题),然后输入主题名称和有效的电子邮件地址。
-
选择 Create topic(创建主题),然后选择 Next(下一步)。
-
在 Add name and description(添加名称和说明)页面中,输入 Alarm name(告警名称)和 Alarm description(告警说明),然后选择 Next(下一步)。
-
预览您将在 Preview and create(预览和创建)页面上创建的告警,然后选择 Create alarm(创建告警)。