本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用以下方式监控 Amazon EMR 事件 CloudWatch
Amazon EMR 跟踪事件并在 Amazon EMR 控制台中保存其相关信息最多七天。当集群、实例组、实例集、自动扩缩策略或步骤的状态发生变化时,Amazon EMR 会记录事件。事件捕获事件发生的日期和时间、有关受影响元素的详细信息以及其他关键数据点。
下表列出了 Amazon EMR 事件,以及事件指示的状态或状态变更、事件的严重性、事件类型、事件代码和事件消息。Amazon EMR 将事件表示为 JSON 对象并将其自动发送到事件流。当您使用事件设置事件处理规则时,JSON 对象很重要,因为规则 CloudWatch 会寻求匹配 JSON 对象中的模式。有关更多信息,请参阅 Amazon E vents 用户指南中的事件和事件模式以及 Amazon EMR CloudWatch 事件。
注意
为确保向您提供最相关的信息,我们会不断完善错误消息。因此,建议您不要通过解析消息中的文本来启动工作流中的后续操作。
集群启动事件
状态或状态变更 | 严重性 | 事件类型 | 事件代码 | 消息 |
---|---|---|---|---|
CREATING |
WARN |
Amazon EMR 实例集预置 | EC2 预置 – 实例容量不足 | 我们无法为实例集 InstanceFleetID 创建您的 Amazon EMR 集群 ClusterId
(ClusterName) Amazon EC2 的实例类型 [Instancetype1, Instancetype2] 竞价容量不足,且可用区 [Instancetype3,
Instancetype4] 中的实例类型 [AvailabilityZone1,
AvaliabilityZone2] 的按需容量不足。有关如何应对此事件的更多信息,请查看此处的文档。 |
CREATING |
WARN |
Amazon EMR 实例组预置 | EC2 预置 – 实例容量不足 | 我们无法为实例组 InstancegroupID 创建您的 Amazon EMR 集群 ClusterId
(ClusterName) Amazon EC2 的实例类型 Instancetype 在可用区 AvailabilityZone 中的 [Spot or On-Demand] 容量不足。有关如何应对此事件的更多信息,请查看此处的文档。 |
STARTING
|
INFO
|
EMR 集群状态更改 |
none |
已于 |
STARTING
|
INFO
|
EMR 集群状态更改 |
none |
注意仅适用于带实例集配置和 Amazon EC2 中选定的多个可用区的集群。 Amazon EMR 集群 |
STARTING
|
INFO
|
EMR 集群状态更改 |
none |
Amazon EMR 集群 |
WAITING
|
INFO
|
EMR 集群状态更改 |
none |
Amazon EMR 集群 - 或 - Amazon EMR 集群 注意处于 |
注意
当您的 EMR 集群在创建集群或调整集群大小操作期间遇到来自 Amazon EC2 的实例集或实例组容量不足错误时,会定期触发事件代码为 EC2 provisioning - Insufficient Instance
Capacity
的事件。有关如何响应这些事件的更多信息,请参阅 响应 Amazon EMR 集群实例容量不足事件。
集群终止事件
状态或状态变更 | 严重性 | 事件类型 | 事件代码 | 消息 |
---|---|---|---|---|
TERMINATED
|
严重性视状态变更原因而定,如下所述:
|
EMR 集群状态更改 |
none |
Amazon EMR 集群 |
TERMINATED_WITH_ERRORS
|
CRITICAL
|
EMR 集群状态更改 |
none |
Amazon EMR 集群 |
实例集状态更改事件
注意
实例集配置仅在 Amazon EMR 发行版 4.8.0 及更高版本(不包括 5.0.0 和 5.0.3)中可用。
状态或状态变更 | 严重性 | 事件类型 | 事件代码 | 消息 |
---|---|---|---|---|
从 |
INFO
|
none | Amazon EMR 集群 |
|
从 |
INFO
|
none | 对 Amazon EMR 集群 |
|
从 |
INFO
|
none | 对 Amazon EMR 集群 |
|
从 |
INFO
|
none | Amazon EMR 集群 |
|
SUSPENDED
|
ERROR
|
none | 由于以下原因,Amazon EMR 集群 |
|
RESIZING
|
WARNING
|
none | 对 Amazon EMR 集群 |
|
|
INFO
|
none | 当 Amazon EMR 在可用区 |
|
|
INFO
|
none | Amazon EMR 集群 |
实例集大小调整事件
事件类型 | 严重性 | 事件代码 | 消息 |
---|---|---|---|
Amazon EMR 实例集大小调整 |
ERROR |
竞价型预置超时 |
在可用区 |
Amazon EMR 实例集大小调整 |
ERROR |
按需预置超时 |
在可用区 |
Amazon EMR 实例集大小调整 |
WARNING |
EC2 预置 – 实例容量不足 | 我们无法完成 EMR 集群 |
Amazon EMR 实例集大小调整 |
WARNING |
竞价型预置超时 – 继续调整大小 |
我们仍在为实例集大小调整操作预置竞价型容量,该操作于 |
Amazon EMR 实例集大小调整 |
WARNING |
按需预置超时 – 继续调整大小 |
我们仍在为实例集大小调整操作预置按需容量,该操作于 |
注意
超时到期后,当 Amazon EMR 停止为实例集预置竞价型或按需容量时,就会发出预置超时事件。有关如何响应这些事件的更多信息,请参阅 响应 Amazon EMR 集群实例集调整大小超时事件。
实例组事件
事件类型 | 严重性 | 事件代码 | 消息 |
---|---|---|---|
从 |
INFO
|
none | 对 Amazon EMR 集群 |
从 |
INFO
|
none | 对 Amazon EMR 集群 |
SUSPENDED
|
ERROR
|
none | 由于以下原因,Amazon EMR 集群 |
RESIZING
|
WARNING
|
none | 对 Amazon EMR 集群 |
Amazon EMR 实例组调整大小 |
WARNING |
EC2 预置 – 实例容量不足 | 我们无法完成 EMR 集群 |
从 |
INFO
|
none | Amazon EMR 集群 |
注意
对于 Amazon EMR 5.21.0 及更高版本,您可以覆盖集群配置,并为运行的集群中的每个实例组指定额外的配置分类。您可以使用 Amazon EMR 控制台、 Amazon Command Line Interface (Amazon CLI) 或软件开发工具包来完成此操作。 Amazon 有关更多信息,请参阅为运行的集群中的实例组提供配置。
下表列出了重新配置操作的 Amazon EMR 事件,以及事件指示的状态或状态变更、事件的严重性和事件消息。
状态或状态变更 | 严重性 | 消息 |
---|---|---|
RUNNING
|
INFO
|
Amazon EMR 集群 |
从 |
INFO
|
对 Amazon EMR 集群 |
从 |
INFO
|
对 Amazon EMR 集群 |
RESIZING
|
INFO
|
Amazon EMR 集群 |
RECONFIGURING
|
INFO
|
Amazon EMR 集群 ClusterId (ClusterName) 中实例组 Time 的实例计数 Num 的调整大小操作在 InstanceGroupID 被临时阻止,因为实例组处于 State 状态。 |
RECONFIGURING
|
WARNING
|
Amazon EMR 集群 |
RECONFIGURING
|
INFO
|
配置正在恢复到在 |
从 |
INFO
|
配置已成功恢复到在 |
从 |
CRITICAL
|
无法恢复到在 |
自动伸缩策略事件
状态或状态变更 | 严重性 | 消息 |
---|---|---|
PENDING
|
INFO
|
自动扩缩策略已于 - 或 - Amazon EMR 集群 |
ATTACHED
|
INFO
|
Amazon EMR 集群 |
|
INFO
|
Amazon EMR 集群 |
FAILED
|
ERROR
|
Amazon EMR 集群 - 或 - Amazon EMR 集群 |
步骤事件
状态或状态变更 | 严重性 | 消息 |
---|---|---|
PENDING
|
INFO
|
步骤 |
CANCEL_PENDING
|
WARN
|
Amazon EMR 集群 |
RUNNING
|
INFO
|
Amazon EMR 集群 |
COMPLETED
|
INFO
|
Amazon EMR 集群 |
CANCELLED
|
WARN
|
Amazon EMR 集群 |
FAILED
|
ERROR
|
Amazon EMR 集群 |
不健康的节点替换事件
事件类型 | 严重性 | 事件代码 | 消息 |
---|---|---|---|
Amazon EMR 不健康的节点替换 |
INFO |
检测到不健康的核心节点 |
亚马逊 EMR 已确定亚马逊 EMR |
Amazon EMR 不健康的节点替换 |
INFO |
核心节点运行状况不佳-禁用替换 |
亚马逊 EMR 已确定亚马逊 EMR |
Amazon EMR 不健康的节点替换 |
WARN |
未更换运行状况不佳的核心节点 |
出于某种原因,Amazon EMR 无法替换您在亚马逊 EMR 集群 注意Amazon EMR 无法替换您的核心节点的原因因因您的情况而异。例如,Amazon EMR 无法删除节点的原因之一是因为集群没有任何剩余的核心节点。 |
Amazon EMR 不健康的节点替换 |
INFO |
恢复了运行状况不佳的核心节点 |
Amazon EMR 已恢复您在亚马逊 EMR |
有关更换不健康节点的更多信息,请参阅替换不健康的节点。
使用 Amazon EMR 控制台查看事件
对于每个集群,您可以在详细信息窗格中查看简单的事件列表,该列表按发生顺序降序列出事件。您还可以按照事件发生顺序的降序查看区域中所有集群的所有事件。
如果您不希望用户查看区域的所有集群事件,请向附加到用户的策略添加一条语句,该语句拒绝对 "Effect": "Deny"
操作的权限 (elasticmapreduce:ViewEventsFromAllClustersInConsole
)。
注意
我们重新设计了 Amazon EMR 控制台,以便其易于使用。请参阅 亚马逊 EMR 控制台,以了解有关新旧控制台体验差异的信息。