本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用以下方式监控 Amazon EMR 事件 CloudWatch
Amazon EMR 跟踪事件并在 Amazon EMR 控制台中保存其相关信息最多七天。当集群、实例组、实例集、自动扩缩策略或步骤的状态发生变化时,Amazon EMR 会记录事件。事件捕获事件发生的日期和时间、有关受影响元素的详细信息以及其他关键数据点。
下表列出了 Amazon EMR 事件,以及事件指示的状态或状态变更、事件的严重性、事件类型、事件代码和事件消息。Amazon EMR 将事件表示为 JSON 对象并将其自动发送到事件流。当您使用事件设置事件处理规则时,JSON 对象很重要,因为规则 CloudWatch 会寻求匹配 JSON 对象中的模式。有关更多信息,请参阅 Amazon E vents 用户指南中的事件和事件模式以及 Amazon EMR CloudWatch 事件。
注意
EMR 使用事件代码EC2 配置定期发出事件-实例容量不足。当您的 Amazon EMR 集群在创建集群或调整集群大小操作期间遇到来自 Amazon EMR 的实例队列或实例组容量不足错误时,就会发生这些事件。一个事件可能不包括 AZs 您已提供的所有实例类型,因为 EMR 仅包含实例类型,并且自上次发出 “容量不足” 事件以来, AZs 它会尝试在中配置容量。有关如何响应这些事件的信息,请参阅响应 Amazon EMR 集群实例容量不足事件。
集群启动事件
| 状态或状态变更 | 严重性 | 事件类型 | 事件代码 | 消息 | 
|---|---|---|---|---|
CREATING | 
						WARN | 
						EMR 实例集预置 | EC2 配置-实例容量不足 | 我们无法为实例队列创建您的 Amazon EMR 集群 ClusterId
							(ClusterName) A InstanceFleetID mazon  EC2  实例类型的[Instancetype1, Instancetype2]竞价容量不足,可用区[Instancetype3,
								Instancetype4]中的实例类型的按需容量不足。[AvailabilityZone1,
									AvaliabilityZone2]有关如何应对此事件的更多信息,请查看此处的文档。 | 
					
CREATING | 
						WARN | 
						EMR 实例组预置 | EC2 配置-实例容量不足 | 我们无法为实例组创建您的 Amazon EMR 集群 ClusterId
							(ClusterName) A InstanceGroupID mazon  EC2  实例类型的[Instancetype1, Instancetype2]竞价容量不足,可用区[Instancetype3,
								Instancetype4]中的实例类型的按需容量不足。[AvailabilityZone1,
									AvaliabilityZone2]有关如何应对此事件的更多信息,请查看此处的文档。 | 
					
CREATING | 
						WARN | 
						EMR 实例集预置 | EC2 配置-子网中的可用地址不足 | 我们无法创建您为实例集 InstanceFleetID 请求的 Amazon EMR 集群 ClusterId (ClusterName),因为指定的子网 [Subnet1, Subnet2] 没有足够的可用私有 IP 地址来满足您的请求。使用 DescribeSubnets 操作查看您的子网中有多少 IP 地址可用(未使用)。有关如何响应此事件的信息,请参阅 Amazon  EC2  API 的错误代码 | 
					
CREATING | 
						WARN | 
						EMR 实例组预置 | EC2 配置-子网中的可用地址不足 | 我们无法创建您为实例组 InstanceGroupID 请求的 Amazon EMR 集群 ClusterId (ClusterName),因为指定的子网 [Subnet1, Subnet2] 没有足够的可用私有 IP 地址来满足您的请求。使用 DescribeSubnets 操作查看您的子网中有多少 IP 地址可用(未使用)。有关如何响应此事件的信息,请参阅 Amazon  EC2  API 的错误代码 | 
					
CREATING
						 | 
						WARN
						 | 
						EMR 实例集预置  | 
						EC2 配置-已超出 vCPU 限制  | 
						Amazon EMR 集群InstanceFleetIDClusterId (ClusterName)中的配置会延迟,因为您已达到分配给中正在运行的实例的 vCPUs (虚拟处理单元)数量的限制。account (accountId)有关更多信息,请参阅 Amazon  EC2  API 的错误代码  | 
					
CREATING
						 | 
						WARN
						 | 
						EMR 实例组预置  | 
						EC2 配置-已超出 vCPU 限制  | 
						由于您已达到分配给账户InstanceGroupID中ClusterId正在运行的实例的 vCPUs (虚拟处理单元)数量的限制,因此在 Amazon EMR 集群中配置实例组会延迟。(accountId)有关更多信息,请参阅 Amazon  EC2  API 的错误代码  | 
					
CREATING
						 | 
						WARN
						 | 
						EMR 实例集预置  | 
						EC2 预配置-已超出 Spot 实例数量限制  | 
						Amazon EMR 集群 ClusterID (ClusterName) 中的实例集 InstanceFleetID 预置会延迟,因为您在 account (accountId) 中启动的竞价型实例数量已达到上限。有关更多信息,请参阅 Amazon  EC2  API 的错误代码。 | 
					
CREATING
						 | 
						WARN
						 | 
						EMR 实例组预置  | 
						EC2 预配置-已超出 Spot 实例数量限制  | 
						Amazon EMR 集群 ClusterID (ClusterName) 中的实例组 InstanceGroupID 预置会延迟,因为您在 account (accountId) 中启动的竞价型实例数量已达到上限。有关更多信息,请参阅 Amazon  EC2  API 的错误代码。 | 
					
CREATING
						 | 
						WARN
						 | 
						EMR 实例集预置  | 
						EC2 预配置-已超出实例限制  | 
						Amazon EMR 集群 ClusterId (ClusterName) 中的实例集 InstanceFleetID 预置会延迟,因为您在 account (accountID) 中并发运行的实例数量已达到上限。有关亚马逊 EC2 服务限制的更多信息,请参阅亚马逊  EC2  API 的错误代码。 | 
					
CREATING
						 | 
						WARN
						 | 
						EMR 实例组预置  | 
						EC2 预配置-已超出实例限制  | 
						Amazon EMR 集群 ClusterId (ClusterName) 中的实例组 InstanceGroupID 预置会延迟,因为您在 account (accountID) 中并发运行的实例数量已达到上限。有关亚马逊 EC2 服务限制的更多信息,请参阅亚马逊  EC2  API 的错误代码。 | 
					
CREATING | 
						WARN | 
						EMR 实例组预置  | 
						none  | 
						Amazon EMR 集群  –或者– Amazon EMR 集群  注意处于   | 
					
STARTING
						 | 
						INFO
						 | 
						EMR 集群状态更改  | 
						none  | 
						已于   | 
					
STARTING
						 | 
						INFO
						 | 
						EMR 集群状态更改  | 
						none  | 
						注意仅适用于具有实例队列配置且在 Amazon EC2 中选择了多个可用区的集群。 Amazon EMR 集群   | 
					
STARTING
						 | 
						INFO
						 | 
						EMR 集群状态更改  | 
						none  | 
						Amazon EMR 集群   | 
					
WAITING
						 | 
						INFO
						 | 
						EMR 集群状态更改  | 
						none  | 
						Amazon EMR 集群  –或者– Amazon EMR 集群  注意处于   | 
					
注意
当您的 EMR 集群在创建集群或调整集群大小操作期间遇到来自 A  EC2  mazon 的实例队列或实例组容量不足错误时,会EC2 provisioning - Insufficient Instance
					Capacity定期触发带有事件代码的事件。有关如何响应这些事件的更多信息,请参阅 响应 Amazon EMR 集群实例容量不足事件。
集群终止事件
| 状态或状态变更 | 严重性 | 事件类型 | 事件代码 | 消息 | 
|---|---|---|---|---|
TERMINATED
						 | 
						严重性视状态变更原因而定,如下所述: 
  | 
						EMR 集群状态更改  | 
						none  | 
						Amazon EMR 集群   | 
					
TERMINATED_WITH_ERRORS
						 | 
						CRITICAL
						 | 
						EMR 集群状态更改  | 
						none  | 
						Amazon EMR 集群   | 
					
TERMINATED_WITH_ERRORS
						 | 
						CRITICAL
						 | 
						EMR 集群状态更改  | 
						none  | 
						Amazon EMR 集群   | 
					
实例集状态更改事件
注意
实例集配置仅在 Amazon EMR 发行版 4.8.0 及更高版本(不包括 5.0.0 和 5.0.3)中可用。
| 状态或状态变更 | 严重性 | 事件类型 | 事件代码 | 消息 | 
|---|---|---|---|---|
从   | 
						INFO
						 | 
						none | Amazon EMR 集群   | 
					|
从   | 
						INFO
						 | 
						none | 对 Amazon EMR 集群   | 
					|
从   | 
						INFO
						 | 
						none | 对 Amazon EMR 集群   | 
					|
从   | 
						INFO
						 | 
						none | Amazon EMR 集群   | 
					|
SUSPENDED
						 | 
						ERROR
						 | 
						none | 由于以下原因,Amazon EMR 集群   | 
					|
RESIZING
						 | 
						WARNING
						 | 
						none | 对 Amazon EMR 集群   | 
					|
  | 
						INFO
						 | 
						none | 当 Amazon EMR 在可用区   | 
					|
  | 
						INFO
						 | 
						none | Amazon EMR 集群   | 
					
实例队列重新配置事件
| 状态或状态变更 | 严重性 | 消息 | 
|---|---|---|
已请求重新配置实例队列  | 
						INFO
						 | 
						用户已请求在 Amazon EMR   | 
					
实例队列重新配置开始  | 
						INFO
						 | 
						Amazon EMR 已开始在 Amazon EMR 集群 ()   | 
					
实例队列重新配置已完成  | 
						INFO
						 | 
						Amazon EMR 已完成对 Amazon EMR 集群中实例队列  | 
					
实例队列重新配置失败  | 
						WARNING
						 | 
						Amazon EMR 未能在位于 Amazon EMR 集群 ()   | 
					
实例队列重新配置恢复开始  | 
						INFO
						 | 
						Amazon EMR 正在将 Amazon EMR 集群   | 
					
实例队列重新配置恢复已完成  | 
						INFO
						 | 
						Amazon EMR 已完成将 Amazon EMR 集群   | 
					
实例队列重新配置恢复失败  | 
						CRITICAL
						 | 
						Amazon EMR 无法将 Amazon EMR 集群   | 
					
实例队列重新配置恢复已阻止  | 
						INFO
						 | 
						由于实例队列处于状态,Amazon EMR 暂时封锁了位  | 
					
实例集大小调整事件
| 事件类型 | 严重性 | 事件代码 | 消息 | 
|---|---|---|---|
EMR 实例集调整大小  | 
						ERROR | 
						竞价型预置超时  | 
						在可用区   | 
					
EMR 实例集调整大小  | 
						ERROR | 
						按需预置超时  | 
						在可用区   | 
					
EMR 实例集调整大小  | 
						WARNING | 
						EC2 配置-实例容量不足 | 我们无法完成 EMR 集群  | 
					
EMR 实例集调整大小  | 
						WARNING | 
						竞价型预置超时 – 继续调整大小  | 
						我们仍在为实例集大小调整操作预置竞价型容量,该操作于   | 
					
EMR 实例集调整大小  | 
						WARNING | 
						按需预置超时 – 继续调整大小  | 
						我们仍在为实例集大小调整操作预置按需容量,该操作于   | 
					
EMR 实例集调整大小  | 
						WARNING | 
						EC2 配置-子网中的可用地址不足  | 
						我们无法完成 Amazon EMR 集群 ClusterId (ClusterName) 中实例集 InstanceFleetID 的调整大小操作,因为指定的子网 [Subnet1, Subnet2] 没有足够的可用私有 IP 地址来满足您的请求。使用 DescribeSubnets 操作查看您的子网中有多少 IP 地址可用(未使用)。有关如何响应此事件的信息,请参阅 Amazon  EC2  API 的错误代码。 | 
					
EMR 实例集调整大小  | 
						WARNING | 
						EC2 置备-已超出 vCPU 限制  | 
						Amazon EMR 集群InstanceFleetIDClusterName中实例队列的大小会延迟,因为您已达到分配给中正在运行的实例的 vCPUs (虚拟处理单元)数量的限制。account (accountId)有关更多信息,请参阅 Amazon  EC2  API 的错误代码。 | 
					
EMR 实例集调整大小  | 
						WARNING | 
						EC2 预配置-已超出 Spot 实例数量限制  | 
						Amazon EMR 集群 ClusterID (ClusterName) 中的实例集 InstanceFleetID 预置会延迟,因为您在 account (accountId) 中启动的竞价型实例数量已达到上限。有关更多信息,请参阅 Amazon  EC2  API 的错误代码。 | 
					
EMR 实例集调整大小  | 
						WARNING | 
						EC2 置备-已超出实例限制  | 
						Amazon EMR 集群 ClusterID (ClusterName) 中的实例集 InstanceFleetID 预置会延迟,因为您在 account (accountId) 中运行的按需型实例数量已达到上限。有关亚马逊  EC2  API 错误代码的更多信息。 | 
					
注意
超时到期后,当 Amazon EMR 停止为实例集预置竞价型或按需容量时,就会发出预置超时事件。有关如何响应这些事件的更多信息,请参阅 响应 Amazon EMR 集群实例集调整大小超时事件。
实例组事件
| 事件类型 | 严重性 | 事件代码 | 消息 | 
|---|---|---|---|
从   | 
						INFO
						 | 
						none | 对 Amazon EMR 集群   | 
					
从   | 
						INFO
						 | 
						none | 对 Amazon EMR 集群   | 
					
SUSPENDED
						 | 
						ERROR
						 | 
						none | 由于以下原因,Amazon EMR 集群   | 
					
RESIZING
						 | 
						WARNING
						 | 
						none | 对 Amazon EMR 集群   | 
					
EMR 实例组调整大小  | 
						WARNING | 
						EC2 配置-实例容量不足 | 我们无法完成从 EMR 集群  | 
					
EMR 实例组调整大小  | 
						WARNING | 
						EC2 配置-子网中的可用地址不足  | 
						我们无法完成 Amazon EMR 集群 ClusterId (ClusterName) 中实例组 InstanceGroupID 的调整大小操作,因为指定的子网 [Subnet1, Subnet2] 没有足够的可用私有 IP 地址来满足您的请求。使用 DescribeSubnets 操作查看您的子网中有多少 IP 地址可用(未使用)。有关如何响应此事件的信息,请参阅 Amazon  EC2  API 的错误代码。 | 
					
EMR 实例组调整大小  | 
						WARNING | 
						EC2 置备-已超出 vCPU 限制  | 
						Amazon EMR 集群InstanceGroupIDClusterName中实例组的大小会延迟,因为您已达到分配给中正在运行的实例的 vCPUs (虚拟处理单元)数量的限制。account (accountId)有关更多信息,请参阅 Amazon  EC2  API 的错误代码。 | 
					
EMR 实例组调整大小  | 
						WARNING | 
						EC2 预配置-已超出 Spot 实例数量限制  | 
						Amazon EMR 集群 ClusterID (ClusterName) 中的实例组 InstanceGroupID 预置会延迟,因为您在 account (accountId) 中启动的竞价型实例数量已达到上限。有关更多信息,请参阅 Amazon  EC2  API 的错误代码。 | 
					
EMR 实例组调整大小  | 
						WARNING | 
						EC2 置备-已超出实例限制  | 
						Amazon EMR 集群 ClusterID (ClusterName) 中的实例组 InstanceGroupID 预置会延迟,因为您在 account (accountId) 中运行的按需型实例数量已达到上限。有关亚马逊  EC2  API 错误代码的更多信息。 | 
					
从   | 
						INFO
						 | 
						none | Amazon EMR 集群   | 
					
注意
对于 Amazon EMR 5.21.0 及更高版本,您可以覆盖集群配置,并为运行的集群中的每个实例组指定额外的配置分类。您可以使用 Amazon EMR 控制台、 Amazon Command Line Interface (Amazon CLI) 或软件开发工具包来完成此操作。 Amazon 有关更多信息,请参阅为运行的集群中的实例组提供配置。
下表列出了重新配置操作的 Amazon EMR 事件,以及事件指示的状态或状态变更、事件的严重性和事件消息。
| 状态或状态变更 | 严重性 | 消息 | 
|---|---|---|
RUNNING
						 | 
						INFO
						 | 
						Amazon EMR 集群   | 
					
从   | 
						INFO
						 | 
						对 Amazon EMR 集群   | 
					
从   | 
						INFO
						 | 
						对 Amazon EMR 集群   | 
					
RESIZING
						 | 
						INFO
						 | 
						Amazon EMR 集群   | 
					
RECONFIGURING
						 | 
						INFO
						 | 
						Amazon EMR 集群 ClusterId (ClusterName) 中实例组 Time 的实例计数 Num 的调整大小操作在 InstanceGroupID 被临时阻止,因为实例组处于 State 状态。 | 
					
RECONFIGURING
						 | 
						WARNING
						 | 
						Amazon EMR 集群   | 
					
RECONFIGURING
						 | 
						INFO
						 | 
						配置正在恢复到在   | 
					
从   | 
						INFO
						 | 
						配置已成功恢复到在   | 
					
从   | 
						CRITICAL
						 | 
						无法恢复到在   | 
					
自动伸缩策略事件
| 状态或状态变更 | 严重性 | 消息 | 
|---|---|---|
PENDING
						 | 
						INFO
						 | 
						自动扩缩策略已于  –或者– Amazon EMR 集群   | 
					
ATTACHED
						 | 
						INFO
						 | 
						Amazon EMR 集群   | 
					
  | 
						INFO
						 | 
						Amazon EMR 集群   | 
					
FAILED
						 | 
						ERROR
						 | 
						Amazon EMR 集群  –或者– Amazon EMR 集群   | 
					
步骤事件
| 状态或状态变更 | 严重性 | 消息 | 
|---|---|---|
PENDING
						 | 
						INFO
						 | 
						步骤   | 
					
CANCEL_PENDING
						 | 
						WARN
						 | 
						Amazon EMR 集群   | 
					
RUNNING
						 | 
						INFO
						 | 
						Amazon EMR 集群   | 
					
COMPLETED
						 | 
						INFO
						 | 
						Amazon EMR 集群   | 
					
CANCELLED
						 | 
						WARN
						 | 
						Amazon EMR 集群   | 
					
FAILED
						 | 
						ERROR
						 | 
						Amazon EMR 集群   | 
					
运行状况不佳的节点替换事件
| 事件类型 | 严重性 | 事件代码 | 消息 | 
|---|---|---|---|
Amazon EMR 运行状况不佳的节点替换  | 
						INFO | 
						检测到运行状况不佳的核心节点  | 
						Amazon EMR 已确定 Amazon EMR 集群   | 
					
Amazon EMR 运行状况不佳的节点替换  | 
						INFO | 
						核心节点运行状况不佳:替换已禁用  | 
						Amazon EMR 已确定 Amazon EMR 集群   | 
					
Amazon EMR 运行状况不佳的节点替换  | 
						WARN | 
						未替换运行状况不佳的核心节点  | 
						由于某些原因,Amazon EMR 无法替换 Amazon EMR 集群  注意Amazon EMR 无法替换核心节点的原因因具体场景而异。例如,Amazon EMR 无法删除节点的原因之一是集群中没有剩余的核心节点。  | 
					
Amazon EMR 运行状况不佳的节点替换  | 
						INFO | 
						运行状况不佳的核心节点已恢复  | 
						Amazon EMR 已在 Amazon EMR 集群   | 
					
有关运行状况不佳的节点替换的更多信息,请参阅替换运行状况不佳的节点。
使用 Amazon EMR 控制台查看事件
对于每个集群,您可以在详细信息窗格中查看简单的事件列表,该列表按发生顺序降序列出事件。您还可以按照事件发生顺序的降序查看区域中所有集群的所有事件。
如果您不希望用户查看区域的所有集群事件,请向附加到用户的策略添加一条语句,该语句拒绝对 "Effect": "Deny" 操作的权限 (elasticmapreduce:ViewEventsFromAllClustersInConsole)。
使用控制台查看区域中所有集群的事件
- 
				
登录 Amazon Web Services Management Console,然后在 /emr 上打开亚马逊 EMR 控制台。https://console.aws.amazon.com
 - 
				
EC2在左侧导航窗格的 EMR 开启下,选择事件。
 
使用控制台查看特定集群的事件
- 
				
登录 Amazon Web Services Management Console,然后在 /emr 上打开亚马逊 EMR 控制台。https://console.aws.amazon.com
 - 
				
EC2在左侧导航窗格的 EMR on 下,选择集群,然后选择一个集群。
 - 
				
要查看您的所有事件,请在集群详细信息页面上选择 Events(事件)选项卡。