本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
启动具有多个主节点的 Amazon EMR 集群
本主题提供了启动具有多个主节点的 Amazon EMR 集群的配置详细信息和示例。
注意
Amazon EMR 会为具有多个主节点的所有集群自动启用终止保护,并覆盖您在创建集群时应用的所有自动终止设置。要关闭具有多个主节点的集群,您必须先修改集群属性,才能禁用终止保护。有关说明,请参阅 终止具有多个主节点的 Amazon EMR 集群。
先决条件
-
您可以同时在公有 VPC 子网和私有 VPC 子网中启动具有多个主节点的 Amazon EMR 集群。EC2-不支持经典版。要启动公有子网中有多个主节点的 Amazon EMR 集群,您必须通过在控制台中选择自动分配或运行以下命令来允许该子网 IPv4中的实例接收公有 IP 地址。
22XXXX01
替换为您的子网 ID。aws ec2 modify-subnet-attribute --subnet-id subnet-
22XXXX01
--map-public-ip-on-launch -
要在具有多个主节点的 Amazon EMR 集群上运行 Hive、Hue 或 Oozie,您必须创建外部元存储。有关更多信息,请参阅为 Hive 配置外部元存储、在 Amazon RDS 中将 Hue 与远程数据库结合使用或者 Apache Oozie。
-
要在集群中使用 Kerberos 身份验证,您必须配置外部 KDC。有关更多信息,请参阅在 Amazon EMR 上配置 Kerberos。
启动具有多个主节点的 Amazon EMR 集群
使用实例组或实例集时,您可以启动具有多个主节点的集群。使用具有多个主节点的实例组时,必须为主节点实例组指定实例计数值 3
。使用具有多个主节点的实例集时,必须为主实例集将 TargetOnDemandCapacity
指定为 3
,将 TargetSpotCapacity
指定为 0
,并为您为主实例集配置的每种实例类型将 WeightedCapacity
指定为 1
。
以下示例演示了如何使用默认 AMI 或同时包含实例组和实例集的自定义 AMI 启动集群。
注意
使用 Amazon CLI启动具有多个主节点的 Amazon EMR 集群时,必须指定子网 ID。在以下示例中22XXXX02
,将22XXXX01
和替换为您的子网 ID。
终止具有多个主节点的 Amazon EMR 集群
要终止具有多个主节点的 Amazon EMR 集群,必须在终止集群之前禁用终止保护,如下例所示。使用您的集群 ID 替换 j-3KVTXXXXXX7UG
。
aws emr modify-cluster-attributes --cluster-id
j-3KVTXXXXXX7UG
--no-termination-protected aws emr terminate-clusters --cluster-idj-3KVTXXXXXX7UG