本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
启动具有多个主节点的 Amazon EMR 集群
本主题提供了启动具有多个主节点的 Amazon EMR 集群的配置详细信息和示例。
注意
Amazon EMR 会为具有多个主节点的所有集群自动启用终止保护,并覆盖您在创建集群时应用的所有自动终止设置。要关闭具有多个主节点的集群,您必须先修改集群属性,才能禁用终止保护。有关说明,请参阅终止具有多个主节点的 Amazon EMR 集群。
先决条件
-
您可以同时在公有 VPC 子网和私有 VPC 子网中启动具有多个主节点的 Amazon EMR 集群。EC2-不支持经典版。要启动公有子网中有多个主节点的 Amazon EMR 集群,您必须通过在控制台中选择自动分配或运行以下命令来允许该子网 IPv4中的实例接收公有 IP 地址。
22XXXX01替换为您的子网 ID。aws ec2 modify-subnet-attribute --subnet-id subnet-22XXXX01--map-public-ip-on-launch -
要在具有多个主节点的 Amazon EMR 集群上运行 Hive、Hue 或 Oozie,您必须创建外部元存储。有关更多信息,请参阅为 Hive 配置外部元存储、在 Amazon RDS 中将 Hue 与远程数据库结合使用或者 Apache Oozie。
-
要在集群中使用 Kerberos 身份验证,您必须配置外部 KDC。有关更多信息,请参阅在 Amazon EMR 上配置 Kerberos。
启动具有多个主节点的 Amazon EMR 集群
使用实例组或实例集时,您可以启动具有多个主节点的集群。使用具有多个主节点的实例组时,必须为主节点实例组指定实例计数值 3。使用具有多个主节点的实例集时,必须为主实例集将 TargetOnDemandCapacity 指定为 3,将 TargetSpotCapacity 指定为 0,并为您为主实例集配置的每种实例类型将 WeightedCapacity 指定为 1。
以下示例演示了如何使用默认 AMI 或同时包含实例组和实例集的自定义 AMI 启动集群。
注意
使用 Amazon CLI启动具有多个主节点的 Amazon EMR 集群时,必须指定子网 ID。在以下示例中22XXXX02
,将22XXXX01和替换为您的子网 ID。
终止具有多个主节点的 Amazon EMR 集群
要终止具有多个主节点的 Amazon EMR 集群,必须在终止集群之前禁用终止保护,如下例所示。使用您的集群 ID 替换 j-3KVTXXXXXX7UG。
aws emr modify-cluster-attributes --cluster-idj-3KVTXXXXXX7UG--no-termination-protected aws emr terminate-clusters --cluster-idj-3KVTXXXXXX7UG