Amazon EMR
Amazon EMR 版本指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

使用 Ganglia 创建集群

使用控制台通过 Ganglia 创建集群

  1. 通过以下网址打开 Amazon EMR 控制台:https://console.amazonaws.cn/elasticmapreduce/

  2. 选择 Create cluster

  3. Software configuration (软件配置) 中,选择 All Applications (所有应用程序)Core Hadoop (核心 Hadoop)Spark

  4. 根据需要继续利用配置创建集群。

使用 AWS CLI 向集群添加 Ganglia

在 AWS CLI 中,可以使用带有 --applications 参数的 create-cluster 向集群添加 Ganglia。如果使用 --applications 参数仅指定 Ganglia,则 Ganglia 是安装的唯一应用程序。

  • 键入以下命令以在创建集群时添加 Ganglia,将 myKey 替换为您的 EC2 密钥对的名称。

    注意

    包含了 Linux 行继续符 (\) 以提高可读性。可以在 Linux 命令中删除或使用它们。对于 Windows,请删除它们或将其替换为脱字号 (^)。

    aws emr create-cluster --name "Spark cluster with Ganglia" --release-label emr-5.27.0 \ --applications Name=Spark Name=Ganglia \ --ec2-attributes KeyName=myKey --instance-type m5.xlarge \ --instance-count 3 --use-default-roles

    如果不使用 --instance-groups 参数指定实例计数,则将启动单个主节点,其余实例将作为核心节点启动。所有节点都使用该命令中指定的实例类型。

    注意

    如果您之前未创建默认 EMR 服务角色和 EC2 实例配置文件,请先键入 aws emr create-default-roles 创建它们,然后再键入 create-cluster 子命令。

    有关在 AWS CLI 中使用 Amazon EMR 命令的更多信息,请参阅https://docs.amazonaws.cn/cli/latest/reference/emr