Amazon EMR
Amazon EMR 版本指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

创建带 HCatalog 的集群

虽然 Hive 项目包含了 HCatalog,但您必须将 HCatalog 作为其自己的应用程序安装。

使用控制台启动安装了 HCatalog 的集群

以下过程创建一个安装了 HCatalog 的集群。有关使用控制台(包括 Advanced Options (高级选项))创建集群的更多信息,请参阅 Amazon EMR 管理指南 中的计划和配置集群

  1. 通过以下网址打开 Amazon EMR 控制台:https://console.amazonaws.cn/elasticmapreduce/

  2. 选择 Create cluster (创建集群) 以使用 Quick Create (快速创建)

  3. 对于 Software Configuration (软件配置) 字段,选择 Amazon Release Version emr-4.4.0 (Amazon 发布版 emr-4.4.0) 或更高版本。

  4. Select Applications (选择应用程序) 字段中,选择 All Applications (所有应用程序)HCatalog

  5. 根据需要选择其他选项,然后选择 Create cluster (创建集群)

使用 AWS CLI 启动安装了 HCatalog 的集群

  • 使用下面的命令创建集群:

    注意

    包含了 Linux 行继续符 (\) 以提高可读性。可以在 Linux 命令中删除或使用它们。对于 Windows,请删除它们或将其替换为脱字号 (^)。

    aws emr create-cluster --name "Cluster with Hcat" --release-label emr-5.23.0 \ --applications Name=HCatalog --ec2-attributes KeyName=myKey \ --instance-type m4.large --instance-count 3 --use-default-roles