Amazon EMR
Amazon EMR 版本指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

使用 Phoenix 创建集群

您可以通过在控制台中或使用 AWS CLI 创建集群时选择 Phoenix 来安装此应用程序。以下过程和示例说明如何使用 Phoenix 和 HBase 创建集群。有关使用控制台(包括 Advanced Options (高级选项))创建集群的更多信息,请参阅 Amazon EMR 管理指南 中的计划和配置集群

在控制台中通过使用用来创建集群的 Quick Options (快速选项) 安装的 Phoenix 启动集群

  1. 通过以下网址打开 Amazon EMR 控制台:https://console.amazonaws.cn/elasticmapreduce/

  2. 选择 Create cluster (创建集群) 以使用 Quick Create (快速创建)

  3. 对于 Software Configuration (软件配置),选择适用于应用程序的最新版本。Phoenix 仅在选择 Amazon Release Version emr-4.7.0 或更高版本时显示为选项。

  4. 对于 Applications (应用程序),选择第二个选项 HBase: HBase ver with Ganglia ver, Hadoop ver, Hive ver, Hue ver, Phoenix ver, and ZooKeeper ver

  5. 根据需要选择其他选项,然后选择 Create cluster (创建集群)

注意

包含了 Linux 行继续符 (\) 以提高可读性。可以在 Linux 命令中删除或使用它们。对于 Windows,请删除它们或将其替换为脱字号 (^)。

以下示例通过使用默认配置设置安装的 Phoenix 启动集群。

使用 AWS CLI 启动安装了 Phoenix 和 HBase 的集群

  • 使用下面的命令创建集群:

    aws emr create-cluster --name "Cluster with Phoenix" --release-label emr-5.20.0 \ --applications Name=Phoenix Name=HBase --ec2-attributes KeyName=myKey \ --instance-type m4.large --instance-count 3 --use-default-roles

在创建集群时自定义 Phoenix 配置

在创建集群时,您可使用 hbase-site.xml 配置分类在 hbase-site 中设置值来配置 Phoenix。

有关更多信息,请参阅 Phoenix 文档中的配置和优化

以下示例说明如何使用存储在 Amazon S3 中的 JSON 文件来为 phoenix.schema.dropMetaData 属性指定 false。可为一个分类指定多个属性。有关更多信息,请参阅 配置应用程序。随后,create cluster 命令会将 JSON 文件引用为 --configurations 参数。

已保存到 /mybucket/myfolder/myconfig.json 的 JSON 文件的内容如下所示。

[ { "Classification": "hbase-site", "Properties": { "phoenix.schema.dropMetaData": "false" } } ]

引用 JSON 文件的 create cluster 命令如以下示例所示。

aws emr create-cluster --release-label emr-5.20.0 --applications Name=Phoenix \ Name=HBase --instance-type m4.large --instance-count 2 \ --configurations https://s3.amazonaws.com/mybucket/myfolder/myconfig.json