Amazon EMR
Amazon EMR 版本指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

添加数据库连接器

您可以使用配置分类在创建集群时配置 JDBC 连接器属性。配置分类以 presto-connector 开头,例如,presto-connector-postgresql。可用的配置分类取决于 Amazon EMR 版本。有关适用于最新发行版的配置分类,请参阅配置分类Amazon EMR 5.25.0。如果您使用的是 Amazon EMR 的其他版本,请参阅配置分类的 Amazon EMR 5.x 发布版本。有关可使用每个连接器配置的属性的更多信息,请参阅 https://prestodb.io/docs/current/connector.html

例 —使用 PostgreSQL JDBC 连接器配置集群

要启动已安装和配置的 PostgreSQL 连接器的集群,请首先创建一个包含以下内容的指定配置分配的 JSON 文件—例如,myConfig.json—,然后将其本地保存。

替换连接属性时,可以根据设置的需要以及如 Presto 文档的 PostgreSQL 连接器主题中所示进行替换。

[ { "Classification": "presto-connector-postgresql", "Properties": { "connection-url": "jdbc:postgresql://example.net:5432/database", "connection-user": "MYUSER", "connection-password": "MYPASS" }, "Configurations": [] } ]

在创建集群时,使用 --configurations 选项引用 JSON 文件的路径,如以下示例所示,其中 myConfig.json 位于您运行该命令的同一目录中:

aws emr create-cluster --name PrestoConnector --release-label emr-5.25.0 --instance-type m4.large \ --instance-count 2 --applications Name=Hadoop Name=Hive Name=Pig Name=Presto \ --use-default-roles --ec2-attributes KeyName=myKey \ --log-uri s3://my-bucket/logs --enable-debugging \ --configurations file://myConfig.json