本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
添加数据库连接器
在创建集群时,您可以使用配置分类来配置 JDBC 连接器属性。配置分类以 开头presto-connector
,例如 presto-connector-postgresql
。可用的配置分类取决于 Amazon EMR 版本。有关适用于最新发行版的配置分类,请参阅Configuration ClassificationsAmazon EMR 5.32.0。如果您使用的是 Amazon EMR 的其他版本,请参阅配置分类的 Amazon EMR 5.x 发布版本。有关可使用每个连接器配置的属性的更多信息,请参阅 https://prestodb.io/docs/current/connector.html
例 —使用 PostgreSQL JDBC 连接器配置集群
要启动已安装和配置的 PostgreSQL 连接器的集群,请首先创建一个包含以下内容的指定配置分配的 JSON 文件—例如,myConfig.json
—,然后将其本地保存。
替换适合您的设置的连接属性,如 Presto 文档中的 PostgreSQL 连接器
[ { "Classification": "presto-connector-postgresql", "Properties": { "connection-url": "jdbc:postgresql://
example.net
:5432/database
", "connection-user": "MYUSER
", "connection-password": "MYPASS
" }, "Configurations": [] } ]
在创建集群时,请使用 --configurations
选项引用 JSON 文件的路径,如以下示例所示,其中 myConfig.json
位于运行 命令的同一目录中:
aws emr create-cluster --name PrestoConnector --release-label emr-5.32.0 --instance-type m5.xlarge \ --instance-count 2 --applications Name=Hadoop Name=Hive Name=Pig Name=Presto \ --use-default-roles --ec2-attributes KeyName=
myKey
\ --log-uri s3://my-bucket
/logs --enable-debugging \ --configurations file://myConfig.json