添加数据库连接器
在创建集群时,可以使用配置分类来配置 JDBC 连接器属性。配置分类以 presto-connector
开头,例如 presto-connector-postgresql
。可用的配置分类取决于 Amazon EMR 发行版。有关适用于最新版本的配置分类,请参阅 Amazon EMR 5.36.2 的 5.36.2 配置分类。如果您使用的是 Amazon EMR 的其他版本,请参阅 Amazon EMR 5.x 发行版 查看配置分类。有关可通过每个连接器配置的属性的详细信息,请参阅 https://prestodb.io/docs/current/connector.html
例 – 使用 PostgreSQL JDBC 连接器配置集群
要启动已安装和配置的 PostgreSQL 连接器的集群,请首先创建一个指定包含以下内容的配置分类的 JSON 文件(例如 myConfig.json
)然后将其本地保存。
按照 Presto 文档中 PostgreSQL 连接器
[ { "Classification": "presto-connector-postgresql", "Properties": { "connection-url": "jdbc:postgresql://
example.net
:5432/database
", "connection-user": "MYUSER
", "connection-password": "MYPASS
" }, "Configurations": [] } ]
创建集群时,请按照以下示例中所示,使用 --configurations
选项引用 JSON 文件的路径,其中 myConfig.json
位于您运行以下命令的同一目录中:
aws emr create-cluster --name PrestoConnector --release-label emr-5.36.2 --instance-type m5.xlarge \ --instance-count 2 --applications Name=Hadoop Name=Hive Name=Pig Name=Presto \ --use-default-roles --ec2-attributes KeyName=
myKey
\ --log-uri s3://amzn-s3-demo-bucket
/logs --enable-debugging \ --configurations file://myConfig.json