添加数据库连接器 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

添加数据库连接器

在创建集群时,可以使用配置分类来配置 JDBC 连接器属性。配置分类以 presto-connector 开头,例如 presto-connector-postgresql。可用的配置分类取决于 Amazon EMR 发行版。有关适用于最新发行版的配置分类,请参阅 Amazon EMR 5.34.0 的 配置分类。如果您使用的是 Amazon EMR 的其他版本,请参阅 Amazon EMR 5.x 发行版 查看配置分类。有关可通过每个连接器配置的属性的详细信息,请参阅 https://prestodb.io/docs/current/connector.html

例 – 使用 PostgreSQL JDBC 连接器配置集群

要启动已安装和配置的 PostgreSQL 连接器的集群,请首先创建一个指定包含以下内容的配置分类的 JSON 文件(例如 myConfig.json)然后将其本地保存。

按照 Presto 文档中 PostgreSQL 连接器主题中所示,根据您的设置替换相应的连接属性。

[ { "Classification": "presto-connector-postgresql", "Properties": { "connection-url": "jdbc:postgresql://example.net:5432/database", "connection-user": "MYUSER", "connection-password": "MYPASS" }, "Configurations": [] } ]

创建集群时,请按照以下示例中所示,使用 --configurations 选项引用 JSON 文件的路径,其中 myConfig.json 位于您运行以下命令的同一目录中:

aws emr create-cluster --name PrestoConnector --release-label emr-5.34.0 --instance-type m5.xlarge \ --instance-count 2 --applications Name=Hadoop Name=Hive Name=Pig Name=Presto \ --use-default-roles --ec2-attributes KeyName=myKey \ --log-uri s3://my-bucket/logs --enable-debugging \ --configurations file://myConfig.json