将驱动程序与 Amazon Glue DataBrew - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将驱动程序与 Amazon Glue DataBrew

数据库驱动程序是实现数据库连接协议(例如 Java 数据库连接 (JDBC))的文件或 URL。该驱动程序充当特定数据库管理系统 (DBMS) 和另一个系统之间的适配器或转换器。

在这种情况下,它允许 Amazon Glue DataBrew 连接到您的数据。然后,您可以从支持的数据源访问数据库对象,例如表或视图。您正在使用的数据源可能称为数据库、数据仓库或其他东西。但是,在本文档中,我们将所有数据提供者称为数据源或连接。

要使用 JDBC 驱动程序或 jar 文件,请下载所需的一个或多个文件并将其放入 S3 存储桶中。用于访问数据的 IAM 角色需要对两个驱动程序文件具有读取权限。

注意

With Amazon Glue4.0,本机支持作为数据源连接到 Snowflake。您无需提供自定义jar文件。在中 Amazon Glue DataBrew,选择 Snowflake 作为外部源连接,并提供您的 Snowflake 实例的 URL。URL 将使用表单 https://account_identifier.snowflakecomputing.com 中的主机名。

提供数据访问凭证、Snowflake 数据库名称和 Snowflake 架构名称。此外,如果您的 Snowflake 用户没有设置默认仓库,则需要提供仓库名称。

Snowflake 连接使用 Amazon Secrets Manager 密钥来提供凭据信息。您的项目和工作角色必须具有读取此密钥的权限。

屏幕截图显示了 “连接” 访问向导,其中选择 Snowflake 作为外部源。填写其他字段以完成连接:JDBC URL 和数据库访问凭证。
要将驱动程序与 DataBrew
  1. 使用产品提供的方法,找出您使用的是哪个版本的数据源。

  2. 查找所需的最新版本的连接器和驱动程序。您可以在数据提供商网站上找到这些信息。

  3. 下载所需版本的 JDBC 文件。这些文件通常存储为 Java 档案 (.JAR) 文件。

  4. 要么将驱动程序从控制台上传到 S3 存储桶,要么提供.JAR 文件的 S3 路径。

  5. 输入基本的连接详细信息,例如类别、实例等。

  6. 输入您的数据源需要的任何其他配置信息,例如虚拟私有云 (VPC) 信息。