使用自定义连接器和连接 Amazon Glue Studio - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用自定义连接器和连接 Amazon Glue Studio

Amazon Glue使用连接为最常用的数据存储(例如 Amazon Aurora Amazon Redshift、Microsoft SQL Server、My SQL、MongoDB 和 SQL Postgre)提供内置支持。JDBC Amazon Glue还允许您在提取、转换和加载 (ETL) 作业中使用自定义JDBC驱动程序。对于本地不支持的数据存储(如 SaaS 应用程序),您可以使用连接器。

连接器是一个可选代码包,可帮助访问 Amazon Glue Studio 中的数据存储。您可以订阅 Amazon Web Services Marketplace中提供的几个连接器。

创建ETL作业时,您可以使用原生支持的数据存储 Amazon Web Services Marketplace、来自的连接器或您自己的自定义连接器。如果您使用连接器,您必须首先为连接器创建连接。连接包含连接到特定数据存储所需的属性。您可以在ETL作业中使用与数据源和数据目标的连接。连接器和连接协同工作,方便访问数据存储。

在创建连接器连接时,可以使用以下连接:

  • Amazon Aurora – 一种具有内置安全性、备份还原以及内存加速功能的可扩展、高性能关系数据库引擎。

  • Amazon DocumentDB — 一种可扩展、高度可用且完全托管的文档数据库服务,支持 MongoDB 和. SQL APIs

  • Amazon Redshift— 一种可扩展、高度可用且完全托管的文档数据库服务,支持 Mon SQL APIs goDB 和.

  • Azure SQL — Microsoft Azure 提供的基于云的关系数据库服务,提供可扩展、可靠和安全的数据存储和管理功能。

  • Cosmos DB – 一种由 Microsoft Azure 提供的全球分布式云数据库服务,具有可扩展、高性能的数据存储和查询功能。

  • Google BigQuery — 一种无服务器云数据仓库,用于对大型数据集进行快速SQL查询。

  • JDBC— 一种关系数据库管理系统 (RDBMS),它使用 Jav API a 来连接数据连接并与之交互。

  • Kafka – 一种用于实时数据流式传输和消息收发的开源流式处理平台。

  • MariaDB — 社区开发的 My 分支SQL,可提供增强的性能、可扩展性和功能。

  • MongoDB – 一种面向文档的跨平台数据库,具有高可扩展性、高灵活性、高性能等特点。

  • MongoDB Atlas — MongoDB 提供的基于云的数据库即服务 DBaaS () 产品,可简化 MongoDB 部署的管理和扩展。

  • Microsoft SQL Server — 微软推出的关系数据库管理系统 (RDBMS),提供强大的数据存储、分析和报告功能。

  • M@@ y SQL — 一种开源关系数据库管理系统 (RDBMS),广泛用于 Web 应用程序,并以其可靠性和可扩展性而闻名。

  • 网络 – 网络数据来源是指数据集成平台可以访问并且可通过网络访问的资源或服务。

  • OpenSearch— OpenSearch 数据源是一种 OpenSearch 可以连接到并从中提取数据的应用程序。

  • Oracle — Or acle 公司RDBMS推出的关系数据库管理系统 (),可提供强大的数据存储、分析和报告功能。

  • Postgre SQL — 一种开源关系数据库管理系统 (RDBMS),可提供强大的数据存储、分析和报告功能。

  • Sales force — Salesforce 提供客户关系管理 (CRM) 软件,可在销售、客户服务、电子商务等方面为您提供帮助。如果你是 Salesforce 用户,你可以 Amazon Glue 连接到你的 Salesforce 账户。然后,您可以将 Salesforce 用作ETL作业中的数据源或目标。运行这些任务可在 Salesforce 和 Amazon 服务或其他支持的应用程序之间传输数据。

  • SAPHANA— 内存数据库和分析平台,可提供快速的数据处理、高级分析和实时数据集成。

  • Snowflake – 基于云的数据仓库,提供可扩展、高性能的数据存储和分析服务。

  • Teradata — 一种关系数据库管理系统 (RDBMS),可提供高性能的数据存储、分析和报告功能。

  • Vertica – 一种专门面向大数据分析的列式分析数据仓库,提供快速查询、高级分析和可扩展性等功能。