本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
连接到数据
Amazon Glue 连接是一个 Data Catalog 对象,用于存储特定数据存储的登录凭证、URI 字符串、虚拟私有云(VPC)信息等。Amazon Glue 爬网程序、作业和开发端点使用连接方可访问特定类型的数据存储。您可以将连接用于源和目标,并在多个爬网程序或提取、转换、加载(ETL)作业中重复使用相同的连接。
Amazon Glue 支持以下连接类型:
-
Amazon DocumentDB
-
亚马逊 OpenSearch 服务,可与 for Spark Amazon Glue 配合使用。
-
Amazon Redshift
-
Kafka
-
Azure Cosmos,用于将 Azure Cosmos DB for NoSQL 与 Amazon Glue ETL 作业结合使用
-
Azure SQL,用于与 Amazon Glue for Spark 结合使用。
-
谷歌 BigQuery,用Amazon Glue于 Spark。
-
JDBC
-
MongoDB
-
MongoDB Atlas
-
SAP HANA,用于与 Amazon Glue for Spark 结合使用。
-
Snowflake,用于与 Amazon Glue for Spark 结合使用。
-
Teradata Vantage,用于与 Amazon Glue for Spark 结合使用。
-
Vertica,用于与 Amazon Glue for Spark 结合使用。
-
各种 Amazon Relational Database Service(Amazon RDS)产品。
-
网络(指定到 Amazon Virtual Private Cloud(Amazon VPC)中数据来源的连接)
-
Aurora(如果使用原生 JDBC 驱动程序,则支持。并非所有驱动程序功能都可以利用)
使用 Amazon Glue Studio,您还可以创建连接器的连接。连接器是一个可选代码包,可帮助访问 Amazon Glue Studio 中的数据存储。有关更多信息,请参阅 在 Amazon Glue Studio 中使用连接器和连接
有关如何连接本地数据库的信息,请参阅 Amazon 大数据博客网站上的 How to access and analyze on-premises data stores using Amazon Glue