访问 Data Catalog - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

访问 Data Catalog

您可以使用 Amazon Glue Data Catalog 来发现和理解您的数据。Data Catalog 提供了一种一致的方法来维护架构定义、数据类型、位置和其他元数据。您可以使用如下方法访问 Data Catalog:

  • Amazon Glue 控制台 – 您可以通过 Amazon Glue 控制台(基于 Web 的用户界面)访问和管理 Data Catalog。控制台允许您浏览和搜索数据库、表及其关联的元数据,以及创建、更新和删除元数据定义。

  • Amazon Glue 爬网程序 – 爬网程序是自动扫描您的数据来源并以元数据填充 Data Catalog 的程序。您可以创建和运行爬网程序来发现来自各种来源的数据并对其进行编目,例如 Amazon S3、Amazon RDS、Amazon DynamoDB、Amazon CloudWatch、兼容 JDBC 的关系数据库(例如 MySQL 和 PostgreSQL)以及一些非 Amazon 的来源,例如 Snowflake 和 Google BigQuery。

  • Amazon Glue API – 您可以使用 Amazon Glue API 以编程方式访问 Data Catalog。这些 API 允许您以编程方式与 Data Catalog 进行交互,从而实现自动化并与其他应用程序和服务集成。

  • Amazon Command Line Interface(Amazon CLI)– 您可以使用 Amazon CLI 从命令行访问和管理 Data Catalog。CLI 提供了用于创建、更新和删除元数据定义以及查询和检索元数据信息的命令。

  • 与其他 Amazon 服务集成 – Data Catalog 与其他各种 Amazon 服务集成,使您能够访问和使用存储在目录中的元数据。例如,您可以使用 Data Catalog 中的元数据,利用 Amazon Athena 查询数据来源,并使用 Amazon Lake Formation 来管理 Data Catalog 资源的数据访问和治理。