将 Amazon Glue DataBrew 与您的 VPC 结合使用
如果您使用 Amazon VPC 托管 Amazon 资源,则可以将 Amazon Glue DataBrew 配置为基于 Amazon VPC 服务,通过虚拟私有云(VPC)路由流量。为实现此目标,DataBrew 首先将一个弹性网络接口预置到您指定的子网中。然后,DataBrew 将您指定的安全组附加到该网络接口以控制访问。指定的安全组必须为所有流量制定自引用入站和出站规则。此外,您的 VPC 还必须启用 DNS 主机名和解析。有关更多信息,请参阅《Amazon Glue 开发人员指南》中的设置 VPC 以连接到 JDBC 数据存储。
对于 Amazon Glue Data Catalog 数据集,您需要在 Data Catalog 中创建 Amazon Glue 连接时配置 VPC 信息。要为此连接创建 Data Catalog 表,请从 Amazon Glue 控制台运行爬网程序。有关更多信息,请参阅《Amazon Glue 开发人员指南》中的填充 Amazon Glue Data Catalog。
对于数据库数据集,请在您从 DataBrew 控制台创建连接时指定您的 VPC 信息。
要将 Amazon Glue DataBrew 与没有 NAT 的 VPC 子网结合使用,您必须有一个网关 VPC 端点连接到 Amazon S3,并且有一个 VPC 端点用于 Amazon Glue 接口。有关更多信息,请参阅 Amazon VPC 文档中的创建网关端点和接口 VPC 端点(Amazon PrivateLink)。DataBrew 预置的弹性接口没有公有 IPv4 地址,因此它不支持使用 VPC 互联网网关。
目前不支持 Amazon S3 接口端点。如果您使用 Amazon Secrets Manager 存储密钥,则需要到 Secrets Manager 的路由。如果您使用的是加密,则需要到 Amazon Key Management Service(Amazon KMS)的路由。