使用 DropFields 保留大多数数据属性键 - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

使用 DropFields 保留大多数数据属性键

您可以使用 DropFields 转换从数据集创建数据属性键的子集。您可以指明要从数据集中删除的数据属性键,其余的键均保留。

注意

DropFields 转换区分大小写。如果您需要以不区分大小写的方式选择字段,则使用更改架构

将 DropFields 转换节点添加到任务图
  1. (可选)打开资源面板,然后选择 DropFields 将新转换添加到作业图(如果需要)。

  2. Node properties (节点属性) 选项卡上,输入任务图中节点的名称。如果尚未选择父节点,请从 Node parents (父节点) 列表中选择一个节点,用作转换的输入源。

  3. 选择节点详细信息窗格中的 Transform (转换) 选项卡。

  4. 在标题 DropFields 下面,选择要从数据源中删除的数据属性键。

    您还可以选中列标题 Field (字段) 旁边的复选框,自动选择数据集中的所有数据属性键。然后,您可以取消选择单个数据属性键,以便将它们保留在数据集。

  5. (可选)配置转换节点属性后,您可以选择节点详细信息面板中的 Output schema (输出架构) 选项卡,查看数据的修改架构。当您首次为任务中的任何节点选择此选项卡时,系统会提示您提供 IAM 角色以访问数据。如果您尚未在 Job details (任务详细信息) 选项卡上指定 IAM 角色,系统会提示您在此处输入 IAM 角色。

  6. (可选)配置节点属性和转换属性后,您可以选择节点详细信息窗格中的 Data preview (数据预览) 选项卡来预览已修改的数据集。当您首次为任务中的任何节点选择此选项卡时,系统会提示您提供 IAM 角色以访问数据。使用此功能会产生相关费用,并且一旦您提供 IAM 角色,则会立即开始计费。