使用“记录匹配”转换调用现有的数据分类转换 - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用“记录匹配”转换调用现有的数据分类转换

此转换调用现有的记录匹配机器学习数据分类转换。

转换根据标签对照训练过的模型评估当前数据。添加了“match_id”列,将每行分配给一组根据算法训练被视为等效的项目。有关更多信息,请参阅 Record matching with Lake Formation FindMatches

注意

Amazon Glue 使用的可视化作业版本必须与 Amazon Glue 用于创建“记录匹配”转换的版本相匹配。

屏幕截图显示转换的数据预览。
将“记录匹配”转换节点添加到作业图
  1. 打开资源面板,然后选择记录匹配将新转换添加到作业图。添加节点时选择的节点将是其父节点。

  2. 在节点属性面板上,输入作业图中节点的名称。如果尚未选择父节点,请从 Node parents (父节点) 列表中选择一个节点,用作转换的输入源。

  3. 转换选项卡上,输入从机器学习转换页面获取的 ID:

    屏幕截图显示了机器学习转换页面上的 ID。
  4. (可选)在转换选项卡上,可以选中添加置信度分数的选项。该模型将以额外计算为代价,将每个匹配的置信度分数作为附加列进行估计。