Join 类 - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

Join 类

对两个 DynamicFrames 执行等式联接。

Methods

__call__(frame1, frame2, keys1, keys2, transformation_ctx = "")

对两个 DynamicFrames 执行等式联接。

  • frame1 – 要联接的第一个 DynamicFrame (必需)。

  • frame2 – 要联接的第二个 DynamicFrame (必需)。

  • keys1 – 第一个帧要联接的键 (必需)。

  • keys2 – 第二个帧要联接的键 (必需)。

  • transformation_ctx – 用于标识状态信息的唯一字符串 (可选)。

返回通过联接两个 DynamicFrame 所获得的新的 DynamicFrames

apply(cls, *args, **kwargs)

继承自 GlueTransform apply

name(cls)

继承自 GlueTransform 名称

describeArgs(cls)

继承自 GlueTransform describeArgs

describeReturn(cls)

继承自 GlueTransform describeReturn

describeTransform(cls)

继承自 GlueTransform describeTransform

describeErrors(cls)

继承自 GlueTransform describeErrors

describe(cls)

继承自 GlueTransform 描述

Join 示例

Join 函数可管理重复的列。每个数据集都有一个名为 zip 的列。Amazon Glue 会向其中一个重复的列名添加句点 (.),以避免出现错误。

dyf_join = Join.apply(dyf_json, dyf_selectFields, 'zip', 'zip') dyf_join.toDF().show() +--------------------+-----+-----+ | customers| .zip| zip| +--------------------+-----+-----+ |[[108 Park Street...|75091|75091| |[[66 P Street, NY...|75023|75023| |[[708 Fed Ln, CA,...|90093|90093| +--------------------+-----+-----+