JOIN - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

JOIN

对两个数据集执行连接操作。

Parameters
  • joinKeys— 一个 JSON 编码的字符串,表示每个数据集中用作连接键的列的列表。

  • joinType— 要执行的联接的类型。必须为以下值之一:INNER_JOIN|LEFT_JOIN |RIGHT_JOIN|OUTER_JOIN |LEFT_EXCLUDING_JOIN|RIGHT_EXCLUDING_JOIN|OUTER_EXCLUDING_JOIN

  • leftColumns— 一个 JSON 编码的字符串,表示当前活动数据集中的列列表。

  • rightColumns— JSON 编码的字符串,表示要连接到当前数据集的另一个(辅助)数据集中的列列表。

  • secondInputLocation— 解析为辅助数据集的数据文件的 Amazon S3 URL。

  • secondaryDatasetName— 辅助数据集的名称。

例 Example

{ "Action": { "Operation": "JOIN", "Parameters": { "joinKeys": "[{\"key\":\"assembly_session\",\"value\":\"assembly_session\"},{\"key\":\"state_code\",\"value\":\"state_code\"}]", "joinType": "INNER_JOIN", "leftColumns": "[\"year\",\"assembly_session\",\"state_code\",\"state_name\",\"all_votes\",\"yes_votes\",\"no_votes\",\"abstain\",\"idealpoint_estimate\",\"affinityscore_usa\",\"affinityscore_russia\",\"affinityscore_china\",\"affinityscore_india\",\"affinityscore_brazil\",\"affinityscore_israel\"]", "rightColumns": "[\"assembly_session\",\"vote_id\",\"resolution\",\"state_code\",\"state_name\",\"member\",\"vote\"]", "secondInputLocation": "s3://databrew-public-datasets-us-east-1/votes.csv", "secondaryDatasetName": "votes" } } }