DVANCED_DATATYPE_ 过滤器 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

DVANCED_DATATYPE_ 过滤器

根据高级数据类型检测过滤当前源列。例如,假定 DatabreW 已确定为包含邮政编码的列,此转换可以根据时区过滤该列。您可以提取的详细信息取决于检测到的模式,如中所述备注下面的。

Parameters
  • sourceColumn— 字符串源列的名称。

  • pattern— 要提取的模式。

  • advancedDataType— 可以是电话、邮政编码、日期时间、州、信用卡、URL、电子邮件、SSN 或性别之一。

  • filter values— 用户想要基于筛选列的字符串值列表。

  • strategy— KEEE_ROWS 或 DISCARD_ROWS 或 CLEAR_FILTER 或 CLEAR_OTHERS。

  • clearWithEmpty— 布尔值true要么false,用来清除行empty而不是null.

Notes
  • 如果高级数据类型为Phone,那么模式可以是 AREA_CODE、TIME_ZONE 或 COURY_CODE。

  • 如果高级数据类型为邮政编码,那么模式可以是 TIME_ZONE、国家、州、城市、类型或地区。

  • 如果高级数据类型为日期时间,那么模式可以是日、月、MONTON_NAME、周、季度或年份。

  • 如果高级数据类型为,那么模式可以是 TIME_ZONE。

  • 如果高级数据类型为信用卡号,那么模式可以是长度或网络。

  • 如果高级数据类型为URL,那么模式可以是协议、TLD 或域。

例 Example

{ "RecipeAction": { "Operation": "ADVANCED_DATATYPE_FILTER", "Parameters": { "pattern": "AREA_CODE", "sourceColumn": "phoneColumn", "advancedDataType": "Phone", "filterValues": ['Ohio'], "strategy": "KEEP_ROWS" } } }