本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
ADVANCED_DATATYPE_FILTER
根据高级数据类型检测筛选当前的源列。例如,给定 DataBrew 已确定为包含邮政编码的列,此转换可以根据时区筛选该列。您可以提取的详细信息取决于检测到的模式,如下面的备注中所述。
参数
-
sourceColumn:字符串源列的名称。 -
pattern:要提取的模式。 -
advancedDataType:可以是电话、邮政编码、日期时间、州/省、信用卡、URL、电子邮件、SSN 或性别之一。 -
filter values:用户想据以对列进行筛选的字符串值列表。 -
strategy:KEEP_ROWS、DISCARD_ROWS、CLEAR_FILTERS 或 CLEAR_OTHERS。 -
clearWithEmpty:布尔值true或false,以清除状态为empty(而不是null)的行。
备注
如果 advancedDataType 为电话,则模式可以是 AREA_CODE、TIME_ZONE 或 COUNTRY_CODE。
如果 advancedDataType 为邮政编码,则模式可以是 TIME_ZONE、COUNTRY、STATE、CITY、TYPE 或 REGION。
如果 advancedDataType 为日期时间,则模式可以是 DAY、MONTH、MONTH_NAME、WEEK、QUARTER 或 YEAR。
如果 advancedDataType 为州/省,则模式可以是 TIME_ZONE。
如果 advancedDataType 为信用卡,则模式可以是 LENGTH 或 NETWORK。
如果 advancedDataType 为 URL,则模式可以是 PROTOCOL、TLD 或 DOMAIN。
例示例
{ "RecipeAction": { "Operation": "ADVANCED_DATATYPE_FILTER", "Parameters": { "pattern": "AREA_CODE", "sourceColumn": "phoneColumn", "advancedDataType": "Phone", "filterValues": ['Ohio'], "strategy": "KEEP_ROWS" } } }