本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
高级数据类型
高级数据类型是通过模式匹配在项目的字符串列中进行 DataBrew 检测的数据类型。当您单击某个字符串列时,如果该列中有 50% 或更多的值符合高级数据类型标准,则会将该列标记为该相应的高级数据类型。
DataBrew 可以检测的数据类型有:
日期/时间戳
SSN
Phone number(电话号码)
电子邮件地址
信用卡
性别
IP 地址
URL
邮政编码
国家/地区
货币
州
City(城市)
您可以通过以下转换来处理高级数据类型:
GET_ADVANCED_DATATYPE:给定字符串列,标识该列的高级数据类型(如果有)。
EXTRACT_ADVANCED_DATATYPE_DETAILS:提取高级数据类型的详细信息。
ADVANCED_DATATYPE_FILTER:根据高级数据类型检测筛选当前的源列。
ADVANCED_DATATYPE_FLAG:根据当前源列的值创建新的标志列。