常见数据类型
常见数据类型介绍 Amazon Glue 中的各种常见的数据类型。
Tag 结构
Tag
对象表示用户可分配给 Amazon 资源的标签。每个标签都包含您定义的一个键和一个可选值。
有关标签以及如何控制对 Amazon Glue 中资源的访问的更多信息,请参阅开发人员指南中的 Amazon Glue 中的 Amazon 标签和 指定 Amazon Glue 资源 ARN。
字段
DecimalNumber 结构
包含以十进制格式表示的数字值。
ErrorDetail 结构
包含有关错误的详细信息。
字段
-
ErrorCode
– UTF-8 字符串,长度不少于 1 个字节或超过 255 个字节,与 Single-line string pattern 匹配。与此错误关联的代码。
-
ErrorMessage
– 描述字符串,长度不超过 2048 个字节,与 URI address multi-line string pattern 匹配。描述错误的消息。
PropertyPredicate 结构
定义属性谓词。
字段
ResourceUri 结构
函数资源的 URI。
字段
-
ResourceType
– UTF-8 字符串(有效值:JAR
|FILE
|ARCHIVE
)。资源的类型。
-
Uri
- 统一资源标识符 (uri),不少于 1 个字节或超过 1024 个字节,与 URI address multi-line string pattern 匹配。用于访问资源的 URI。
ColumnStatistics 结构
表示表或分区生成的列级统计数据。
字段
-
ColumnName
– 必填:UTF-8 字符串,长度不少于 1 个字节或超过 255 个字节,与 Single-line string pattern 匹配。统计数据所属列的名称。
-
ColumnType
– 必填:类型名称,长度不超过 20000 个字节,与 Single-line string pattern 匹配。列的数据类型。
-
生成列统计数据的时间戳。
-
StatisticsData
– 必填:一个 ColumnStatisticsData 对象。ColumnStatisticData
对象,其中包含统计数据值。
ColumnStatisticsError 结构
封装失败的 ColumnStatistics
对象以及失败原因。
字段
-
ColumnStatistics
– 一个 ColumnStatistics 对象。列的
ColumnStatistics
。 -
Error
– 一个 ErrorDetail 对象。包含操作失败原因的错误消息。
ColumnError 结构
封装失败的列名称以及失败原因。
字段
-
ColumnName
– UTF-8 字符串,长度不少于 1 个字节或超过 255 个字节,与 Single-line string pattern 匹配。封装失败的列名称。
-
Error
– 一个 ErrorDetail 对象。包含操作失败原因的错误消息。
ColumnStatisticsData 结构
包含单个类型的列统计数据。只应设置一个数据对象,并由 Type
属性指示。
字段
-
Type
– 必填:UTF-8 字符串(有效值:BOOLEAN
|DATE
|DECIMAL
|DOUBLE
|LONG
|STRING
|BINARY
)。列统计数据的类型。
-
BooleanColumnStatisticsData
– 一个 BooleanColumnStatisticsData 对象。布尔值列统计数据。
-
DateColumnStatisticsData
– 一个 DateColumnStatisticsData 对象。日期列统计数据。
-
DecimalColumnStatisticsData
– 一个 DecimalColumnStatisticsData 对象。十进制列统计数据。
-
DoubleColumnStatisticsData
– 一个 DoubleColumnStatisticsData 对象。双列统计数据。
-
LongColumnStatisticsData
– 一个 LongColumnStatisticsData 对象。长列统计数据。
-
StringColumnStatisticsData
– 一个 StringColumnStatisticsData 对象。字符串列统计数据。
-
BinaryColumnStatisticsData
– 一个 BinaryColumnStatisticsData 对象。二进制列统计数据。
BooleanColumnStatisticsData 结构
定义支持布尔值数据列的列统计数据。
字段
DateColumnStatisticsData 结构
定义支持时间戳数据列的列统计数据。
字段
DecimalColumnStatisticsData 结构
定义支持固定点数数据列的列统计数据。
字段
-
MinimumValue
– 一个 DecimalNumber 对象。列中的最低值。
-
MaximumValue
– 一个 DecimalNumber 对象。列中的最高值。
-
NumberOfNulls
– 必填:数字(长度),至多为“无”。列中空值的数量。
-
NumberOfDistinctValues
– 必填:数字(长度),至多为“无”。列中的独特值的数量。
DoubleColumnStatisticsData 结构
定义支持浮动点数数据列的列统计数据。
字段
LongColumnStatisticsData 结构
定义支持整数数据列的列统计数据。
字段
StringColumnStatisticsData 结构
定义支持字符序列数据值的列统计数据。
字段
BinaryColumnStatisticsData 结构
定义支持位序列数据值的列统计数据。
字段
字符串模式
API 使用以下正则表达式来定义对于各种字符串参数和成员有效的内容:
单行字符串模式 -“
[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*
”URI 地址多行字符串模式 -“
[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*
”Logstash Grok 字符串模式 -“
[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*
”自定义字符串模式 #12 –“
[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}
”自定义字符串模式 #27 –“
([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])*
”自定义字符串模式 #30 –“
([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'])*
”自定义字符串模式 #31 –“
([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n])*
”自定义字符串模式 #32 –“
([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])*
”自定义字符串模式 #33 –“
([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\r\n])*
”