AWS CloudFormation
User Guide (API 版本 2010-05-15)
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

AWS Glue Partition StorageDescriptor

StorageDescriptor 属性类型描述 AWS Glue 分区数据的物理存储。

StorageDescriptorAWS Glue Partition PartitionInput 属性类型的属性。

语法

要在 AWS CloudFormation 模板中声明此实体,请使用以下语法:

JSON

{ "StoredAsSubDirectories" : Boolean, "Parameters" : JSON object, "BucketColumns" : [ String, ... ], "SkewedInfo" : SkewedInfo, "InputFormat" : String, "NumberOfBuckets" : Integer, "OutputFormat" : String, "Columns" : [ Column, ... ], "SerdeInfo" : SerdeInfo, "SortColumns" : [ Order, ... ], "Compressed" : Boolean, "Location" : String }

属性

StoredAsSubDirectories

指示是否在子目录中存储分区数据。

必需:否

类型:布尔值

更新要求无需中断

Parameters

指定用户提供的属性的 UTF-8 字符串到 UTF-8 字符串键/值对。

必需:否

类型:JSON 对象

更新要求无需中断

BucketColumns

指定分区中的 Reducer 分组列、集群列以及存储桶列的 UTF-8 字符串列表。

必需:否

类型:字符串值列表

更新要求无需中断

SkewedInfo

有关在列中经常出现的值 (偏斜值) 的信息。

必需:否

类型AWS Glue Partition SkewedInfo

更新要求无需中断

InputFormat

输入格式:SequenceFileInputFormat (二进制)、TextInputFormat 或自定义格式。它必须与单行字符串模式匹配:[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*

必需:否

类型:字符串

更新要求无需中断

NumberOfBuckets

存储桶数。

必填:条件性。如果分区包含任何维度列,您必须指定该属性。

类型:整数

更新要求无需中断

OutputFormat

输出格式:SequenceFileOutputFormat (二进制)、IgnoreKeyTextOutputFormat 或自定义格式。它必须与单行字符串模式匹配:[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*

必需:否

类型:字符串

更新要求无需中断

Columns

分区中的列。

必需:否

类型AWS Glue Partition Column 的列表

更新要求无需中断

SerdeInfo

有关序列化/反序列化程序 (SerDe) 的信息,它用作抽取器和加载器。

必需:否

类型AWS Glue Partition SerdeInfo

更新要求无需中断

SortColumns

分区中的每个存储桶的排序顺序。

必需:否

类型AWS Glue Partition Order 的列表

更新要求无需中断

Compressed

指示是否压缩分区中的数据。

必需:否

类型:布尔值

更新要求无需中断

Location

分区的物理位置。默认情况下,它采用仓库位置的形式,后跟仓库中的数据库位置,然后是分区名称。它必须与 URI 地址多行字符串模式匹配:[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*

必需:否

类型:字符串

更新要求无需中断

本页内容: