Output
表示指定 Amazon S3 DataBrew 如何以及在何处写入食谱作业或配置文件作业生成的输出的选项。
目录
注意
下表中首先描述了必需参数。
- Location
-
作业在 Amazon S3 中写入输出的位置。
类型:S3Location 对象
必需:是
- CompressionFormat
-
用于压缩作业输出文本的压缩算法。
类型:字符串
有效值:
GZIP | LZ4 | SNAPPY | BZIP2 | DEFLATE | LZO | BROTLI | ZSTD | ZLIB必需:否
- Format
-
作业输出的数据格式。
类型:字符串
有效值:
CSV | JSON | PARQUET | GLUEPARQUET | AVRO | ORC | XML | TABLEAUHYPER必需:否
- FormatOptions
-
表示定义 DataBrew 如何设定作业输出文件格式的选项。
类型:OutputFormatOptions 对象
必需:否
- MaxOutputFiles
-
要由作业生成并写入输出文件夹的最大文件数。对于按列分区的输出,MaxOutputFiles 值是每个分区的最大文件数。
类型:整数
有效范围:最小值为 1。最大值为 999。
必需:否
- Overwrite
-
一个值,如果为 true,则表示为输出指定位置的任何数据将被新输出覆盖。
类型:布尔值
必需:否
- PartitionColumns
-
作业输出的一个或多个分区列的名称。
类型:字符串数组
数组成员:最多 200 项。
长度限制:长度下限为 1。最大长度为 255。
必需:否
另请参阅
有关在特定语言的 Amazon SDK 中使用此 API 的更多信息,请参阅以下内容: