Output - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Output

表示指定 Amazon S3 DataBrew 如何以及在何处写入食谱作业或配置文件作业生成的输出的选项。

目录

注意

下表中首先描述了必需参数。

Location

作业在 Amazon S3 中写入输出的位置。

类型:S3Location 对象

必需:是

CompressionFormat

用于压缩作业输出文本的压缩算法。

类型:字符串

有效值:GZIP | LZ4 | SNAPPY | BZIP2 | DEFLATE | LZO | BROTLI | ZSTD | ZLIB

必需:否

Format

作业输出的数据格式。

类型:字符串

有效值:CSV | JSON | PARQUET | GLUEPARQUET | AVRO | ORC | XML | TABLEAUHYPER

必需:否

FormatOptions

表示定义 DataBrew 如何设定作业输出文件格式的选项。

类型:OutputFormatOptions 对象

必需:否

MaxOutputFiles

要由作业生成并写入输出文件夹的最大文件数。对于按列分区的输出,MaxOutputFiles 值是每个分区的最大文件数。

类型:整数

有效范围:最小值为 1。最大值为 999。

必需:否

Overwrite

一个值,如果为 true,则表示为输出指定位置的任何数据将被新输出覆盖。

类型:布尔值

必需:否

PartitionColumns

作业输出的一个或多个分区列的名称。

类型:字符串数组

数组成员:最多 200 项。

长度限制:长度下限为 1。最大长度为 255。

必需:否

另请参阅

有关在特定语言的 Amazon SDK 中使用此 API 的更多信息,请参阅以下内容: