Output - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Output

表示选项,用于指定在 Amazon S3 中如何以及在何处 DataBrew 写入由配方任务或配置文件任务生成的输出。

内容

注意

下表中,首先描述的是必需参数。

Location

作业在 Amazon S3 中写入输出的位置。

类型:S3Location 对象

必需:是

CompressionFormat

用于压缩作业输出文本的压缩算法。

类型:字符串

有效值:GZIP | LZ4 | SNAPPY | BZIP2 | DEFLATE | LZO | BROTLI | ZSTD | ZLIB

必需:否

Format

作业输出的数据格式。

类型:字符串

有效值:CSV | JSON | PARQUET | GLUEPARQUET | AVRO | ORC | XML | TABLEAUHYPER

必需:否

FormatOptions

表示定义如何 DataBrew 格式化作业输出文件的选项。

类型:OutputFormatOptions 对象

必需:否

MaxOutputFiles

作业生成并写入输出文件夹的最大文件数。对于按列分区的输出,该 MaxOutputFiles 值为每个分区的最大文件数。

类型:整数

有效范围:最小值为 1。最大值为 999。

必需:否

Overwrite

一个值,如果为 true,则表示为输出指定位置的任何数据将被新输出覆盖。

类型:布尔值

必需:否

PartitionColumns

作业输出的一个或多个分区列的名称。

类型:字符串数组

数组成员:最多 200 项。

长度约束:最小长度为 1。最大长度为 255。

必需:否

另请参阅

有关在特定语言的 Amazon SDK 中使用此 API 的更多信息,请参阅以下内容: