Output - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Output

表示指定 Amazon S3 如何以及在何处DataBrew写入食谱作业或配置文件作业生成的输出的选项。

目录

注意

在下面的列表中,首先描述了必需的参数。

Location

作业在 Amazon S3 中写入输出的位置。

类型:S3Location 对象

必需:是

CompressionFormat

用于压缩作业输出文本的压缩算法。

类型:字符串

有效值:GZIP | LZ4 | SNAPPY | BZIP2 | DEFLATE | LZO | BROTLI | ZSTD | ZLIB

必需:否

Format

作业输出的数据格式。

类型:字符串

有效值:CSV | JSON | PARQUET | GLUEPARQUET | AVRO | ORC | XML | TABLEAUHYPER

必需:否

FormatOptions

表示定义作业输出文件DataBrew格式的选项。

类型:OutputFormatOptions 对象

必需:否

MaxOutputFiles

作业生成并写入输出文件夹的最大文件的最大文件的最大文件的最大文件的最大文件的最大文件的最大文件的最大文件的最大文件的 对于按列分区的输出,该MaxOutputFiles值是每个分区的最大文件数。

类型:整数

有效范围:最小值为 1。最大值为 999。

必需:否

Overwrite

一个值,如果为 true,则表示为输出指定位置的任何数据将被新输出覆盖。

类型:布尔值

必需:否

PartitionColumns

作业输出的一个或多个分区列的名称。

类型:字符串数组

数组成员:

长度限制:最小长度为 1。最大长度为 255。

必需:否

另请参阅

有关在特定语言的 Amazon 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: