本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Output
表示指定 Amazon S3 如何以及在何处DataBrew写入食谱作业或配置文件作业生成的输出的选项。
目录
注意
在下面的列表中,首先描述了必需的参数。
- Location
-
作业在 Amazon S3 中写入输出的位置。
类型:S3Location 对象
必需:是
- CompressionFormat
-
用于压缩作业输出文本的压缩算法。
类型:字符串
有效值:
GZIP | LZ4 | SNAPPY | BZIP2 | DEFLATE | LZO | BROTLI | ZSTD | ZLIB
必需:否
- Format
-
作业输出的数据格式。
类型:字符串
有效值:
CSV | JSON | PARQUET | GLUEPARQUET | AVRO | ORC | XML | TABLEAUHYPER
必需:否
- FormatOptions
-
表示定义作业输出文件DataBrew格式的选项。
类型:OutputFormatOptions 对象
必需:否
- MaxOutputFiles
-
作业生成并写入输出文件夹的最大文件的最大文件的最大文件的最大文件的最大文件的最大文件的最大文件的最大文件的最大文件的 对于按列分区的输出,该MaxOutputFiles值是每个分区的最大文件数。
类型:整数
有效范围:最小值为 1。最大值为 999。
必需:否
- Overwrite
-
一个值,如果为 true,则表示为输出指定位置的任何数据将被新输出覆盖。
类型:布尔值
必需:否
- PartitionColumns
-
作业输出的一个或多个分区列的名称。
类型:字符串数组
数组成员:
长度限制:最小长度为 1。最大长度为 255。
必需:否
另请参阅
有关在特定语言的 Amazon 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: