Dataset - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Dataset

表示可由处理的数据集 DataBrew。

内容

注意

下表中,首先描述的是必需参数。

Input

有关 DataBrew 如何在 Amazon Glue Data Catalog 或 Amazon S3 中找到数据集的信息。

类型:Input 对象

必需:是

Name

数据集的唯一名称。

类型:字符串

长度限制:长度下限为 1。最大长度为 255。

必需:是

AccountId

拥有数据集的 Amazon 账户的 ID。

类型:字符串

长度限制:长度上限为 255。

必需:否

CreateDate

数据集的创建日期和时间。

类型:时间戳

必需:否

CreatedBy

创建数据集的用户的亚马逊资源名称 (ARN)。

类型:字符串

必需:否

Format

从 Amazon S3 文件或文件夹创建的数据集的文件格式。

类型:字符串

有效值:CSV | JSON | PARQUET | EXCEL | ORC

必需:否

FormatOptions

一组选项,用于定义如何 DataBrew 解释数据集中的数据。

类型:FormatOptions 对象

必需:否

LastModifiedBy

上次修改数据集的用户的亚马逊资源名称 (ARN)。

类型:字符串

必需:否

LastModifiedDate

数据集的最后修改日期和时间。

类型:时间戳

必需:否

PathOptions

一组选项,用于定义如何 DataBrew 解释数据集的 Amazon S3 路径。

类型:PathOptions 对象

必需:否

ResourceArn

数据集的唯一亚马逊资源名称 (ARN)。

类型:字符串

长度约束:最小长度为 20。最大长度为 2048。

必需:否

Source

数据集的数据位置,可以是 Amazon S3 或 Amazon Glue Data Catalog。

类型:字符串

有效值:S3 | DATA-CATALOG | DATABASE

必需:否

Tags

已应用于数据集的元数据标签。

类型:字符串到字符串映射

地图条目:最大数量为 200 个项目。

密钥长度限制:最小长度为 1。长度上限为 128。

值长度限制:最大长度为 256。

必需:否

另请参阅

有关在特定语言的 Amazon SDK 中使用此 API 的更多信息,请参阅以下内容: