Dataset - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Dataset

表示可以由 DataBrew 处理的数据集。

目录

注意

下表中首先描述了必需参数。

Input

有关 DataBrew 如何在 Amazon Glue Data Catalog 或 Amazon S3 中查找数据集的信息。

类型:Input 对象

必需:是

Name

数据集的唯一名称。

类型:字符串

长度限制:长度下限为 1。最大长度为 255。

必需:是

AccountId

拥有数据集的 Amazon 账户的 ID。

类型:字符串

长度限制:长度上限为 255。

必需:否

CreateDate

数据集的创建日期和时间。

类型:时间戳

必需:否

CreatedBy

创建数据集的用户的 Amazon 资源名称(ARN)。

类型:字符串

必需:否

Format

从 Amazon S3 文件或文件夹创建的数据集的文件格式。

类型:字符串

有效值:CSV | JSON | PARQUET | EXCEL | ORC

必需:否

FormatOptions

定义 DataBrew 如何解释数据集中数据的一组选项。

类型:FormatOptions 对象

必需:否

LastModifiedBy

上次修改数据集的用户的 Amazon 资源名称(ARN)。

类型:字符串

必需:否

LastModifiedDate

数据集的上次修改日期和时间。

类型:时间戳

必需:否

PathOptions

定义 DataBrew 如何解释数据集的 Amazon S3 路径的一组选项。

类型:PathOptions 对象

必需:否

ResourceArn

数据集的唯一 Amazon 资源名称(ARN)。

类型:字符串

长度约束:最小长度为 20。最大长度为 2048。

必需:否

Source

数据集的数据位置:Amazon S3 或 Amazon Glue Data Catalog。

类型:字符串

有效值:S3 | DATA-CATALOG | DATABASE

必需:否

Tags

已应用于数据集的元数据标签。

类型:字符串到字符串映射

映射条目:最多 200 项。

密钥长度限制:最小长度为 1。最大长度为 128。

值长度限制:最大长度为 256。

必需:否

另请参阅

有关在特定语言的 Amazon SDK 中使用此 API 的更多信息,请参阅以下内容: