Dataset - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Dataset

表示可以由其处理的数据集DataBrew。

目录

注意

在下面的列表中,首先描述了必需的参数。

Input

有关DataBrew如何在Amazon Glue Data Catalog或 Amazon S3 中查找数据集的信息。

类型:Input 对象

必需:是

Name

数据集的唯一名称。

类型:字符串

长度限制:最小长度为 1。最大长度为 255。

必需:是

AccountId

拥有数据Amazon集的 ID。

类型:字符串

长度限制:最大长度为 255。

必需:否

CreateDate

数据集的创建日期和时间。

类型:Timestamp

必需:否

CreatedBy

创建数据集的用户的 Amazon 资源名称(ARN)。

类型:字符串

必需:否

Format

从 Amazon S3 文件或文件夹创建的数据集的文件格式。

类型:字符串

有效值:CSV | JSON | PARQUET | EXCEL | ORC

必需:否

FormatOptions

定义 Datazon 如何DataBrew解释数据集中数据的一组选项。

类型:FormatOptions 对象

必需:否

LastModifiedBy

上次修改数据集的用户的 Amazon 资源名称(ARN)。

类型:字符串

必需:否

LastModifiedDate

数据集的最后修改日期和时间。

类型:Timestamp

必需:否

PathOptions

定义 Amazon S3 路径的一组选项,定义 Amazon S3 路径的DataBrew解释方式。

类型:PathOptions 对象

必需:否

ResourceArn

数据集的唯一 Amazon 资源名称(ARN)。

类型:字符串

长度限制:最小长度为 20。最大长度为 2048。

必需:否

Source

数据集的数据的位置,可以是 Amazon S3 或Amazon Glue Data Catalog。

类型:字符串

有效值:S3 | DATA-CATALOG | DATABASE

必需:否

Tags

已应用于数据集的元数据标签。

类型:字符串到字符串映射

映射条目:最多 200 项。

密钥长度限制:最小长度为 1。最大长度为 128。

值长度约束:最大长度为 256。

必需:否

另请参阅

有关在特定语言的 Amazon 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: