本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Dataset
表示可由处理的数据集 DataBrew。
内容
注意
下表中,首先描述的是必需参数。
- Input
-
有关 DataBrew 如何在 Amazon Glue Data Catalog 或 Amazon S3 中找到数据集的信息。
类型:Input 对象
必需:是
- Name
-
数据集的唯一名称。
类型:字符串
长度限制:长度下限为 1。最大长度为 255。
必需:是
- AccountId
-
拥有数据集的 Amazon 账户的 ID。
类型:字符串
长度限制:长度上限为 255。
必需:否
- CreateDate
-
数据集的创建日期和时间。
类型:时间戳
必需:否
- CreatedBy
-
创建数据集的用户的亚马逊资源名称 (ARN)。
类型:字符串
必需:否
- Format
-
从 Amazon S3 文件或文件夹创建的数据集的文件格式。
类型:字符串
有效值:
CSV | JSON | PARQUET | EXCEL | ORC
必需:否
- FormatOptions
-
一组选项,用于定义如何 DataBrew 解释数据集中的数据。
类型:FormatOptions 对象
必需:否
- LastModifiedBy
-
上次修改数据集的用户的亚马逊资源名称 (ARN)。
类型:字符串
必需:否
- LastModifiedDate
-
数据集的最后修改日期和时间。
类型:时间戳
必需:否
- PathOptions
-
一组选项,用于定义如何 DataBrew 解释数据集的 Amazon S3 路径。
类型:PathOptions 对象
必需:否
- ResourceArn
-
数据集的唯一亚马逊资源名称 (ARN)。
类型:字符串
长度约束:最小长度为 20。最大长度为 2048。
必需:否
- Source
-
数据集的数据位置,可以是 Amazon S3 或 Amazon Glue Data Catalog。
类型:字符串
有效值:
S3 | DATA-CATALOG | DATABASE
必需:否
- Tags
-
已应用于数据集的元数据标签。
类型:字符串到字符串映射
地图条目:最大数量为 200 个项目。
密钥长度限制:最小长度为 1。长度上限为 128。
值长度限制:最大长度为 256。
必需:否
另请参阅
有关在特定语言的 Amazon SDK 中使用此 API 的更多信息,请参阅以下内容: