本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
CreateDataset
创建新的 DataBrew 数据集。
请求语法
POST /datasets HTTP/1.1
Content-type: application/json
{
"Format": "string
",
"FormatOptions": {
"Csv": {
"Delimiter": "string
",
"HeaderRow": boolean
},
"Excel": {
"HeaderRow": boolean
,
"SheetIndexes": [ number
],
"SheetNames": [ "string
" ]
},
"Json": {
"MultiLine": boolean
}
},
"Input": {
"DatabaseInputDefinition": {
"DatabaseTableName": "string
",
"GlueConnectionName": "string
",
"QueryString": "string
",
"TempDirectory": {
"Bucket": "string
",
"BucketOwner": "string
",
"Key": "string
"
}
},
"DataCatalogInputDefinition": {
"CatalogId": "string
",
"DatabaseName": "string
",
"TableName": "string
",
"TempDirectory": {
"Bucket": "string
",
"BucketOwner": "string
",
"Key": "string
"
}
},
"Metadata": {
"SourceArn": "string
"
},
"S3InputDefinition": {
"Bucket": "string
",
"BucketOwner": "string
",
"Key": "string
"
}
},
"Name": "string
",
"PathOptions": {
"FilesLimit": {
"MaxFiles": number
,
"Order": "string
",
"OrderedBy": "string
"
},
"LastModifiedDateCondition": {
"Expression": "string
",
"ValuesMap": {
"string
" : "string
"
}
},
"Parameters": {
"string
" : {
"CreateColumn": boolean
,
"DatetimeOptions": {
"Format": "string
",
"LocaleCode": "string
",
"TimezoneOffset": "string
"
},
"Filter": {
"Expression": "string
",
"ValuesMap": {
"string
" : "string
"
}
},
"Name": "string
",
"Type": "string
"
}
}
},
"Tags": {
"string
" : "string
"
}
}
URI 请求参数
该请求不使用任何 URI 参数。
请求体
请求接受采用 JSON 格式的以下数据。
- Input
-
表示有关 DataBrew 如何在 Amazon S3 Amazon Glue Data Catalog 或 Amazon S3 中查找数据的信息。
类型:Input 对象
必需:是
- Name
-
要创建的数据集的名称。有效字符包括字母数字(A-Z、a-z、0-9)、连字符 (-)、句点 (.) 和空格。
类型:字符串
长度限制:长度下限为 1。最大长度为 255。
必需:是
- Format
-
从 Amazon S3 文件或文件夹创建的数据集的文件格式。
类型:字符串
有效值:
CSV | JSON | PARQUET | EXCEL | ORC
必需:否
- FormatOptions
-
表示一组选项,这些选项用于定义逗号分隔值 (CSV)、Excel 或 JSON 输入的结构。
类型:FormatOptions 对象
必需:否
- PathOptions
-
一组选项,用于定义如何 DataBrew 解释数据集的 Amazon S3 路径。
类型:PathOptions 对象
必需:否
- Tags
-
要应用于此数据集的元数据标签。
类型:字符串到字符串映射
地图条目:最大数量为 200 个项目。
密钥长度限制:最小长度为 1。长度上限为 128。
值长度限制:最大长度为 256。
必需:否
响应语法
HTTP/1.1 200
Content-type: application/json
{
"Name": "string"
}
响应元素
如果此操作成功,则该服务将会发送回 HTTP 200 响应。
服务以 JSON 格式返回以下数据。
- Name
-
您创建的数据集的名称。
类型:字符串
长度限制:长度下限为 1。最大长度为 255。
错误
有关所有操作的常见错误信息,请参阅常见错误。
- AccessDeniedException
-
对指定资源的访问被拒绝。
HTTP 状态代码:403
- ConflictException
-
更新或删除资源可能会导致状态不一致。
HTTP 状态代码:409
- ServiceQuotaExceededException
-
超过了服务配额。
HTTP 状态代码:402
- ValidationException
-
此请求的输入参数未通过验证。
HTTP 状态代码:400
另请参阅
有关在特定语言的 Amazon SDK 中使用此 API 的更多信息,请参阅以下内容: