本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
产品和服务集成
使用本节了解哪些产品和服务与之集成 DataBrew。
DataBrew 可与以下联网、管理和治理 Amazon 服务配合使用:
DataBrew 适用于以下 Amazon 数据湖和数据存储:
DataBrew 支持以下用于上传数据的文件格式和扩展名。
| 格式 | 文件扩展名(可选) | 压缩文件的扩展名(必填) |
|---|---|---|
|
逗号分隔的值 |
|
|
| 微软 Excel 工作簿 |
|
不支持压缩 |
|
JSON(JSON 文档和 JSON 行) |
|
|
| Apache ORC |
|
|
| Apache Parquet |
|
|
DataBrew 将输出文件写入 Amazon S3,并支持以下文件格式和扩展名。
| 格式 | 文件扩展名(未压缩) | 文件扩展名(压缩) |
|---|---|---|
|
逗号分隔的值 |
.csv |
.csv.snappy, .csv.gz,
.csv.lz4, csv.bz2,
.csv.deflate, csv.br |
|
制表符分隔的值 |
.csv |
.tsv.snappy, .tsv.gz,
.tsv.lz4, tsv.bz2,
.tsv.deflate, tsv.br |
| Apache Parquet | .parquet |
.parquet.snappy, .parquet.gz,
.parquet.lz4, .parquet.lzo,
.parquet.br |
| Amazon Glue 拼花地板 | 不支持 | .glue.parquet.snappy |
| Apache Avro | .avro |
.avro.snappy, .avro.gz,
.avro.lz4, .avro.bz2,
.avro.deflate, .avro.br |
| Apache ORC | .orc |
.orc.snappy, .orc.lzo,
.orc.zlib |
| XML | .xml |
.xml.snappy, .xml.gz,
.xml.lz4, .xml.bz2,
.xml.deflate, .xml.br |
| JSON(仅限 JSON 行格式) |
.json
|
.json.snappy, .json.gz,
.json.lz4, json.bz2,
.json.deflate, .json.br |
| Tableau 超级 | 不支持 | 不适用 |