产品和服务集成
阅读本节,了解哪些产品和服务可与 DataBrew 集成。
DataBrew 可使用以下 Amazon 服务进行联网、管理和治理:
DataBrew 可使用以下 Amazon 数据湖和数据存储:
DataBrew 支持使用以下文件格式和扩展名上传数据。
| 格式。 | 文件扩展名(可选) | 压缩文件的扩展名(必需) |
|---|---|---|
|
逗号分隔的值 |
|
|
| Microsoft Excel 工作簿 |
|
不支持压缩 |
|
JSON(JSON 文档和 JSON Lines) |
|
|
| Apache ORC |
|
|
| Apache Parquet |
|
|
DataBrew 将输出文件写入 Amazon S3,并支持以下文件格式和扩展名。
| 格式。 | 文件扩展名(未压缩) | 文件扩展名(压缩) |
|---|---|---|
|
逗号分隔的值 |
.csv |
.csv.snappy, .csv.gz,
.csv.lz4, csv.bz2,
.csv.deflate, csv.br |
|
制表符分隔值 |
.csv |
.tsv.snappy, .tsv.gz,
.tsv.lz4, tsv.bz2,
.tsv.deflate, tsv.br |
| Apache Parquet | .parquet |
.parquet.snappy, .parquet.gz,
.parquet.lz4, .parquet.lzo,
.parquet.br |
| Amazon Glue Parquet | 不支持 | .glue.parquet.snappy |
| Apache Avro | .avro |
.avro.snappy, .avro.gz,
.avro.lz4, .avro.bz2,
.avro.deflate, .avro.br |
| Apache ORC | .orc |
.orc.snappy, .orc.lzo,
.orc.zlib |
| XML | .xml |
.xml.snappy, .xml.gz,
.xml.lz4, .xml.bz2,
.xml.deflate, .xml.br |
| JSON(仅限 JSON Lines 格式) |
.json
|
.json.snappy, .json.gz,
.json.lz4, json.bz2,
.json.deflate, .json.br |
| Tableau Hyper | 不支持 | 不适用 |