产品和服务集成 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

产品和服务集成

使用本节了解哪些产品和服务与之集成 DataBrew。

DataBrew 可与以下联网、管理和治理 Amazon 服务配合使用:

DataBrew 适用于以下 Amazon 数据湖和数据存储:

DataBrew 支持以下用于上传数据的文件格式和扩展名。

格式 文件扩展名(可选) 压缩文件的扩展名(必填)

逗号分隔的值

.csv

.gz

.snappy

.lz4

.bz2

.deflate

微软 Excel 工作簿

.xlsx

不支持压缩

JSON(JSON 文档和 JSON 行)

.json, .jsonl

.gz

.snappy

.lz4

.bz2

.deflate

Apache ORC

.orc

.zlib

.snappy

Apache Parquet

.parquet

.gz

.snappy

.lz4

DataBrew 将输出文件写入 Amazon S3,并支持以下文件格式和扩展名。

格式 文件扩展名(未压缩) 文件扩展名(压缩)

逗号分隔的值

.csv .csv.snappy, .csv.gz, .csv.lz4, csv.bz2, .csv.deflate, csv.br

制表符分隔的值

.csv .tsv.snappy, .tsv.gz, .tsv.lz4, tsv.bz2, .tsv.deflate, tsv.br
Apache Parquet .parquet .parquet.snappy, .parquet.gz, .parquet.lz4, .parquet.lzo, .parquet.br
Amazon Glue 拼花地板 不支持 .glue.parquet.snappy
Apache Avro .avro .avro.snappy, .avro.gz, .avro.lz4, .avro.bz2, .avro.deflate, .avro.br
Apache ORC .orc .orc.snappy, .orc.lzo, .orc.zlib
XML .xml .xml.snappy, .xml.gz, .xml.lz4, .xml.bz2, .xml.deflate, .xml.br
JSON(仅限 JSON 行格式) .json .json.snappy, .json.gz, .json.lz4, json.bz2, .json.deflate, .json.br
Tableau 超级 不支持 不适用