产品和服务集成 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

产品和服务集成

阅读本节,了解哪些产品和服务可与 DataBrew 集成。

DataBrew 可使用以下 Amazon 服务进行联网、管理和治理:

DataBrew 可使用以下 Amazon 数据湖和数据存储:

DataBrew 支持使用以下文件格式和扩展名上传数据。

格式 文件扩展名(可选) 压缩文件的扩展名(必需)

逗号分隔的值

.csv

.gz

.snappy

.lz4

.bz2

.deflate

Microsoft Excel 工作簿

.xlsx

不支持压缩

JSON(JSON 文档和 JSON Lines)

.json, .jsonl

.gz

.snappy

.lz4

.bz2

.deflate

Apache ORC

.orc

.zlib

.snappy

Apache Parquet

.parquet

.gz

.snappy

.lz4

DataBrew 将输出文件写入 Amazon S3,并支持以下文件格式和扩展名。

格式 文件扩展名(未压缩) 文件扩展名(压缩)

逗号分隔的值

.csv .csv.snappy, .csv.gz, .csv.lz4, csv.bz2, .csv.deflate, csv.br

制表符分隔值

.csv .tsv.snappy, .tsv.gz, .tsv.lz4, tsv.bz2, .tsv.deflate, tsv.br
Apache Parquet .parquet .parquet.snappy, .parquet.gz, .parquet.lz4, .parquet.lzo, .parquet.br
Amazon Glue Parquet 不支持 .glue.parquet.snappy
Apache Avro .avro .avro.snappy, .avro.gz, .avro.lz4, .avro.bz2, .avro.deflate, .avro.br
Apache ORC .orc .orc.snappy, .orc.lzo, .orc.zlib
XML .xml .xml.snappy, .xml.gz, .xml.lz4, .xml.bz2, .xml.deflate, .xml.br
JSON(仅限 JSON Lines 格式) .json .json.snappy, .json.gz, .json.lz4, json.bz2, .json.deflate, .json.br
Tableau Hyper 不支持 不适用