产品和服务集成 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

产品和服务集成

使用本节了解哪些产品和服务与 DatabreW 集成。

DatBreW 与以下配合使用Amazon针对网络、管理和治理的服务:

DatBreW 与以下配合使用Amazon数据湖和数据存储:

DatabreW 支持以下文件格式和扩展名来上传数据。

格式 文件扩展名(可选) 压缩文件的扩展名(必填)

逗号分隔值

.csv

.gz

.snappy

.lz4

.bz2

.deflate

Microsoft Excel 工作簿

.xlsx

没有压缩支持

JSON(JSON 文档和 JSON 行)

.json, .jsonl

.gz

.snappy

.lz4

.bz2

.deflate

Apache ORC

.orc

.zlib

.snappy

Apache Parquet

.parquet

.gz

.snappy

.lz4

DatabreW 将输出文件写入 Amazon S3,并支持以下文件格式和扩展名。

格式 文件扩展名(未压缩) 文件扩展名(压缩)

逗号分隔值

.csv .csv.snappy, .csv.gz, .csv.lz4, csv.bz2, .csv.deflate, csv.br

制表符分隔值

.csv .tsv.snappy, .tsv.gz, .tsv.lz4, tsv.bz2, .tsv.deflate, tsv.br
Apache Parquet .parquet .parquet.snappy, .parquet.gz, .parquet.lz4, .parquet.lzo, .parquet.br
Amazon GlueParquet 不支持 .glue.parquet.snappy
Apache Avro .avro .avro.snappy, .avro.gz, .avro.lz4, .avro.bz2, .avro.deflate, .avro.br
Apache ORC .orc .orc.snappy, .orc.lzo, .orc.zlib
XML .xml .xml.snappy, .xml.gz, .xml.lz4, .xml.bz2, .xml.deflate, .xml.br
JSON(仅限 JSON 行格式) .json .json.snappy, .json.gz, .json.lz4, json.bz2, .json.deflate, .json.br
Tableau Hyper 不支持 不适用