Amazon Redshift
数据库开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

教程:使用 Amazon Redshift Spectrum 查询嵌套数据

概览

Amazon Redshift Spectrum 支持以 Parquet、ORC、JSON 和 Ion 文件格式查询嵌套数据。Redshift Spectrum 使用外部表访问数据。可以创建使用复杂数据类型 structarraymap 的外部表。

例如,假定您的数据文件在名为 customers 的文件夹中包含 Amazon S3 中的以下数据。虽然没有单个根元素,但该样本数据中的每个 JSON 对象表示表中的一行。

{"id": 1, "name": {"given": "John", "family": "Smith"}, "phones": ["123-457789"], "orders": [{"shipdate": "2018-03-01T11:59:59.000Z", "price": 100.50}, {"shipdate": "2018-03-01T09:10:00.000Z", "price": 99.12}] } {"id": 2, "name": {"given": "Jenny", "family": "Doe"}, "phones": ["858-8675309", "415-9876543"], "orders": [] } {"id": 3, "name": {"given": "Andy", "family": "Jones"}, "phones": [], "orders": [{"shipdate": "2018-03-02T08:02:15.000Z", "price": 13.50}] }

您可以使用 Redshift Spectrum 查询此数据。以下教程介绍如何实现此操作。

有关教程先决条件、步骤和嵌套数据使用案例,请参阅以下主题:

先决条件

如果您尚未使用 Redshift Spectrum,请按照Amazon Redshift Spectrum 入门教程中的步骤操作,然后继续。

本页内容: