本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
JSONSerDe图书馆
在雅典娜中,你可以使用SerDe用于反序列化 JSON 数据的库。反序列化会转换 JSON 数据,以便它可以被序列化(写出)为不同的格式,如 Parquet 或 ORC。
-
这些区域有: OpenX jsonSerDe
-
这些区域有: 亚马逊 Ion HiveSerDe
注意
Hive 和 OpenX 库期望 JSON 数据位于单行上(未格式化),用新的行字符分隔记录。亚马逊 Ion HiveSerDe没有这个要求,可以用作替代方案,因为 Ion 数据格式是 JSON 的超集。
库名称
使用以下值之一:
org.apache.hive.hcatalog.data。JsonSerDe
org.openx.data.jsonserde。JsonSerDe
com.amazon.ionhiveserde。IonHiveSerDe
其他资源
有关在 Athena 中使用 JSON 和嵌套 JSON 的更多信息,请参阅以下资源:
-
使用 JSON 从嵌套的 JSON 和映射在亚马逊 Athena 中创建表SerDe
(Amazon大数据(博客) -
我在 Amazon Athena 中尝试读取 JSON 数据时收到错误
(Amazon 知识中心文章) -
hive-json-schema
(GitHub) — 用 Java 编写的生成工具 CREATE TABLE
来自示例 JSON 文档的语句。生成的CREATE TABLE
语句使用 OpenX JSON Serde。