加载数据格式 - Amazon Neptune
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

加载数据格式

Amazon Neptune Load API 支持加载各种格式的数据。

属性图加载格式

然后,可以同时使用 Gremlin 和 openCypher 查询按以下属性图格式之一加载的数据:

RDF 加载格式

要加载使用 SPARQL 查询的资源描述框架 (RDF) 数据,可以按照万维网联盟 (W3C) 的规定使用以下标准格式之一:

加载数据必须使用 UTF-8 编码

重要

所有加载数据文件必须采用 UTF-8 格式编码。如果文件不是 UTF-8 编码的,Neptune 无论如何都会尝试将其加载为 UTF-8。

对于包含 Unicode 字符的 N-Quads 和 N-triples 数据,支持 \uxxxxx 转义序列。但是,Neptune 不支持标准化。如果存在需要归一化的值,则 byte-to-byte 在查询期间该值将不匹配。有关标准化的更多信息,请参阅 Unicode.org 上的标准化页面。

如果数据的格式不受支持,则必须先转换数据,然后加载它。

Graphml2CSV 项目中提供了将 GraphML 转换为 Neptune CSV 格式的工具。GitHub

对加载数据文件的压缩支持

Neptune 支持以 gzipbzip2 格式压缩各个文件。

压缩文件必须具有 .gz.bz2 扩展名,并且必须是以 UTF-8 格式编码的单个文本文件。可以加载多个文件,但每个文件必须是单独的 .gz.bz2 或未压缩的文本文件。不支持扩展名如 .tar.tar.gz.tgz 的归档文件。

以下各节对格式进行了详述。