设置 Gremlin 控制台以连接到 Neptune 数据库实例 - Amazon Neptune
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

设置 Gremlin 控制台以连接到 Neptune 数据库实例

Gremlin 控制台允许您在 REPL(read-eval-print 循环)环境中尝试 TinkerPop 图形和查询。

安装 Gremlin 控制台并以常规方式连接到控制台

您可以使用 Gremlin 控制台连接到远程图形数据库。以下部分将引导您安装和配置 Gremlin 控制台以远程连接到 Neptune 数据库实例。必须从与您的 Neptune 数据库实例位于同一虚拟私有云 (VPC) 中的 Amazon EC2 实例中按照这些说明操作。

有关使用 SSL/TLS(这是必需的)连接到 Neptune 的帮助,请参阅SSL/TLS 配置

注意

如果您在 Neptune 数据库集群上启用了 IAM 身份验证,请按照使用 Gremlin 控制台和签名版本 4 签名连接到 Neptune中的说明安装 Gremlin 控制台,而不是按照此处的说明进行操作。

安装 Gremlin 控制台并连接到 Neptune
  1. Gremlin 控制台二进制文件需要 Java 8 或 Java 11。这些说明假设使用的是 Java 11。您可以按如下方式在 EC2 实例上安装 Java 11:

    • 如果您使用的是 Amazon Linux 2 (AL2)

      sudo amazon-linux-extras install java-openjdk11
    • 如果您使用的是 Amazon Linux 2023 (AL2023)

      sudo yum install java-11-amazon-corretto-devel
    • 对于其它发行版,请使用以下适当的发行版:

      sudo yum install java-11-openjdk-devel

      或者:

      sudo apt-get install openjdk-11-jdk
  2. 输入以下命令以在 EC2 实例上将 Java 11 设置为默认运行时系统。

    sudo /usr/sbin/alternatives --config java

    在系统提示时,输入 Java 11 的版本号。

  3. 从 Apache 网站下载相应版本的 Gremlin 控制台。您可以在引擎版本页面上查看当前正在运行的 Neptune 引擎版本,以确定它支持哪个 Gremlin 版本。例如,对于版本 3.6.5,您可以将 Gremlin 控制台Apache Tinkerpop3 网站下载到您的 EC2 实例上,如下所示:

    wget https://archive.apache.org/dist/tinkerpop/3.6.5/apache-tinkerpop-gremlin-console-3.6.5-bin.zip
  4. 解压缩 Gremlin 控制台 zip 文件。

    unzip apache-tinkerpop-gremlin-console-3.6.5-bin.zip
  5. 将目录更改为解压缩的目录。

    cd apache-tinkerpop-gremlin-console-3.6.5
  6. 在提取的目录的 conf 子目录中,创建名为 neptune-remote.yaml 的包含以下文本的文件。your-neptune-endpoint替换为您的 Neptune 数据库实例的主机名或 IP 地址。方括号 ([ ]) 是必需的。

    注意

    有关查找 Neptune 数据库实例的主机名的信息,请参阅连接到 Amazon Neptune 端点部分。

    hosts: [your-neptune-endpoint] port: 8182 connectionPool: { enableSsl: true } serializer: { className: org.apache.tinkerpop.gremlin.driver.ser.GraphBinaryMessageSerializerV1, config: { serializeResultToString: true }}
  7. 在终端中,导航到 Gremlin 控制台目录 (apache-tinkerpop-gremlin-console-3.6.5),然后输入以下命令来运行 Gremlin 控制台。

    bin/gremlin.sh

    您应看到以下输出:

    \,,,/ (o o) -----oOOo-(3)-oOOo----- plugin activated: tinkerpop.server plugin activated: tinkerpop.utilities plugin activated: tinkerpop.tinkergraph gremlin>

    您现在位于 gremlin> 提示符处。将在此提示符处输入剩余步骤。

  8. gremlin> 提示符处,输入以下命令以连接到 Neptune 数据库实例。

    :remote connect tinkerpop.server conf/neptune-remote.yaml
  9. gremlin> 提示符处,输入以下命令以切换到远程模式。这会将所有 Gremlin 查询发送到远程连接。

    :remote console
  10. 输入以下命令以将查询发送到 Gremlin 图形。

    g.V().limit(1)
  11. 完成后,输入以下命令以退出 Gremlin 控制台。

    :exit
注意

使用分号 (;) 或换行符 (\n) 分隔每个语句。

在最后遍历之前的每个遍历必须以要执行的 next() 结尾。仅返回最后遍历中的数据。

有关 Gremlin 的 Neptune 实现的更多信息,请参阅Amazon Neptune 中的 Gremlin 标准合规性

连接到 Gremlin 主机的备选方式

普通连接方法的缺点

连接到 Gremlin 控制台的最常见方法是上面解释的那种,在 gremlin> 提示符下使用如下命令:

gremlin> :remote connect tinkerpop.server conf/(file name).yaml gremlin> :remote console

这很好用,可以让您向 Neptune 发送查询。但是,它将 Groovy 脚本引擎排除在循环之外,因此 Neptune 将所有查询都视为纯粹的 Gremlin。这意味着以下查询格式会失败:

gremlin> 1 + 1 gremlin> x = g.V().count()

当以这种方式连接时,最接近使用变量的方法是使用控制台维护的 result 变量,并使用 :> 发送查询,如下所示:

gremlin> :remote console ==>All scripts will now be evaluated locally - type ':remote console' to return to remote mode for Gremlin Server - [krl-1-cluster.cluster-ro-cm9t6tfwbtsr.us-east-1.neptune.amazonaws.com/172.31.19.217:8182] gremlin> :> g.V().count() ==>4249 gremlin> println(result) [result{object=4249 class=java.lang.Long}] gremlin> println(result['object']) [4249]

 

另一种连接方式

您也可以用不同的方式连接到 Gremlin 控制台,您可能会觉得这样更好,比如这样:

gremlin> g = traversal().withRemote('conf/neptune.properties')

此处,neptune.properties 采用以下形式:

gremlin.remote.remoteConnectionClass=org.apache.tinkerpop.gremlin.driver.remote.DriverRemoteConnection gremlin.remote.driver.clusterFile=conf/my-cluster.yaml gremlin.remote.driver.sourceName=g

my-cluster.yaml 文件应如下所示:

hosts: [my-cluster-abcdefghijk.us-east-1.neptune.amazonaws.com] port: 8182 serializer: { className: org.apache.tinkerpop.gremlin.driver.ser.GraphBinaryMessageSerializerV1, config: { serializeResultToString: false } } connectionPool: { enableSsl: true }

通过这样配置 Gremlin 控制台连接,可以成功进行以下类型的查询:

gremlin> 1+1 ==>2 gremlin> x=g.V().count().next() ==>4249 gremlin> println("The answer was ${x}") The answer was 4249

您可以避免显示结果,如下所示:

gremlin> x=g.V().count().next();[] gremlin> println(x) 4249

所有常用的查询方式(不包括最终步骤)继续起作用。例如:

gremlin> g.V().count() ==>4249

您甚至可以使用 g.io().read() 步骤通过这种连接加载文件。