使用 Neptune Workbench 启用 CloudWatch 日志本地托管迁移到 JupyterLab 4 先决条件生命周期配置从快照同步创建笔记本后创建笔记本手动设置 Neptune 笔记本电脑

将 Amazon Neptune 与图形笔记本配合使用

要使用海王星图表，你可以使用海王星图形笔记本，也可以使用模板创建新的海王星数据库。 Amazon CloudFormation

无论您是图表新手并想学习和实验，还是经验丰富并想要完善查询，Neptune 工作台都提供了一个交互式开发环境 (IDE)，可以在构建图形应用程序时提高工作效率。Workbench 提供了一个用户友好的界面，用于与 Neptune 数据库进行交互、编写查询和可视化数据。

通过使用 Amazon CloudFormation 模板来设置 Neptune 数据库，使用工作台开发图形应用程序，您可以快速高效地开始使用 Neptune，而无需其他工具。这使您可以专注于构建应用程序，而不是设置底层基础架构。

注意

通过 Amazon A SageMaker I 管理的 Neptune 笔记本电脑目前不在亚太地区（马来西亚）（ap-southeast-5）地区上市。但是，您仍然可以通过其他非托管选项部署 Neptune 笔记本电脑。有关手动设置 Neptune 笔记本电脑手动部署笔记本的信息，请参阅。

Neptune 在开源 Neptune 图形 JupyterLab笔记本项目和 Neptune 工作台中提供 Jupyter GitHub 和笔记本。这些笔记本在交互式编码环境中提供示例应用程序教程和代码片段，您可以在此环境中学习图形技术和 Neptune。您可以使用它们在后端通过不同的查询语言、不同的数据集甚至不同的数据库来逐步设置、配置、填充和查询图形。

可以通过多种不同方式托管这些笔记本：

Nep tune 工作台允许您在托管在 Amazon A SageMaker I 中的完全托管的环境中运行 Jupyter 笔记本，并自动为您加载最新版本的 Neptune 图形笔记本项目。创建新的 Neptune 数据库时，可以轻松地在 Neptune 控制台中设置工作台。

注意
创建 Neptune 笔记本实例时，您可以选择两个网络访问选项：通过 Amazon A SageMaker I 直接访问（默认）和通过 VPC 进行访问。无论哪种选择，笔记本电脑都需要访问互联网才能获取安装Neptune工作台的软件包依赖关系。无法访问互联网将导致 Neptune 笔记本实例的创建失败。
您也可以在本地安装 Jupyter。这使您可以从便携式电脑上运行笔记本，而便携式电脑连接到 Neptune 或其中一个开源图形数据库的本地实例。在后一种情况下，您可以随心所欲地尝试图形技术，而不必花一分钱。然后，准备就绪后，您可以顺利迁移到 Neptune 提供的托管式生产环境。

使用 Neptune Workbench 托管 Neptune 笔记本

Neptune 提供的 T3 和 T4g 实例类型可供您入门，每小时不到 0.10 美元。工作台资源是通过 Amazon A SageMaker I 向你收取的，与 Neptune 账单分开收费。请参阅 Neptune 定价页面。Jupyter 和在 Neptune 工作台上创建的 JupyterLab 笔记本都使用 Amazon Linux 2 和 4 环境。 JupyterLab 有关 JupyterLab 笔记本支持的更多信息，请参阅 Amazon A SageMaker I 文档。

您可以通过以下两种方式使用 Neptune 工作台创建 Jupyter 或 JupyterLab 笔记本： Amazon Web Services Management Console

创建新的 Neptune 数据库集群时，使用笔记本配置菜单。为此，请按照使用启动 Neptune 数据库集群 Amazon Web Services Management Console中概述的步骤操作。
创建数据库集群后，使用左侧导航窗格中的笔记本菜单。为此，请执行以下步骤。

使用 “笔记本” 菜单创建 Jupyter 或 JupyterLab 笔记本

登录 Amazon 管理控制台，然后在家中打开 Amazon Neptune https://console.aws.amazon.com/neptune/ 主机。
在左侧的导航窗格中，选择 Notebooks (笔记本)。
选择创建笔记本。
选择 “数据库” 作为 Neptune 服务。
在集群列表中，选择您的 Neptune 数据库集群。如果您还没有数据库集群，请选择 Create cluster (创建集群) 以创建一个。
选择笔记本实例类型。
为您的笔记本提供一个名称以及可选的描述。
除非您已经为笔记本创建了 Amazon Identity and Access Management (IAM) 角色，否则请选择创建 IAM 角色并输入 IAM 角色名称。

注意
如果您选择重复使用为之前的笔记本创建的 IAM 角色，则该角色策略必须包含访问您正在使用的 Neptune 数据库集群的正确权限。您可以通过检查资源 ARN 中 neptune-db:* 操作下的组件是否与该集群匹配来验证这一点。当您尝试运行笔记本魔术命令时，权限配置不正确会导致连接错误。
选择创建笔记本。在一切准备就绪之前，创建过程可能需要 5 到 10 分钟。
创建笔记本后，将其选中，然后选择 “打开 Jupyter” 或 “打开”。 JupyterLab

控制台可以为您的笔记本创建 Amazon Identity and Access Management (IAM) 角色，您也可以自己创建一个角色。此角色的策略应包括以下内容：

请注意，上述策略中的第二条语句列出了一个或多个 Neptune 群集资源。 IDs

此外，角色应建立以下信任关系：

再说一遍，一切准备就绪可能需要 5 至 10 分钟。

您可以将新笔记本配置为与 Neptune ML 结合使用，如手动为 Neptune ML 配置 Neptune 笔记本中所述。

使用 Python 将通用 SageMaker AI 笔记本连接到 Neptune

如果你已经安装了海王星的魔法，那么将笔记本连接到海王星很容易，但是即使你没有使用海王星 SageMaker 笔记本电脑，也可以使用Python将人工智能笔记本连接到海王星。

在 SageMaker AI 笔记本单元中连接到 Neptune 需要采取的步骤

安装 Gremlin Python 客户端：
```
!pip install gremlinpython
```
Neptune 笔记本会为你安装 Gremlin Python 客户端，因此，只有当你使用的是普通的 A SageMaker I 笔记本时，才需要执行此步骤。

编写如下代码来连接和发出 Gremlin 查询：


from gremlin_python import statics
from gremlin_python.structure.graph import Graph
from gremlin_python.process.graph_traversal import __
from gremlin_python.process.strategies import *
from gremlin_python.driver.driver_remote_connection import DriverRemoteConnection
from gremlin_python.driver.aiohttp.transport import AiohttpTransport
from gremlin_python.process.traversal import *
import os

port = 8182
server = '(your server endpoint)'

endpoint = f'wss://{server}:{port}/gremlin'

graph=Graph()

connection = DriverRemoteConnection(endpoint,'g',
                 transport_factory=lambda:AiohttpTransport(call_from_event_loop=True))

g = graph.traversal().withRemote(connection)

results = (g.V().hasLabel('airport')
                .sample(10)
                .order()
                .by('code')
                .local(__.values('code','city').fold())
                .toList())

# Print the results in a tabular form with a row index
for i,c in enumerate(results,1):
    print("%3d %4s %s" % (i,c[0],c[1]))

connection.close()

注意

如果您碰巧使用的是早于 3.5.0 的 Gremlin Python 客户端，那么这行：


connection = DriverRemoteConnection(endpoint,'g',
                 transport_factory=lambda:AiohttpTransport(call_from_event_loop=True))

只会是：


connection = DriverRemoteConnection(endpoint,'g')

在 Neptune 笔记本电脑上启用 CloudWatch 日志

CloudWatch Neptune 笔记本现在默认启用日志。如果您的旧笔记本无法生成 CloudWatch 日志，请按照以下步骤手动启用日志：

登录 Amazon Web Services Management Console 并打开 SageMaker AI 控制台。
在左侧的导航窗格上，选择笔记本，然后选择笔记本实例。查找要为其启用日志的 Neptune 笔记本的名称。
选择该笔记本实例的名称，进入详细信息页面。
如果笔记本实例正在运行，请选择笔记本详细信息页面右上角的停止按钮。
在权限和加密下，有一个对应于 IAM 角色 ARN 的字段。选择此字段中的链接可转到运行此笔记本实例的 IAM 角色。

创建以下策略：

保存此新策略并将其附加到在步骤 4 中找到的 IAM 角色。
单击 SageMaker AI 笔记本实例详细信息页面右上角的 “启动”。
日志开始流动后，您应该会在详细信息页面笔记本实例设置部分的左下角附近标有生命周期配置的字段下方看到查看日志链接。

如果笔记本无法启动， SageMaker AI 控制台的笔记本详细信息页面将显示一条消息，说明笔记本实例花了 5 分钟才启动。 CloudWatch 可以在以下名称下找到与此问题相关的日志：


(your-notebook-name)/LifecycleConfigOnStart

在本地计算机上设置图形笔记本

图形笔记本项目包含有关在本地计算机上设置 Neptune 笔记本的说明：

您可以将本地笔记本连接到 Neptune 数据库集群，也可以连接到开源图形数据库的本地或远程实例。

将 Neptune 笔记本与 Neptune 集群结合使用

如果您在后端连接到 Neptune 集群，则可能需要在 Ama SageMaker zon AI 中运行笔记本电脑。从 SageMaker 人工智能连接到 Neptune 比从本地安装笔记本电脑更方便，而且它可以让你更轻松地使用 Neptune ML。

有关如何在 SageMaker AI 中设置笔记本的说明，请参阅使用 A mazon 启动图形笔记本。 SageMaker

有关如何设置和配置 Neptune 本身的说明，请参阅设置亚马逊 Neptune。

您也可以将本地安装的 Neptune 笔记本连接到 Neptune 数据库集群。这可能稍微复杂一些，因为 Amazon Neptune 数据库集群只能在设计上与外界隔离的 Amazon Virtual Private Cloud (VPC) 中创建。有多种方法可以从 VPC 外部连接到 VPC。一种是使用负载均衡器。另一种方法是使用 VPC 对等连接（请参阅 Amazon Virtual Private Cloud 对等连接指南）。

但是，对于大多数人来说，最便捷的方法是连接在 VPC 中设置 Amazon EC2 代理服务器，然后使用 SSH 隧道（也称为端口转发）与之连接。你可以在图形 GitHub 笔记本项目的additional-databases/neptune文件夹中将绘图笔记本本地连接到 Amazon Neptune 中找到有关如何设置的说明。

使用带有开源图形数据库的 Neptune 笔记本

要免费开始使用图形技术，还可以在后端使用带有各种开源数据库的 Neptune 笔记本。例如 TinkerPop Gremlin 服务器和 Blaz egraph 数据库。

要使用 Gremlin 服务器作为后端数据库，请执行以下步骤：

将图形笔记本连接到 Gremlin 服务器文件夹。 GitHub
图形笔记本 Grem lin 配置文件夹。 GitHub

要使用 Blazegraph 的本地实例作为后端数据库，请执行以下步骤：

查看 Blazegraph 快速入门说明，了解运行 Blazegraph 实例所需的基本设置和配置。
访问 graph-notebook Blazegraph 配置文件 GitHub 夹，其中包含设置本地 Blazegraph 实例所需的文件和说明。
在 GitHub 存储库中，导航到 “blazegraph” 目录，然后按照提供的说明设置本地 Blazegraph 实例。这包括下载 Blazegraph 软件、配置必要文件和启动 Blazegraph 服务器的步骤。

运行本地 Blazegraph 实例后，即可将其与应用程序集成，作为基于图形的数据和查询的后端数据库。请参阅 graph-notebook 存储库中提供的文档和示例代码，了解如何将您的应用程序连接到 Blazegraph 实例。

将 Neptune 笔记本电脑迁移到 4.x JupyterLab

本节概述了将 Neptune 笔记本电脑迁移到 JupyterLab 4.x 及更高版本的 Amazon Linux 环境的各种方法。有关 JupyterLab 版本控制的详细信息，请参阅 Amazon A SageMaker I JupyterLab 版本控制。

迁移方法

全新安装

如果您不需要保留现有的工作空间文件或配置，则可以：

创建一个运行 JupyterLab 4.x 的新笔记本实例（notebook-al2-v3）
验证新设置是否按预期运行
停止并删除您的旧笔记本实例

文件传输迁移

此方法使用您的本地系统或 Amazon S3 作为中间存储。

最适合

通过 Amazon A SageMaker I 联网配置直接访问互联网。
需要迁移的数据量适中
要保留的特定文件而不是整个工作区配置。

方法 1：使用 JupyterLab 用户界面

最适合

文件数量少
选择性文件迁移
更喜欢简单的 drag-and-drop操作

步数

从源 JupyterLab 实例下载文件：
- 在中导航并选择要迁移到新实例的文件 JupyterLab
- 右键单击并选择 “下载”
上传到新 JupyterLab 实例：
- 使用中的上传按钮 JupyterLab ，选择要复制到新实例的所有文件
- （或者）直接拖放文件

方法 2：使用亚马逊 S3

最适合

大量文件
保留您的文件夹结构
批量迁移

先决条件

确保与笔记本关联的角色具有上传和访问 Amazon S3 存储桶的相应权限：


{
"Effect": "Allow",
"Action": ["s3:PutObject", "s3:GetObject", "s3:ListBucket"],
"Resource": ["arn:aws:s3:::your-bucket-name/*", "arn:aws:s3:::your-bucket-name"]
}

注意

Amazon CLI 应预先安装在 SageMaker AI 笔记本电脑上。

步数

在带!前缀的笔记本单元格中打开终端 JupyterLab 或键入终端命令。

使用 Amazon S3 cp 或 Amazon S3 同步 CLI 命令将文件从旧 JupyterLab 实例复制到 S3：


# using Amazon s3 cp
aws s3 cp /home/ec2-user/SageMaker/your-folder s3://your-bucket/backup/ --recursive

# (OR) using Amazon s3 sync
aws s3 sync /home/ec2-user/SageMaker/your-folder s3://your-bucket/backup/

将文件从 S3 复制到您的新 JupyterLab 实例：


# using Amazon s3 cp
aws s3 cp s3://your-bucket/backup/ /home/ec2-user/SageMaker/your-folder --recursive

# (OR) using Amazon s3 sync
aws s3 sync s3://your-bucket/backup/ /home/ec2-user/SageMaker/your-folder

注意

sync用于维护文件夹结构和增量更新以及一次cp性传输。

亚马逊 EFS 迁移

最适合

仅限 VPC 的网络配置
大数据量

步数

关注将 EFS 文件系统挂载到 Amazon SageMaker AI 笔记本博客，在笔记本实例中使用 Amazon EFS 文件系统。

此外，还有一些步骤专门适用于将 Neptune 笔记本迁移到新环境：

在控制台中创建 Neptune 笔记本期间，在 “生命周期配置” 下选择 “创建新的生命周期配置”
在模板生命周期配置中，在 install.sh 脚本之后附加您的 Amazon EFS 挂载命令 (sudo mount -t nfs ...)

这样可以确保您的笔记本实例每次启动或重启时都会自动挂载您的 Amazon EFS 文件系统。要解决挂载问题，请参阅 Amazon EFS 疑难解答文档。

优点

跨实例无缝访问文件
无需中间传输即可直接访问文件
高效处理大型数据集

亚马逊 EBS 卷迁移

最适合需要保存的场合

完整的工作空间配置
隐藏的文件
系统设置
保留完整的工作空间配置、隐藏文件和系统设置

按照适用于 Amazon EBS 卷的 A Amazon SageMaker I 迁移指南，从与笔记本实例关联的 Amazon EBS 卷中传输文件。

此外，还有一些步骤专门适用于将 Neptune 笔记本电脑迁移到新环境。

Neptune 特定的先决条件

在源 Neptune 笔记本的 IAM 角色中，添加以下所有权限：


{
  "Effect": "Allow",
  "Action": [
    "s3:GetObject",
    "s3:ListBucket",
    "s3:CreateBucket",
    "s3:PutObject"
  ],
  "Resource": [
    "arn:aws:s3:::(your ebs backup bucket name)",
    "arn:aws:s3:::(your ebs backup bucket name)/*"
  ]
},
{
  "Effect": "Allow",
  "Action": [
    "sagemaker:ListTags"
  ],
  "Resource": [
    "*"
  ]
}

请务必为要用于备份的 S3 桶指定正确的 ARN。

特定于 Neptune 的生命周期配置

按博客文章中所述创建第二个生命周期配置脚本以恢复备份（从 on-create.sh）时，生命周期名称必须遵循 aws-neptune-* 格式，例如 aws-neptune-sync-from-s3。这样可以确保在 Neptune 控制台中创建笔记本时可以选择 LCC。

从快照到新实例的 Neptune 特定同步

在博客文章中描述的从快照同步到新实例的步骤中，以下是特定于 Neptune 的更改：

在步骤 4 中，选择 notebook-al2-v3。
在步骤 5 中，重用源 Neptune 笔记本中的 IAM 角色。
在步骤 7 和 8 之间：
- 在笔记本实例设置中，设置使用 aws-neptune-* 格式的名称。
- 打开网络设置手风琴式折叠组件，选择与源笔记本中相同的 VPC、子网和安全组。

创建新笔记本后 Neptune 特定的步骤

选择笔记本的打开 Jupyter 按钮。一旦 SYNC_COMPLETE 文件出现在主目录中，请继续执行下一步。
前往 A SageMaker I 控制台中的笔记本实例页面。
停止运行 Notebook。
选择编辑。
在笔记本实例设置中，通过选择源 Neptune 笔记本的原始生命周期来编辑生命周期配置字段。请注意，这不是 EBS 备份生命周期。
选择更新笔记本设置。
再次启动笔记本。

通过对博客文章中概述的步骤进行此处描述的修改，您的图形笔记本现在应该迁移到使用 Amazon Linux 2 和 JupyterLab 4 环境的新 Neptune 笔记本实例上。它们将显示在的 Neptune 页面上以供访问和管理，现在 Amazon Web Services Management Console，你可以选择 “打开 Jupyter” 或 “打开”，从上次停下来的地方继续工作。 JupyterLab

在亚马 SageMaker 逊 AI 实例中创建 Neptune 笔记本

打开 Amazon A SageMaker I 控制台，网址为https://console.aws.amazon.com/sagemaker/。
在导航窗格中，展开 “笔记本”，然后选择 “笔记本实例”。
选择创建笔记本实例。
在笔记本实例设置中，在笔记本实例名称下，为笔记本指定一个前缀为aws-neptune-（例如aws-neptune-my-test-notebook）的名称。
在平台标识符下，选择亚马逊 Linux 2、 JupyterLab 4。
选择 “其他配置”。
在生命周期配置下，选择创建新的生命周期配置。
在配置中，在名称下输入步骤 4 中的笔记本实例名称。

在 “脚本” 中的 “启动笔记本” 下，将现有脚本替换为：


#!/bin/bash

sudo -u ec2-user -i <<'EOF'

echo "export GRAPH_NOTEBOOK_AUTH_MODE=IAM" >> ~/.bashrc
echo "export GRAPH_NOTEBOOK_SSL=True" >> ~/.bashrc
echo "export GRAPH_NOTEBOOK_SERVICE=neptune-db for Neptune, or neptune-graph for Neptune Analytics" >> ~/.bashrc
echo "export GRAPH_NOTEBOOK_HOST=(Neptune Analytics graph endpoint, public or private)" >> ~/.bashrc
echo "export GRAPH_NOTEBOOK_PORT=8182" >> ~/.bashrc
echo "export NEPTUNE_LOAD_FROM_S3_ROLE_ARN=" >> ~/.bashrc
echo "export AWS_REGION=(Amazon region)" >> ~/.bashrc

aws s3 cp s3://aws-neptune-notebook-(AWS region)/graph_notebook.tar.gz /tmp/graph_notebook.tar.gz
rm -rf /tmp/graph_notebook
tar -zxvf /tmp/graph_notebook.tar.gz -C /tmp
/tmp/graph_notebook/install_jl4x.sh

EOF

选择 Create configuration (创建配置)。
在 “权限和加密” 中的 IAM 角色下，选择您在上面创建的角色。
在 Network 中，如果您使用的是私有图端点：
1. 在 VPC 下，选择 Neptune Analytics 图表所在的 VPC。
2. 在 “子网” 下，选择与 Neptune Analytics 图表关联的子网。
3. 在 “安全组” 下，选择与 Neptune Analytics 图表关联的所有安全组。
选择创建笔记本实例。
5 或 10 分钟后，当您的新笔记本进入Ready状态时，将其选中。选择 “打开 Jupyter” 或 “打开”。 JupyterLab

手动设置 Neptune 笔记本电脑

您还可以使用适用于图形笔记本和图形资源管理器的 Amazon 开源包来设置 Neptune 笔记本环境。虽然使用开源软件包设置笔记本有多种方法，但推荐的方法是：

在本地计算机上设置 graph-notebook，并设置 Amazon EC2 SSH 隧道，将您的本地计算机连接到与 Amazon 实例位于相同 VPC 上的 Neptune 集群。 EC2
在您的 VPC 内的 Amazon EC2 实例上设置图形浏览器。

有关设置开源 graph-notebook 和 graph- explorer 包的详细说明，请参阅以下官方 Amazon 文档和存储库： GitHub

安全配置

在设置环境时，请确保相应地设置了以下安全配置：

Neptune 集群安全组-允许通过端口 8182 从您的亚马逊 EC2 实例的安全组传入 TCP 流量。
Amazon EC2 实例安全组-配置入站 HTTPS 规则以启用 Graph Explorer 访问权限。

我们建议您的 Neptune 集群和 Ama EC2 zon 实例使用单个安全组。这简化了配置并减少了潜在的连接问题。但是，请记得添加自引用规则，以允许组内资源之间进行通信。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

Neptune 入门

Neptune 图形笔记本魔法