训练深度图表网络 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

训练深度图表网络

在本概述中,您将了解如何使用 Amazon Elastic Container Registry (Amazon ECR) 中的 DGL 容器之一来开始使用深度图表网络。您还可以查看深度图表网络的实例的链接。

什么是深度图表网络?

深度图表网络是指一种经过训练的用于解决图表问题的神经网络。深度图表网络使用底层深度学习框架,如 PyTorch 或 MXNet。在面向 Deep Graph Library (DGL) 的 Amazon SageMaker 教程中,重点介绍了 Graph Networks 在实际 AI 应用中的潜力。图表数据集上的训练模型示例包括社交网络、知识库、生物学和化学。


          The DGL ecosystem.

图 1. DGL 生态系统

使用预先配置了 DGL 的 Amazon SageMaker 深度学习容器提供了几个示例。如果您有要与 DGL 结合使用的特殊模块,则也可以构建您自己的容器。这些示例涉及异质图表,即具有多种类型的节点和边缘的图表,并利用了跨不同科学领域的各种应用,如生物信息学和社交网络分析。DGL 提供了一系列广泛的针对不同类型的模型的图表神经网络实现。部分亮点包括:

  • 图卷积网络 (GCN)

  • 关系图卷积网络 (R-GCN)

  • 图注意力网络 (GAT)

  • 图深度生成式模型 (DGMG)

  • 连接树神经网络 (JTNN)

开始使用

DGL 可在 Amazon ECR 中用作深度学习容器。在 Amazon SageMaker 笔记本中编写评估程序函数时,可以选择深度学习容器。您也可以按照自带容器指南中的说明,使用 DGL 制作自己的自定义容器。开始使用深度图网络的最简单方法是使用 Amazon ECR 中的 DGL 容器之一。 

注意

后端框架支持仅限于 PyTorch 和 MXNet。

设置

如果您使用的是 Amazon SageMaker Studio,则需要先克隆示例存储库。如果您使用的是笔记本实例,则可以通过选择左侧工具栏底部的 SageMaker 图标来查找示例。

克隆 Amazon SageMaker 开发工具包和笔记本示例存储库
  1. 从 Amazon SageMaker 中的 JupyterLab 视图中,转到左侧工具栏顶部的文件浏览器。从文件浏览器面板中,您会在面板顶部看到新的导航。

  2. 选择最右侧的图标来克隆 Git 存储库。

  3. 添加存储库 URL:https://github.com/awslabs/amazon-sagemaker-examples.git

  4. 浏览新添加的文件夹及其内容。DGL 示例存储在 sagemaker-python-sdk 文件夹中。

运行图表网络训练示例

训练深度图表网络
  1. 从 Amazon SageMaker 中的 JupyterLab 视图,浏览示例笔记本并查找 DGL 文件夹。可以包含多个文件来支持示例。查看自述文件以了解任何先决条件。

  2. 运行 .ipynb 笔记本示例。 

  3. 查找评估程序函数,并记下它在 DGL 和特定实例类型中使用 Amazon ECR 容器的行。您可能需要更新此项以使用首选区域中的容器。

  4. 运行此函数启动实例并使用 DGL 容器来训练图表网络。启动此实例将会产生费用。在训练完成后,实例将自行终止。

示例

提供了知识图表嵌入 (KGE) 的示例。它使用 Freebase 数据集,这是一般事实的知识库。一个示例使用案例是绘制人员关系图并预测人员的国籍。 

图表卷积网络 (GCN) 的示例实施说明如何训练图表网络来预测毒性。生理学数据集 Tox21 提供了物质如何影响生物反应的毒性测量。 

另一个 GCN 示例说明如何在一个名为 Cora 的科学出版物书目数据集上训练图表网络。您可以使用它查找作者、主题和会议之间的关系。

最后一个示例是电影评论的推荐系统。它使用在 MovieLens 数据集上训练的图表卷积矩阵完成 (GCMC) 网络。这些数据集包含电影片名、类型和用户评分。

将深度学习容器与 DGL 结合使用

以下示例使用预配置的深度学习容器。这些是最容易的试用方法,因为它们可以在 Amazon SageMaker 上直接使用。

使用 DGL 创建您自己的容器

以下示例允许您创建您自己的容器 (BYOC)。阅读 BYOC 指南,并在尝试它们前熟悉此过程。配置是必需的。