训练深度图表网络 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

训练深度图表网络

在本概述中,您将了解如何使用 Amazon Elastic Container Registry (Amazon ECR) 中的 DGL 容器之一来开始使用深度图表网络。您还可以查看深度图表网络的实例的链接。

什么是深度图表网络?

深度图表网络是指一种经过训练的用于解决图表问题的神经网络。深度图表网络使用底层深度学习框架,如 PyTorch 或 MXNet。 深度图表库Amazon SageMaker (DGL) 的 教程中强调了图表网络在实际 AI 应用程序中的可能性。图表数据集上的训练模型示例包括社交网络、知识库、生物学和化学。


          DGL 生态系统。

图 1. DGL 生态系统

使用预先配置了 DGL 的 Amazon SageMaker 深度学习容器提供了几个示例。如果您有要与 DGL 结合使用的特殊模块,则也可以构建您自己的容器。这些示例涉及异质图表,即具有多种类型的节点和边缘的图表,并利用了跨不同科学领域的各种应用,如生物信息学和社交网络分析。DGL 提供了一系列广泛的针对不同类型的模型的图表神经网络实现。部分亮点包括:

  • 图表卷积网络 (GCN)

  • 关系图卷积网络 (R-GCN)

  • 图表关注网络 (GAT)

  • 图表的深度生成模型 (DGMG)

  • 联合树神经网络 (JTNN)

入门

DGL 作为 Amazon ECR 中的深度学习容器提供。在 Amazon SageMaker 笔记本中编写评估程序函数时,可以选择深度学习容器。您还可以按照自带容器指南,使用 DGL 构建您自己的自定义容器。开始使用深度图表网络的最简单方法是使用 Amazon ECR 中的 DGL 容器之一。 

注意

后端框架支持仅限于 PyTorch 和 MXNet。

Setup

如果您使用的是 Amazon SageMaker Studio,则需要先克隆示例存储库。如果您使用的是笔记本实例,则可以选择左侧工具栏底部的 SageMaker 图标来查找示例。

克隆 Amazon SageMaker 开发工具包和笔记本示例存储库

  1. 的 JupyterLabAmazon SageMaker 视图中,转到左侧工具栏顶部的 File Browser (文件浏览器)。从 File Browser panel (文件浏览器面板) 中,您可以在面板顶部看到一个新导航。

  2. 选择最右侧的图标来克隆 Git 存储库。

  3. 添加存储库 URL:https://github.com/awslabs/amazon-sagemaker-examples.git

  4. 浏览新添加的文件夹及其内容。DGL 示例存储在 sagemaker-python-sdk 文件夹中。

运行图表网络训练示例

训练深度图表网络

  1. 的 JupyterLabAmazon SageMaker 视图中,浏览示例笔记本并查找 DGL 文件夹。可以包含多个文件来支持示例。查看自述文件以了解任何先决条件。

  2. 运行 .ipynb 笔记本示例。 

  3. 查找评估程序函数,并记下它在其中将 Amazon ECR 容器用于 DGL 和特定实例类型的行。您可能需要更新此项以使用首选区域中的容器。

  4. 运行此函数启动实例并使用 DGL 容器来训练图表网络。启动此实例将会产生费用。在训练完成后,实例将自行终止。

Examples

提供了知识图表嵌入 (KGE) 的示例。 它使用 Freebase 数据集,该数据集是一般事实的知识库。一个示例使用案例是绘制人员关系图并预测人员的身份证。

图表卷积网络 (GCN) 的示例实施说明如何训练图表网络来预测毒性。生理学数据集 Tox21 提供了物质如何影响生物反应的毒性测量。 

另一个 GCN 示例说明如何在一个名为 Cora 的科学出版物书目数据集上训练图表网络。您可以使用它查找作者、主题和会议之间的关系。

最后一个示例是电影评论的推荐系统。它使用在 MovieLens 数据集上训练的图表卷积矩阵完成 (GCMC) 网络。这些数据集包含电影片名、类型和用户评分。

将深度学习容器与 DGL 结合使用

以下示例使用预配置的深度学习容器。这些是最容易尝试的,因为它们在 Amazon SageMaker 上是现成的。

使用 DGL 创建您自己的容器

以下示例允许您创建您自己的容器 (BYOC)。阅读 BYOC 指南,并在尝试它们前熟悉此过程。配置是必需的。