Amazon Neptune ML 用于图表上的机器学习 - Amazon Neptune
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Neptune ML 用于图表上的机器学习

大型连接数据集中通常存在宝贵的信息,仅仅基于人类直觉的查询可能很难提取这些信息。机器学习 (ML) 技术可以帮助查找与数十亿关系的图表中隐藏的相关性。这些相关性可能有助于推荐产品、预测信用价值、识别欺诈行为以及许多其他事情。

Neptune ML 功能可以在数小时而不是几周内在大图上构建和训练有用的机器学习模型。为了实现这一目标,Neptune ML 使用了图神经网络(GNN)技术Amazon SageMaker深图库 (DGL)(这是开源)。图形神经网络是人工智能的一个新兴领域(例如,请参阅关于图形神经网络的综合调查)。有关将 GNN 与 DGL 结合使用的实践教程,请参阅使用深度图库学习图形神经网络.

注意

在 Neptune ML 模型中,图形顶点被标识为 “节点”。例如,顶点分类使用节点分类机器学习模型,顶点回归使用节点回归模型。

Neptune ML 能做什么

Neptune ML 可以训练机器学习模型来支持五种不同类别的推理:

Neptune ML 目前支持的推理任务类型

  • 节点分类— 预测顶点属性的分类特征。

    例如,给定了电影肖申克救赎,Neptune ML 可以预测genre属性为story来自候选人集[story, crime, action, fantasy, drama, family, ...].

    有两种类型的节点分类任务:

    • 单类别分类:在这种任务中,每个节点只有一个目标功能。例如,属性Place_of_birthAlan Turing有价值UK.

    • 多类别分类:在这种任务中,每个节点可以有多个目标功能。例如,属性genre的影片教父有价值crimestory.

  • 节点回归— 预测顶点的数值属性。

    例如,给定了电影复仇者联盟:终局,Neptune ML 可以预测它的属性popularity具有价值5.0.

  • 边缘分类— 预测边缘属性的分类特征。

    有两种类型的边缘分类任务:

    • 单类别分类:在这种任务中,每条边只有一个目标要素。例如,用户和电影之间的评分边缘可能有该属性,liked,值为 “是” 或 “否”。

    • 多类别分类:在这种任务中,每条边都可以有多个目标要素。例如,用户和电影之间的评级可能有多个属性标签值,例如 “搞笑”、“心暖”、“冷却” 等。

  • 边缘回归— 预测边缘的数值属性。

    例如,用户和电影之间的评级边缘可能具有数字属性,score,Neptune ML 可以为此预测给定用户和电影的价值。

  • 链接预测— 预测特定源节点和传出边缘的最可能的目标节点,或者为给定目标节点和传入边缘预测最可能的源节点。

    例如,用药物疾病知识图表,给出Aspirin作为源节点,以及treats作为传出边缘,Neptune ML 可以预测最相关的目标节点heart diseasefever等等。

    或者,使用维基媒体知识图表,给定President-of作为边缘或关系United-States作为目的地节点,Neptune ML 可以预测最相关的头像George WashingtonAbraham LincolnFranklin D. Roosevelt等等。

使用 Neptune ML,你可以使用分为两个常规类别的机器学习模型:

Neptune ML 目前支持的机器学习模型的类型

  • 图形神经网络 (GNN) 模型— 包括关系图卷积网络 (R-GCNS). GNN 模型适用于上述所有三种类型的任务。

  • 知识图嵌入 (KGE) 模型— 包括TransEDistMult, 和RotatE模型。它们只适用于链接预测。

用户定义的模型— Neptune ML 还允许您为上面列出的所有类型的任务提供自己的自定义模型实现。您可以使用Neptune ML 工具包在模型中使用 Neptune ML 训练 API 之前,开发和测试基于 python 的自定义模型实现。请参阅Neptune ML 中的自定义模型了解有关如何构建和组织实施以便与 Neptune ML 的培训基础设施兼容的详细信息。