本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon Neptune ML 用于图表上的机器学习
大型连接数据集中通常存在宝贵的信息,仅仅基于人类直觉的查询可能很难提取这些信息。机器学习 (ML) 技术可以帮助查找与数十亿关系的图表中隐藏的相关性。这些相关性可能有助于推荐产品、预测信用价值、识别欺诈以及许多其他事情。
Neptune ML 功能可以在数小时而不是几周内在大图上构建和训练有用的机器学习模型。为了实现这一目标,Neptune ML 使用了图神经网络(GNN)技术Amazon SageMaker
在 Neptune ML 模型中,图形顶点被标识为 “节点”。例如,顶点分类使用节点分类机器学习模型,顶点回归使用节点回归模型。
Neptune ML 能做什么
Neptune ML 可以训练机器学习模型来支持五种不同类别的推理:
Neptune ML 目前支持的推理任务类型
-
节点分类— 预测顶点属性的分类特征。
例如,给定以下电影:肖申克救赎,Neptune ML 可以预测它
genre
属性为story
来自候选人集[story, crime, action, fantasy, drama, family, ...]
.有两种类型的节点分类任务:
单类别分类:在这种任务中,每个节点只有一个目标功能。例如,属性、
Place_of_birth
的Alan Turing
有价值UK
.多类别分类:在这种任务中,每个节点可以有多个目标功能。例如,属性
genre
电影教父有价值观crime
和story
.
-
节点回归— 预测顶点的数值属性。
例如,给定以下电影:复仇者联盟:终局,Neptune ML 可以预测它的属性
popularity
具有值5.0
. -
边缘分类— 预测边缘属性的分类特征。
有两种类型的边缘分类任务:
单类别分类:在这种任务中,每条边只有一个目标要素。例如,用户和电影之间的评分边缘可能有该属性,
liked
,值为 “是” 或 “否”。多类别分类:在这种任务中,每条边都可以有多个目标要素。例如,用户和电影之间的评级可能有多个属性标签值,例如 “搞笑”、“心暖”、“冷却” 等。
-
边缘回归— 预测边缘的数值属性。
例如,用户和电影之间的评级边缘可能具有数字属性,
score
,Neptune ML 可以预测给出用户和电影的价值。 -
链接预测— 预测特定源节点和传出边缘的最可能的目标节点,或者为给定目标节点和传入边缘预测最可能的源节点。
例如,使用药物疾病知识图表,给出
Aspirin
作为源节点,以及treats
作为传出边缘,Neptune ML 可以预测最相关的目标节点heart disease
、fever
,等等。或者,使用维基媒体知识图表,给定
President-of
作为边缘或关系United-States
作为目的地节点,Neptune ML 可以预测最相关的头像George Washington
、Abraham Lincoln
、Franklin D. Roosevelt
,等等。
节点分类和边缘分类仅支持字符串值。这意味着数字属性值,例如0
要么1
不支持,尽管字符串等效"0"
和"1"
是。同样,布尔值属性值true
和false
不起作用,但"true"
和"false"
执行该操作
使用 Neptune ML,你可以使用分为两个常规类别的机器学习模型:
Neptune ML 目前支持的机器学习模型的类型
图形神经网络 (GNN) 模型— 包括关系图卷积网络 (R-GCNS)
. GNN 模型适用于上述所有三种类型的任务。 知识图嵌入 (KGE) 模型— 包括
TransE
、DistMult
, 和RotatE
模型。它们只用于链接预测。
用户定义模型— Neptune ML 还允许您为上面列出的所有类型的任务提供自己的自定义模型实现。您可以使用Neptune ML 工具包