导出训练数据时要在 params 对象中设置的字段 - Amazon Neptune
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

导出训练数据时要在 params 对象中设置的字段

params 文档中所述,导出请求中的 params 对象可以包含各种字段。以下字段与导出机器学习训练数据最为相关:

  • endpoint – 使用 endpoint 指定数据库集群中 Neptune 实例的端点,导出过程可以查询该端点以提取数据。

  • profileparams 对象中的 profile 字段必须设置为 neptune-ml

    这导致导出过程针对 Neptune ML 模型训练适当地格式化导出的数据,针对属性图数据格式化为 CSV 格式,或针对 RDF 数据格式化为 N-Triples。它还会创建 training-data-configuration.json 文件,并将其写入与导出的训练数据相同的 Amazon S3 位置。

  • cloneCluster – 如果设置为 true,则导出过程将克隆您的数据库集群,从克隆中导出,然后在导出完成后将克隆删除。

  • useIamAuth – 如果您的数据库集群启用了 IAM 身份验证,则必须包含此字段(设置为 true)。

导出过程还提供了多种筛选您导出的数据的方法(请参阅这些示例)。