本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
用于控制 Neptune 导出过程的参数
无论您是在使用海王星出口服务还是neptune-export
命令行实用程序,用于控制导出的参数大致相同。它们包含传递给 Neptune-Export 终端节点或传递到的 JSON 对象neptune-export
在命令行上。
传递给导出过程的对象最多有五个顶级字段:
-d '{ "command" : "
(either
", "outputS3Path" : "s3:/export-pg
orexport-rdf
)(your Amazon S3 bucket)
/(path to the folder for exported data)
", "jobsize" : "(for Neptune-Export service only)
", "params" : {(a JSON object that contains export-process parameters)
}, "additionalParams": {(a JSON object that contains parameters for training configuration)
} }'
目录
这些区域有:command
参数
这些区域有:command
顶级参数确定是导出属性图数据还是导出 RDF 数据。如果你省略command
参数,导出过程默认为导出属性图数据。
export-pg
— 导出属性图表数据。export-rdf
— 导出 RDF 数据。
这些区域有:outputS3Path
参数
这些区域有:outputS3Path
顶级参数是必需的,且必须包含可将导出文件发布到的 Amazon S3 位置的 URI:
"outputS3Path" : "s3://
(your Amazon S3 bucket)
/(path to output folder)
"
该值必须以s3://
,后跟有效的存储桶名称和存储桶中的文件夹路径(可选)。
这些区域有:jobSize
参数
这些区域有:jobSize
顶级参数仅与海王星出口服务一起使用,而不是与neptune-export
命令行实用程序,是可选的。它允许您描述正在启动的导出作业的规模,这有助于确定专门用于该作业的计算资源量及其最大并发级别。
"jobsize" : "
(one of four size descriptors)
"
四个有效的尺寸描述符是:
small
最大并发数量:8. 适用于最大 10 GB 的存储卷。medium
最大并发数量:32. 适用于高达 100 GB 的存储卷。large
最大并发数量:64。适用于超过 100 GB 但小于 1 TB 的存储卷。xlarge
最大并发数量:96。适用于超过 1 TB 的存储卷。
默认情况下,在 Neptune-Export 服务上启动的导出作为small
任务。
出口的表现不仅取决于jobSize
设置,而且还取决于要从中导出的数据库实例的数量、每个实例的大小以及作业的有效并发级别。
对于属性图导出,您可以使用clone ClusterReplicaCount参数,并且可以使用concurrency参数。
这些区域有:params
宾语
这些区域有:params
顶级参数是一个 JSON 对象,其中包含用于控制导出过程本身的参数,如中所述导出中的参数字段params顶级 JSON 对象. 中的一些字段params
对象特定于属性图导出,有些是 RDF。
这些区域有:additionalParams
宾语
这些区域有:additionalParams
顶级参数是一个 JSON 对象,其中包含可用于控制导出数据后应用于数据的操作的参数。目前,additionalParams
仅用于导出训练数据Neptune ML.