使用neptune-export用于从 Neptune 导出数据的命令行工具 - Amazon Neptune
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用neptune-export用于从 Neptune 导出数据的命令行工具

您可以使用以下步骤将数据从 Neptune 数据库集群导出到 Amazon S3neptune-export命令行实用程序:

使用的先决条件neptune-export命令行实用程序

在您开始之前

  • 拥有 JDK 的版本 8— 你需要的版本 8Java SE 开发工具包 (JDK)安装。

  • 下载海王星导出实用程序— 下载并安装neptune-export.jar文件。

  • 确保neptune-export有权访问你的 Neptune VPC— 从可以访问 Neptune 数据库集群所在的 VPC 的位置运行 neptune-export。

    例如,您可以在 Neptune VPC 内的 Amazon EC2 实例上运行它,也可以在与 Neptune VPC 对等的单独 VPC 中运行,也可以在单独的堡垒主机上运行它。

  • 确保 VPC 安全组授予访问权限neptune-export— 检查附加到 Neptune VPC 的 VPC 安全组是否允许从与neptune-export环境。

  • 设置必要的 IAM 权限— 如果你的数据库有Amazon Identity and Access Management(IAM) 数据库身份验证已启用,请确保neptune-export运行与允许连接到 Neptune 的 IAM 策略相关联。有关 Neptune 策略的信息,请参阅IAM 策略.

    如果要使用clusterId查询请求中的导出参数,该角色neptune-export运行需要以下 IAM 权限:

    • rds:DescribeDBClusters

    • rds:DescribeDBInstances

    • rds:ListTagsForResource

    如果要从克隆的群集中导出,那么该角色neptune-export运行需要以下 IAM 权限:

    • rds:AddTagsToResource

    • rds:DescribeDBClusters

    • rds:DescribeDBInstances

    • rds:ListTagsForResource

    • rds:DescribeDBClusterParameters

    • rds:DescribeDBParameters

    • rds:ModifyDBParameterGroup

    • rds:ModifyDBClusterParameterGroup

    • rds:RestoreDBClusterToPointInTime

    • rds:DeleteDBInstance

    • rds:DeleteDBClusterParameterGroup

    • rds:DeleteDBParameterGroup

    • rds:DeleteDBCluster

    • rds:CreateDBInstance

    • rds:CreateDBClusterParameterGroup

    • rds:CreateDBParameterGroup

    要将导出的数据发布到 Amazon S3,其中的角色neptune-export运行需要 Amazon S3 位置的以下 IAM 权限:

    • s3:PutObject

    • s3:PutObjectTagging

    • s3:GetObject

  • 设置SERVICE_REGION环境变量— 设置SERVICE_REGION用于标识数据库集群所在的区域的环境变量(请参阅连接到 Neptune获取区域标识符列表)。

运行neptune-export用于启动导出操作的实用程序

使用以下命令从命令行运行 neptune-export 并启动导出操作:

java -jar neptune-export.jar nesvc \ —root-path (path to a local directory) \ —json (the JSON file that defines the export)

命令有两个参数:

开始导出时的 neptune-export 参数

  • --root-path— 在发布到 Amazon S3 之前,导出文件在其中写入导出文件的本地目录的路径。

  • --json— 用于定义导出的 JSON 对象。

使用neptune-export命令行实用程序

要直接从源数据库集群导出属性图数据,请执行以下操作:

java -jar neptune-export.jar nesvc \ --root-path /home/ec2-user/neptune-export \ --json '{ "command": "export-pg", "outputS3Path" : "s3://(your Amazon S3 bucket)/neptune-export", "params": { "endpoint" : "(your neptune DB cluster endpoint)" } }'

要直接从源数据库集群中导出 RDF 数据:

java -jar neptune-export.jar nesvc \ --root-path /home/ec2-user/neptune-export \ --json '{ "command": "export-rdf", "outputS3Path" : "s3://(your Amazon S3 bucket)/neptune-export", "params": { "endpoint" : "(your neptune DB cluster endpoint)" } }'

如果你省略command请求参数,neptune-export默认情况下,实用程序 reiwa 用于从 Neptune 导出属性图数据。

要从数据库集群的克隆中导出:

java -jar neptune-export.jar nesvc \ --root-path /home/ec2-user/neptune-export \ --json '{ "command": "export-pg", "outputS3Path" : "s3://(your Amazon S3 bucket)/neptune-export", "params": { "endpoint" : "(your neptune DB cluster endpoint)", "cloneCluster" : true } }'

要使用 IAM 身份验证从数据库集群导出:

java -jar neptune-export.jar nesvc \ --root-path /home/ec2-user/neptune-export \ --json '{ "command": "export-pg", "outputS3Path" : "s3://(your Amazon S3 bucket)/neptune-export", "params": { "endpoint" : "(your neptune DB cluster endpoint)" "useIamAuth" : true } }'