本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
步骤 3:运行 Amazon Glue 任务将 Amazon Keyspaces 表从中导出到 Amazon S3 存储桶 Amazon CLI
在本步骤中,您将使用运行在上一步中创建的 Amazon Glue 任务, Amazon CLI 将 Amazon Keyspaces 表导出到 Amazon S3 中的存储桶。
从中运行导出作业 Amazon CLI
-
在以下示例中,该 Amazon CLI 命令运行在上一步中创建的作业。
aws glue start-job-run --job-name
AmazonKeyspacesExportToS3-cfn-setup-cfn-glue
-
您可以覆盖任何 Amazon Glue 作业参数,包括 Amazon CLI 命令中的默认参数。要覆盖作业的任何默认参数,例如 keyspace 或表名,可以将它们作为参数传递。有关参数的完整列表,请参阅《 Amazon Glue 命令行参考》start-job-run中的。
以下命令运行 Amazon Glue 导出作业,但会覆盖 Amazon Glue 工作人员数量、工作器类型和表名。
aws glue start-job-run --job-name AmazonKeyspacesExportToS3-cfn-setup-cfn-glue \ --number-of-workers 8 --worker-type G.2X \ --arguments '{"--TABLE_NAME":"
my_table
"}'
-
确认您的表已导出到您的 Amazon S3 存储桶。根据表格的大小,这可能需要一些时间。导出任务完成后,您可以使用示例命令在存储桶中看到以下文件夹。
aws s3 ls s3://s3-keyspaces
输出显示您的存储桶中的以下结构。
PRE conf/ PRE export/ PRE jars/ PRE scripts/ PRE spark-logs/
您的文件将位于以下文件夹结构下
export
,数据/时间值将显示您自己的值。\------- export \----- keyspace_name \----- table_name \----- snapshot \----- year=2025 \----- month=01 \----- day=02 \----- hour=09 \----- minute=22 \--- YOUR DATA HERE
要安排您刚才手动运行的 Amazon Glue 作业,请继续步骤 4:(可选)创建触发器以安排导出作业。