步骤 3:运行 Amazon Glue 任务将 Amazon Keyspaces 表从中导出到 Amazon S3 存储桶 Amazon CLI - Amazon Keyspaces(Apache Cassandra 兼容)
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

步骤 3:运行 Amazon Glue 任务将 Amazon Keyspaces 表从中导出到 Amazon S3 存储桶 Amazon CLI

在本步骤中,您将使用运行在上一步中创建的 Amazon Glue 任务, Amazon CLI 将 Amazon Keyspaces 表导出到 Amazon S3 中的存储桶。

从中运行导出作业 Amazon CLI
  1. 在以下示例中,该 Amazon CLI 命令运行在上一步中创建的作业。

    aws glue start-job-run --job-name AmazonKeyspacesExportToS3-cfn-setup-cfn-glue
    • 您可以覆盖任何 Amazon Glue 作业参数,包括 Amazon CLI 命令中的默认参数。要覆盖作业的任何默认参数,例如 keyspace 或表名,可以将它们作为参数传递。有关参数的完整列表,请参阅《 Amazon Glue 命令行参考》start-job-run中的。

      以下命令运行 Amazon Glue 导出作业,但会覆盖 Amazon Glue 工作人员数量、工作器类型和表名。

      aws glue start-job-run --job-name AmazonKeyspacesExportToS3-cfn-setup-cfn-glue \ --number-of-workers 8 --worker-type G.2X \ --arguments '{"--TABLE_NAME":"my_table"}'
  2. 确认您的表已导出到您的 Amazon S3 存储桶。根据表格的大小,这可能需要一些时间。导出任务完成后,您可以使用示例命令在存储桶中看到以下文件夹。

    aws s3 ls s3://s3-keyspaces

    输出显示您的存储桶中的以下结构。

    PRE conf/ PRE export/ PRE jars/ PRE scripts/ PRE spark-logs/

    您的文件将位于以下文件夹结构下export,数据/时间值将显示您自己的值。

    \------- export \----- keyspace_name \----- table_name \----- snapshot \----- year=2025 \----- month=01 \----- day=02 \----- hour=09 \----- minute=22 \--- YOUR DATA HERE

要安排您刚才手动运行的 Amazon Glue 作业,请继续步骤 4:(可选)创建触发器以安排导出作业