第 1 步:创建源 CSV 文件和目标表 - Amazon Keyspaces(针对 Apache Cassandra)
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

第 1 步:创建源 CSV 文件和目标表

  1. 创建逗号分隔值 (CSV) 文件,以执行本教程中的步骤。在本教程中,我们使用名称为export_keyspace_table.csv

    您可以根据存储在 Cassandra 表中的数据创建 CSV 文件,也可以创建 CSV 文件并使用测试数据填充该文件。无论哪种方式,请确保 CSV 源数据文件中的列标题与目标表中的列名匹配。

    • 创建包含测试数据的示例文件。

      1. 创建名为的键空间mykeyspace使用以下示例。

        CREATE KEYSPACE mykeyspace WITH replication = {'class': 'SimpleStrategy', 'replication_factor' : 3};
      2. 下面的代码创建一个源表mytable,其中包含与 CSV 文件匹配的列。您可以将值替换为您自己的值。

        cqlsh localhost 9042 -u "username" -p "password" --execute "CREATE TABLE "mykeyspace.mytable" ("id" int PRIMARY KEY, "columnvalue" text);"
      3. 然后,使用 bash 创建 CSV 文件。使用与源表中的值匹配的值填充文件。

        cat example.csv id,columnvalue 1,value1 2,value2 3,value3
    • 要使用现有数据填充 CSV 文件,您可以执行以下操作之一:

      • 如果源数据存储在 Apache 卡桑德拉数据库中,则可以使用 cqlsh 填充源 CSV 文件COPY TO如以下示例所示。

        cqlsh localhost 9042 -u "cassandra" -p "cassandra" --execute "COPY mykeyspace.mytable TO 'export_keyspace_table.csv' WITH HEADER=true"
      • 或者,您也可以使用来自不同源的 CSV 文件。

        如果您使用不同的数据源创建 CSV 文件,请确保以下设置:

        • 第一行包含列名。

        • 数据用逗号分隔,允许您使用cqlsh COPY

        • 所有数据值都是有效的亚马逊 Keyspaces 数据类型。请参阅 数据类型

  2. 在 Amazon Keyspaces 中创建目标表。

    如果 Apache Cassandra 是原始数据源,则创建具有匹配标题的 Amazon Keyspaces 表的简单方法是生成CREATE TABLE语句。以下代码就是一个示例。

    cqlsh localhost 9042 -u "cassandra" -p "cassandra" --execute "DESCRIBE TABLE mykeyspace.mytable;"

    在 Amazon Keyspace 中创建 Keyspaces 和表,并将此表用作本数据加载教程的目标表。