教程:使用 cqlsh 将数据加载到 Amazon Keyspaces - Amazon Keyspaces(Apache Cassandra 兼容)
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

教程:使用 cqlsh 将数据加载到 Amazon Keyspaces

本教程将指导您完成使用 cqlsh COPY FROM 命令将数据从 Apache Cassandra 迁移到 Amazon Keyspaces 的过程。cqlsh COPY FROM 命令对于出于学术或测试目的快速轻松地将小型数据集上传到 Amazon Keyspaces 而言非常有用。有关如何迁移生产工作负载的更多信息,请参阅离线迁移过程:Apache Cassandra 到 Amazon Keyspaces。在本教程中,您将完成以下步骤:

先决条件-使用证书设置 Amazon 账户,为证书创建 JKS 信任存储文件,然后配置为连接cqlsh到 Amazon Keyspaces。

  1. 创建源 CSV 和目标表 - 准备一个 CSV 文件作为源数据,然后在 Amazon Keyspaces 中创建目标键空间和表。

  2. 准备数据 - 随机采样 CSV 文件中的数据,并对其进行分析,以确定平均行大小和最大行大小。

  3. 设置吞吐容量-根据数据大小和所需的加载时间计算所需的写入容量单位 (WCUs),并配置表的预配置容量。

  4. 配置 cqlsh 参数 - 确定诸如 INGESTRATENUMPROCESSESMAXBATCHSIZECHUNKSIZE 之类的 cqlsh COPY FROM 参数的最佳值,以均匀分配工作负载。

  5. 运行 cqlsh COPY FROM 命令 - 运行 cqlsh COPY FROM 命令,将 CSV 文件中的数据上传到 Amazon Keyspaces 表,并监控进度。

疑难解答 - 解决数据上传过程中出现的常见问题,例如无效请求、解析器错误、容量错误和 cqlsh 错误。