正在迁移到 Amazon Keyspaces - Amazon Keyspaces(针对 Apache Cassandra)
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

正在迁移到 Amazon Keyspaces

Amazon Keyspaces(适用于 Apache Cassandra)是一项可扩展、高可用、托管的 Apache Cassandra 兼容数据库服务。您可以使用本部分中的步骤将数据从在本地或 Amazon Elastic Compute Cloud (Amazon EC2) 上运行的 Cassandra 数据库迁移到 Amazon Keyspaces。

我们建议您遵循以下最佳实践确保迁移成功:

  • 将迁移细分为较小的组件。

    考虑以下迁移单位及其在原始数据大小方面的潜在占用空间。在一个或多个阶段迁移较少量的数据可能有助于简化迁移。

    按集群集群— 一次迁移所有卡桑德拉数据。对于较小的群集,这种方法可能很好。

    按键空间或表— 将迁移分解为密钥空间或表组。此方法可帮助您根据每个工作负载的要求分阶段迁移数据。

    按数据— 考虑迁移特定用户或产品组的数据,以便进一步缩小数据的大小。

  • 根据简单性优先迁移哪些数据。

    考虑您是否有可以首先更容易迁移的数据,例如,在特定时间不会更改的数据、夜间批处理作业中的数据、脱机时间未使用的数据或来自内部应用程序的数据。

  • 使用特定的工具。

    • 使用 cqlsh 快速入门将数据加载到 Amazon KeyspacesCOPY FROM命令。cqlsh 包含在 Apache Cassandra 中,最适合加载小型数据集或测试数据。如需分步指导,请参阅 教程:使用 cqlsh 将数据加载到亚马逊 Keyspaces

    • 对于具有大型数据集的生产工作负载,您可以使用适用于 Apache Cassandra 的 DataSax 批量加载器将数据加载到 Amazon Keyspaces 中,使用dsbulk命令。DSBulk 提供了更强大的导入功能,可从GitHub 存储库

    • 对于复杂的迁移,请考虑使用提取、转换和加载 (ETL) 工具。您可以使用 Amazon EMR 快速有效地执行数据转换工作负载。有关更多信息,请参阅 Amazon EMR 管理指南