

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 教程：使用 DSBulk 将数据加载到 Amazon Keyspaces
<a name="dsbulk-upload"></a>

本分步教程将指导您使用上提供的 DataStax 批量加载器 (DSBulk) 将数据从 Apache Cassandra 迁移到亚马逊密钥空间。[GitHub](https://github.com/datastax/dsbulk.git)如果要出于学术或测试目的将数据集上传到 Amazon Keyspaces，使用 DSBulk 将非常有用。有关如何迁移生产工作负载的更多信息，请参阅[离线迁移过程：Apache Cassandra 到 Amazon Keyspaces](migrating-offline.md)。在本教程中，您将完成以下步骤。

先决条件-使用凭据设置 Amazon 帐户，为证书创建 JKS 信任存储文件，配置`cqlsh`、下载和安装 DSBulk，以及配置文件。`application.conf`

1. **创建源 CSV 和目标表** - 准备一个 CSV 文件作为源数据，然后在 Amazon Keyspaces 中创建目标键空间和表。

1. **准备数据** - 随机采样 CSV 文件中的数据，并对其进行分析，以确定平均行大小和最大行大小。

1. **设置吞吐能力** - 根据数据大小和所需的加载时间计算所需的写入容量单位数（WCU），并配置表的预置容量。

1. **配置 DSBulk 设置**-使用身份验证、 SSL/TLS一致性级别和连接池大小等设置创建 DSBulk 配置文件。

1. **运行 DSBulk 加载命令** – 运行 DSBulk 加载命令，将 CSV 文件中的数据上传到 Amazon Keyspaces 表，并监控进度。

**Topics**
+ [先决条件：使用 DSBulk 上传数据之前必须完成的步骤](dsbulk-upload-prequs.md)
+ [第 1 步：创建源 CSV 文件和目标表，以便使用 DSBulk 上传文件](dsbulk-upload-source.md)
+ [第 2 步：准备数据，以便使用 DSBulk 上传数据](dsbulk-upload-prepare-data.md)
+ [第 3 步：为目标表设置吞吐能力](dsbulk-upload-capacity.md)
+ [第 4 步：配置 `DSBulk` 设置，以将 CSV 文件中的数据上传到目标表](dsbulk-upload-config.md)
+ [第 5 步：运行 DSBulk `load` 命令将 CSV 文件中的数据上传到目标表](dsbulk-upload-run.md)