Amazon Redshift
数据库开发人员指南 (API Version 2012-12-01)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。点 击 Getting Started with Amazon AWS to see specific differences applicable to the China (Beijing) Region.

从 Amazon S3 加载数据

COPY 命令使用 Amazon Redshift 大规模并行处理 (MPP) 架构从 Amazon S3 存储桶中的文件并行读取和加载数据。您可以将数据拆分成多个文件并在表上设置分配键,从而最大程度地利用并行处理。有关分配键的更多信息,请参阅选择数据分配方式

文件中的数据将加载到目标表中,一行数据占据表中的一行。数据文件中的字段按从左到右的顺序与表列相匹配。数据文件中的字段可以是固定宽度,也可以用字符分隔;默认分隔符为竖线 (|)。默认情况下,将加载所有表列,但您可以选择定义用逗号分隔的列列表。如果 COPY 命令中指定的列列表中不包括某个表列,则该表列将加载为默认值。有关更多信息,请参阅 加载默认列值

遵循此一般过程可从 Amazon S3 加载数据:

  1. 将数据拆分成多个文件。

  2. 将文件上传到 Amazon S3。

  3. 运行 COPY 命令以加载表。

  4. 确认数据已正确加载。

本节的其余部分将详细说明这些步骤。