Amazon Redshift
数据库开发人员指南 (API Version 2012-12-01)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。点 击 Getting Started with Amazon AWS to see specific differences applicable to the China (Beijing) Region.

加载数据

COPY 命令是最高效的加载表的方式。您也可以使用 INSERT 命令将数据添加到您的表中,尽管这与使用 COPY 命令相比的效率低得多。COPY 命令能够同时从多个数据文件或多个数据流进行读取。Amazon Redshift 会将工作负载分配到集群节点并且并行执行负载操作,包括在所有节点切片中为行排序和分配数据。

注意

Amazon Redshift Spectrum 外部表为只读。您无法对外部表进行 COPY 或 INSERT。

要访问其他 AWS 资源上的数据,您的集群必须有权访问这些资源和有权执行访问数据所需的操作。您可使用 Identity and Access Management (IAM) 将用户拥有的访问权限限制为您的集群资源和数据。

在初始数据加载后,如果您添加、修改或删除大量数据,则应随后运行 VACUUM 命令,以便识别您的数据并在数据删除后回收空间。您还应该运行 ANALYZE 命令来更新表统计数据。

本部分介绍如何加载数据和排查数据加载问题,并介绍加载数据的最佳实践。