Amazon Redshift
数据库开发人员指南 (API Version 2012-12-01)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。请点击 Amazon AWS 入门,可查看中国地区的具体差异

加载数据

COPY 命令是最高效的加载表的方式。您也可以使用 INSERT 命令将数据添加到您的表中,尽管这与使用 COPY 命令相比的效率低得多。COPY 命令能够同时从多个数据文件或多个数据流进行读取。Amazon Redshift 会将工作负载分配到群集节点并且并行执行负载操作,包括在所有节点切片中为行排序和分配数据。

注意

Amazon Redshift Spectrum 外部表为只读。您无法对外部表进行 COPY 或 INSERT。

要访问其他 AWS 资源上的数据,您的群集必须有权访问这些资源和有权执行访问数据所需的操作。您可使用 Identity and Access Management (IAM) 将用户拥有的访问权限限制为您的群集资源和数据。

在初始数据加载后,如果您添加、修改或删除大量数据,则应随后运行 VACUUM 命令,以便识别您的数据并在数据删除后回收空间。您还应该运行 ANALYZE 命令来更新表统计数据。

本部分介绍如何加载数据和排查数据加载问题,并介绍加载数据的最佳实践。