从列式数据格式中执行 COPY 操作
COPY 可采用以下列式格式从 Simple Storage Service(Amazon S3)中加载数据:
-
ORC
-
Parquet
COPY 支持具有以下限制的列式数据:
-
集群必须位于下列 Amazon 区域之一:
-
美国东部(弗吉尼亚北部)区域 (us-east-1)
-
美国东部(俄亥俄)区域 (us-east-2)
-
美国西部(加利福尼亚北部)区域 (us-west-1)
-
美国西部(俄勒冈)区域 (us-west-2)
-
非洲(开普敦)区域 (af-south-1)
-
亚太地区(香港)区域 (ap-east-1)
-
亚太地区(墨尔本)区域(ap-southeast-4)
-
亚太地区(孟买)区域 (ap-south-1)
-
亚太地区(大阪)区域 (ap-northeast-3)
-
亚太地区(首尔)区域 (ap-northeast-2)
-
亚太地区(新加坡)区域 (ap-southeast-1)
-
亚太地区(悉尼)区域 (ap-southeast-2)
-
亚太地区(东京)区域 (ap-northeast-1)
-
加拿大(中部)区域 (ca-central-1)
-
中国(北京)区域 (cn-north-1)
-
中国(宁夏)区域 (cn-northwest-1)
-
欧洲(法兰克福)区域 (eu-central-1)
-
欧洲(爱尔兰)区域 (eu-west-1)
-
欧洲(伦敦)区域 (eu-west-2)
-
欧洲(米兰)区域 (eu-south-1)
-
欧洲(巴黎)区域 (eu-west-3)
-
欧洲(斯德哥尔摩)区域 (eu-north-1)
-
中东(巴林)区域 (me-south-1)
-
中东(阿联酋)区域(me-central-1)
-
南美洲(圣保罗)区域 (sa-east-1)
-
Amazon GovCloud(美国东部)(us-gov-east-1)
-
Amazon GovCloud(美国西部)(us-gov-west-1)
-
-
Amazon S3 桶必须与 Amazon Redshift 数据库位于同一 Amazon 区域。
-
要通过 VPC 端点访问您的 Simple Storage Service(Amazon S3)数据,请使用 IAM policy 和 IAM 角色设置访问权限,如《Amazon Redshift 管理指南》中的将 Amazon Redshift Spectrum 与增强 VPC 路由结合使用中所述。
-
COPY 不自动应用压缩编码。
-
仅支持以下 COPY 参数:
-
ACCEPTINVCHARS(从 ORC 或 Parquet 文件中复制时)。
-
-
如果 COPY 在加载时遇到错误,则命令失败。列式数据类型不支持 ACCEPTANYDATE 和 MAXERROR。
错误消息仅发送至 SQL 客户端。错误未记录在 STL_LOAD_ERRORS 中。
-
COPY 会按列在列式数据文件中出现的相同顺序将值插入到目标表的列中。目标表中的列数和数据文件中的列数必须匹配。
-
如果您为 COPY 操作指定的文件包含下列扩展名之一,我们将解压缩数据,而无需添加任何参数:
.gz
.snappy
.bz2
从 Parquet 和 ORC 文件格式的 COPY 操作使用 Redshift Spectrum 和存储桶访问。要对这些格式执行 COPY 操作,请确保没有任何阻止使用预签名 URL 的 IAM policy。有关更多信息,请参阅将 Amazon Redshift Spectrum 与增强型 VPC 路由结合使用。