Amazon Redshift
数据库开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

列式数据格式中的 COPY

COPY 可采用以下列式格式从 Amazon S3 中加载数据:

  • ORC

  • Parquet

COPY 支持具有以下限制的列式数据:

  • 集群必须位于下列 AWS 区域之一:

    • 美国东部(弗吉尼亚北部)地区(us-east-1)

    • 美国东部(俄亥俄)区域(us-east-2)

    • 美国西部(加利福利亚北部)区域 (us-west-1)

    • 美国西部(俄勒冈)区域(us-west-2)

    • 亚太地区(孟买)区域 (ap-south-1)

    • 亚太区域(首尔) (ap-northeast-2)

    • 亚太区域(新加坡) (ap-southeast-1)

    • 亚太区域(悉尼) (ap-southeast-2)

    • 亚太区域(东京) (ap-northeast-1)

    • 加拿大 (中部) 区域 (ca-central-1)

    • 欧洲(法兰克福)区域 (eu-central-1)

    • 欧洲(爱尔兰)区域(eu-west-1)

    • 欧洲 (伦敦) 区域(eu-west-2)

    • 南美洲(圣保罗)区域 (sa-east-1)

  • Amazon S3 存储桶必须与 Amazon Redshift 集群位于同一区域。

  • COPY 命令凭证必须使用 AWS Identity and Access Management (IAM) 角色作为 IAM_ROLE 参数或 CREDENTIALS 参数的一个参数进行提供。

  • COPY 不自动应用压缩编码。

  • 仅支持以下 COPY 参数:

  • 如果 COPY 在加载时遇到错误,则命令失败。列式数据类型不支持 ACCEPTANYDATE、ACCEPTINVCHARS 和 MAXERROR。

  • 错误消息仅发送至 SQL 客户端。错误未记录在 STL_LOAD_ERRORS 中。

  • COPY 会按列在列式数据文件中出现的相同顺序将值插入到目标表的列中。目标表中的列数和数据文件中的列数必须匹配。

  • 如果您为 COPY 操作指定的文件包含下列扩展名之一,我们将解压缩数据,而无需添加任何参数:

    • .gz

    • .snappy

    • .bz2