

 从补丁 198 开始，Amazon Redshift 将不再支持创建新的 Python UDF。现有的 Python UDF 将继续正常运行至 2026 年 6 月 30 日。有关更多信息，请参阅[博客文章](https://www.amazonaws.cn/blogs/big-data/amazon-redshift-python-user-defined-functions-will-reach-end-of-support-after-june-30-2026/)。

# 在 Amazon Redshift 中加载数据
<a name="t_Loading_data"></a>

可以通过多种方法将数据加载到 Amazon Redshift 数据库中。要加载的一个常见数据来源是 Amazon S3 文件。下表总结了从 Amazon S3 来源开始加载时要使用的一些方法。

[See the AWS documentation website for more details](http://docs.amazonaws.cn/redshift/latest/dg/t_Loading_data.html)

COPY 命令是最高效的加载表的方式。您也可以使用 INSERT 命令将数据添加到您的表中，尽管这与使用 COPY 命令相比的效率低得多。COPY 命令能够同时从多个数据文件或多个数据流读取。Amazon Redshift 会将工作负载分配到 Amazon Redshift 节点，并且并行执行加载操作，包括对行进行排序和跨节点切片分配数据。

**注意**  
Amazon Redshift Spectrum 外部表为只读。您无法对外部表进行 COPY 或 INSERT。

要访问其它 Amazon 资源上的数据，Amazon Redshift 必须有权访问这些资源和有权执行访问数据所需的操作。您可使用 Amazon Identity and Access Management（IAM）将用户拥有的访问权限限制为 Amazon Redshift 资源和数据。

在初始数据加载后，如果您添加、修改或删除大量数据，则应随后运行 VACUUM 命令，以便识别您的数据并在数据删除后回收空间。您还应该运行 ANALYZE 命令来更新表统计数据。

**Topics**
+ [使用 COPY 命令加载表](t_Loading_tables_with_the_COPY_command.md)
+ [创建 S3 事件集成以自动从 Amazon S3 存储桶复制文件](loading-data-copy-job.md)
+ [使用 DML 命令加载表](t_Updating_tables_with_DML_commands.md)
+ [执行深层复制](performing-a-deep-copy.md)
+ [分析表](t_Analyzing_tables.md)
+ [对表执行 vacuum 操作](t_Reclaiming_storage_space202.md)
+ [管理并发写入操作](c_Concurrent_writes.md)
+ [教程：从 Amazon S3 加载数据](tutorial-loading-data.md)