Amazon Redshift
数据库开发人员指南 (API Version 2012-12-01)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。点 击 Getting Started with Amazon AWS to see specific differences applicable to the China (Beijing) Region.

文档历史记录

下表介绍了自上次发布 Amazon Redshift Database Developer Guide 以来的重要更改。

API 版本:2012-12-01

文档最新更新时间:2017 年 7 月 19 日

有关对 Amazon Redshift Cluster Management Guide的更改的列表,请参阅 Amazon Redshift Cluster Management Guide文档历史

有关新功能的更多信息(包括修复和每个版本的关联集群版本号的列表),请转至 Amazon Redshift 论坛

更改 描述 更改日期
现在支持 RegexSerDe Amazon Redshift Spectrum 现在支持 RegexSerDe 数据格式。有关更多信息,请参阅 为 Amazon Redshift Spectrum 中的查询创建数据文件 2017 年 7 月 19 日
向 SVV_TABLES 和 SVV_COLUMNS 中添加了新列 SVV_COLUMNS 中添加了 domain_nameremarks 列。向 SVV_TABLES 中添加了备注列。 2017 年 7 月 19 日
SVV_TABLES 和 SVV_COLUMNS 系统视图 SVV_TABLESSVV_COLUMNS 系统视图提供有关本地和外部表及视图的列信息和其他详情。 2017 年 7 月 7 日
Amazon Redshift Spectrum 与 Amazon EMR Hive 元数据存储配合使用时,不再需要 VPC Redshift Spectrum 取消了以下要求:使用 Amazon EMR Hive 元数据存储时,Amazon Redshift 群集和 Amazon EMR 群集必须位于同一个 VPC 及同一个子网中。有关更多信息,请参阅 使用 Amazon Redshift Spectrum 外部目录 2017 年 7 月 7 日
用 UNLOAD 创建较小的文件 默认情况下,UNLOAD 会在 Amazon S3 中创建多个文件,每个文件的最大大小为 6.2 GB。要创建较小的文件,请在使用 UNLOAD 命令时指定 MAXFILESIZE。您可以将最大文件大小指定为 5 MB 到 6.2 GB。有关更多信息,请参阅 UNLOAD 2017 年 7 月 7 日
TABLE PROPERTIES 现在,您可以为 CREATE EXTERNAL TABLEALTER TABLE 设置 TABLE PROPERTIES numRows 参数以更新表统计数据,从而反映表中的行数。 2017 年 6 月 6 日
ANALYZE PREDICATE COLUMNS 为了节省时间和集群资源,您可以选择仅分析可能用作谓词的列。使用 PREDICATE COLUMNS 子句运行 ANALYZE 时,分析操作仅包括已在联接、筛选条件或 group by 子句中使用的列,或用作排序键或分配键的列。有关更多信息,请参阅 分析表 2017 年 5 月 25 日
Amazon Redshift Spectrum 的 IAM 策略 要仅使用 Redshift Spectrum 授予对 Amazon S3 存储桶的访问权限,您可以包括允许访问用户代理“AWS Redshift/Spectrum”的条件。有关更多信息,请参阅 Amazon Redshift Spectrum 的 IAM 策略 2017 年 5 月 25 日
Amazon Redshift Spectrum 递归扫描 Redshift Spectrum 现在扫描子文件夹以及 Amazon S3 中所指定文件夹内的文件。有关更多信息,请参阅 为 Amazon Redshift Spectrum 创建外部表 2017 年 5 月 25 日
查询监控规则 使用 WLM 查询监控规则,您可以为 WLM 查询定义基于指标的性能边界,并指定查询超出这些边界时需要采取的操作 - log、hop 或 abort。您将在工作负载管理 (WLM) 配置中定义查询监控规则。有关更多信息,请参阅 WLM 查询监控规则 2017 年 4 月 21 日
Amazon Redshift Spectrum 使用 Redshift Spectrum,您可以在 Amazon S3 中高效地查询和检索文件中的数据,而无需将数据加载到表中。Redshift Spectrum 查询针对大型数据集执行速度非常快,因为 Redshift Spectrum 直接在 Amazon S3 中扫描数据文件。大部分处理发生在 Amazon Redshift Spectrum 层中并且大部分数据保留在 Amazon S3 中。多个集群可同时查询 Amazon S3 上的同一数据集,而无需为每个集群复制数据。有关更多信息,请参阅 使用 Amazon Redshift Spectrum 查询外部数据 2017 年 4 月 19 日
支持 Redshift Spectrum 的新系统表 已添加以下新的系统视图来支持 Redshift Spectrum: 2017 年 4 月 19 日
APPROXIMATE PERCENTILE_DISC 聚合函数 现在可以使用 APPROXIMATE PERCENTILE_DISC 聚合函数。 2017 年 4 月 4 日
使用 KMS 的服务器端加密 您现在可以使用 AWS Key Management Service 密钥进行服务器端加密 (SSE-KMS),将数据卸载到 Amazon S3。此外,COPY 现在可以从 Amazon S3 透明加载 KMS 加密的数据文件。有关更多信息,请参阅 UNLOAD 2017 年 2 月 9 日
新的授权语法 您现在可以使用 IAM_ROLE、MASTER_SYMMETRIC_KEY、ACCESS_KEY_ID、SECRET_ACCESS_KEY 和 SESSION_TOKEN 参数为 COPY、UNLOAD 和 CREATE LIBRARY 命令提供授权和访问信息。新的授权语法为 CREDENTIALS 参数提供了单一字符串参数,是更具灵活性的方案。有关更多信息,请参阅 授权参数 2017 年 2 月 9 日
Schema 上限提高 每集群现在最多可以创建 9,900 个 schemas。有关更多信息,请参阅 CREATE SCHEMA 2017 年 2 月 9 日
默认表编码 CREATE TABLEALTER TABLE 现在向大多数新列分配 LZO 压缩编码。默认情况下,会向定义为排序键的列、定义为 BOOLEAN、REAL 或 DOUBLE PRECISION 数据类型的列以及临时表分配 RAW 编码。有关更多信息,请参阅 ENCODE 2017 年 2 月 6 日
ZSTD 压缩编码 Amazon Redshift 现在支持 ZSTD 列压缩编码。 2017 年 1 月 19 日
PERCENTILE_CONT 和 MEDIAN 聚合函数 PERCENTILE_CONTMEDIAN 现在可作为聚合函数和窗口函数使用。 2017 年 1 月 19 日
用户定义的函数 (UDF) 用户日志记录 您可以使用 Python 日志记录模块在 UDF 中创建用户定义的错误和警告消息。执行查询后,您可以查询 SVL_UDF_LOG 系统视图以检索记录的消息。有关用户定义消息的更多信息,请参阅在 UDF 中记录错误和警告 2016 年 12 月 8 日
ANALYZE COMPRESSION 估计的压缩量 ANALYZE COMPRESSION 命令现在可报告每一列的磁盘空间预估压缩百分比。有关更多信息,请参阅 ANALYZE COMPRESSION 2016 年 11 月 10 日
连接限制 您现在可以设置允许用户同时打开的数据库连接的数量限制。您也可以限制数据库并行连接数量。有关更多信息,请参阅 CREATE USERCREATE DATABASE 2016 年 11 月 10 日
COPY 排序顺序增强 如果您以排序键顺序加载数据,COPY 现在可以自动将新行添加到表中已排序区域。有关启用此增强功能的具体要求,请参阅 按排序键顺序加载数据 2016 年 11 月 10 日
压缩 CTAS CREATE TABLE AS (CTAS) 现在可以根据列的数据类型自动为新表分配压缩编码。有关更多信息,请参阅 列和表属性的继承 2016 年 10 月 28 日
有时区数据类型的时间戳 Amazon Redshift 现在支持使用时区 (TIMESTAMPTZ) 数据类型的时间戳。此外,已添加几个新功能以支持新的数据类型。有关更多信息,请参阅 日期和时间函数 2016 年 9 月 29 日
分析阈值 为了减少 ANALYZE 操作的处理时间并提高整体系统性能,在自上次运行 ANALYZE 命令以来更改的行数百分比低于 analyze_threshold_percent 参数指定的分析阈值的情况下,Amazon Redshift 将跳过对表的分析。默认情况下,analyze_threshold_percent 为 10。 2016 年 8 月 9 日
新 STL_RESTARTED_SESSIONS 系统表 在 Amazon Redshift 重新启动会话时,STL_RESTARTED_SESSIONS 将记录新的进程 ID (PID) 和旧 PID。 2016 年 8 月 9 日
更新了“日期和时间函数”文档 添加了函数概要(其中包含指向 日期和时间函数 的链接),并更新了函数参考以确保一致性。 2016 年 6 月 24 日
STL_CONNECTION_LOG 中新增了一些列 STL_CONNECTION_LOG 系统表有两个用于跟踪 SSL 连接的新列。如果您定期向 Amazon Redshift 表加载审核日志,则需要向目标表添加以下新列:sslcompression 和 sslexpansion。 2016 年 5 月 5 日
MD5 哈希密码 通过提供密码和用户名的 MD5 哈希字符串,您可为 CREATE USERALTER USER 命令指定密码。 2016 年 4 月 21 日
STV_TBL_PERM 中的新列 STV_TBL_PERM 系统视图中的 backup 列指示表是否包含在集群快照中。有关更多信息,请参阅 BACKUP 2016 年 4 月 21 日
无备份表 对于不会包含关键数据的表(如暂存表),您可在 CREATE TABLECREATE TABLE AS 语句中指定 BACKUP NO 来防止 Amazon Redshift 在自动或手动快照中包含表。使用无备份表可节省创建快照并从快照还原时的处理时间,并可减少在 Amazon S3 上占用的存储空间。 2016 年 4 月 7 日
VACUUM 删除阈值 默认情况下,VACUUM 命令现在将回收空间,以使至少 95% 的剩余行不会被标记为删除。因此,与回收 100% 的已删除行相比,VACUUM 在删除阶段所耗的时间通常少得多。您可以在运行 VACUUM 命令时包含 TO threshold PERCENT 参数,从而更改某个表的默认阈值。 2016 年 4 月 7 日
SVV_TRANSACTIONS 系统表 SVV_TRANSACTIONS 系统视图记录当前锁定到数据库中的表的事务的相关信息。 2016 年 4 月 7 日
使用 IAM 角色访问其他 AWS 资源 要在您的集群和其他 AWS 资源(如 Amazon S3、Amazon DynamoDB、Amazon EMR 或 Amazon EC2)之间移动数据,您的集群必须具有访问相应资源和执行所需操作的权限。作为为 COPY、UNLOAD 或 CREATE LIBRARY 命令提供访问密钥对的更安全的替代方法,您现在可以指定您的集群用于身份验证和授权的 IAM 角色。有关更多信息,请参阅 基于角色的访问控制 2016 年 29 月 3 日
VACUUM 排序阈值 现在,当任意表中有 95% 的行已有序时,VACUUM 命令会为该表跳过排序阶段。您可以在运行 VACUUM 命令时包含 TO threshold PERCENT 参数,从而更改某个表的默认排序阈值。 2016 年 17 月 3 日
STL_CONNECTION_LOG 中新增了一些列 STL_CONNECTION_LOG 系统表新增了三列内容。如果您需要定期向 Amazon Redshift 表加载审计日志,则需要向目标表添加以下新列:sslversion、sslcipher 和 mtu。 2016 年 17 月 3 日
使用 bzip2 压缩执行 UNLOAD 您现在可以选择使用 bzip2 压缩执行 UNLOAD 2016 年 2 月 8 日
ALTER TABLE APPEND ALTER TABLE APPEND 通过从现有的源表移动数据,将行附加到目标表。由于是移动数据而不是复制数据,因此相比类似的 CREATE TABLE ASINSERT INTO 操作,ALTER TABLE APPEND 通常要快得多。 2016 年 2 月 8 日
WLM 查询队列跳跃 如果工作负载管理 (WLM) 由于 WLM 超时而取消一个只读查询(例如一个 SELECT 语句),WLM 会尝试将查询路由到下一个匹配的队列。有关更多信息,请参阅 WLM 查询队列跳跃 2016 年 1 月 7 日
ALTER DEFAULT PRIVILEGES 您可以使用 ALTER DEFAULT PRIVILEGES 命令定义要应用到由指定用户在未来创建的对象的一组默认访问权限。 2015 年 12 月 10 日
bzip2 文件压缩 COPY 命令支持从使用 bzip2 压缩的文件加载数据。 2015 年 12 月 10 日
NULLS FIRST 和 NULLS LAST 您可以指定 ORDER BY 子句是将 NULLS 放在结果集的第一个还是最后一个。有关更多信息,请参阅 ORDER BY 子句开窗函数语法摘要 2015 年 11 月 19 日
CREATE LIBRARY 的 REGION 关键字 如果包含 UDF 库文件的 Amazon S3 存储桶与您的 Amazon Redshift 集群不在同一个区域内,您可以使用 REGION 选项指定数据所在的区域。有关更多信息,请参阅 CREATE LIBRARY 2015 年 11 月 19 日
用户定义的标量函数 (UDF) 现在,您可以创建自定义的用户定义的标量函数,以实施 Python 2.7 标准库中的 Amazon Redshift 支持的模块或您自己的基于 Python 编程语言的自定义 UDF 提供的非 SQL 处理功能。有关更多信息,请参阅 创建用户定义的函数 2015 年 9 月 11 日
WLM 配置中的动态属性 WLM 配置参数现在支持动态应用一些属性。其他属性保持静态更改,并需要重启关联的集群以便能应用配置更改。有关更多信息,请参阅 WLM 动态和静态配置属性实施工作负载管理 2015 年 8 月 3 日
LISTAGG 函数 LISTAGG 函数LISTAGG 开窗函数 返回通过串联一组列值而创建的字符串。 2015 年 7 月 30 日
淘汰的参数

max_cursor_result_set_size 配置参数已淘汰。光标结果集的大小受到集群的节点类型的限制。有关更多信息,请参阅 游标约束

2015 年 7 月 24 日
修订了 COPY 命令的文档 COPY 命令的参考内容进行了大范围的修订,以让材料更加友好、易读。 2015 年 7 月 15 日
从 Avro 格式 COPY COPY 命令支持从 Amazon S3、Amazon EMR 上的数据文件以及从使用 SSH 的远程主机上加载 Avro 格式的数据。有关更多信息,请参阅 AVRO从 Avro 复制的示例 2015 年 7 月 8 日
STV_STARTUP_RECOVERY_STATE STV_STARTUP_RECOVERY_STATE 系统表记录在集群重新启动期间暂时锁定的表的状态。对于正在处理以解决集群重新启动后过时的事务的表,Amazon Redshift 会临时锁定这些表。 2015 年 5 月 25 日
排名函数的可选 ORDER BY 对于部分开窗排名函数,现在可以使用可选的 ORDER BY 子句。有关更多信息,请参阅 CUME_DIST 开窗函数DENSE_RANK 开窗函数RANK 开窗函数NTILE 开窗函数PERCENT_RANK 开窗函数ROW_NUMBER 开窗函数 2015 年 5 月 25 日
交错排序键 交错排序键对于排序键中的每个列给予相同的权重。使用交错排序键而不是默认的复合键可以显著提升对辅助排序列使用限制性谓词的查询的性能,对于大型表尤其如此。当使用多个查询对同一个表中的不同列进行筛选时,交错排序还能提升整体性能。有关更多信息,请参阅 选择排序键CREATE TABLE 2015 年 5 月 11 日
修订的优化查询性能主题 优化查询性能 已经扩展,加入了用于分析查询性能的新查询和更多示例。此外,此主题经过修订,内容更清晰、完整。查询设计最佳实践 介绍了更多有关如何编写查询以改进性能的信息。 2015 年 3 月 23 日
SVL_QUERY_QUEUE_INFO SVL_QUERY_QUEUE_INFO 视图详细总结了查询在 WLM 查询队列或提交队列中所用的时间。 2015 年 2 月 19 日
SVV_TABLE_INFO 您可以使用 SVV_TABLE_INFO 视图诊断和解决会影响查询性能的表设计问题,包括与压缩编码、分配键、排序方式、数据分配偏斜、表大小和统计数据相关的问题。 2015 年 2 月 19 日
UNLOAD 使用服务器端文件加密 UNLOAD 命令现在自动使用 Amazon S3 服务器端加密 (SSE) 来加密所有卸载数据文件。服务器端加密又增加了一层安全性,而且对性能只有少许或几乎没有影响。 2014 年 10 月 31 日
CUME_DIST 开窗函数 CUME_DIST 开窗函数 计算某个窗口或分区中某个值的累积分布。 2014 年 10 月 31 日
MONTHS_BETWEEN 函数 MONTHS_BETWEEN 函数 确定两个日期之间相隔的月数。 2014 年 10 月 31 日
NEXT_DAY 函数 NEXT_DAY 函数 返回比给定日期晚的指定日期的第一个实例的日期。 2014 年 10 月 31 日
PERCENT_RANK 开窗函数 PERCENT_RANK 开窗函数 计算某个给定行的百分比排名。 2014 年 10 月 31 日
RATIO_TO_REPORT 开窗函数 RATIO_TO_REPORT 开窗函数 计算某个窗口或分区中一个值与值的总和的比率。 2014 年 10 月 31 日
TRANSLATE 函数 TRANSLATE 函数 使用指定的替换字符替换指定表达式中出现的所有指定字符。 2014 年 10 月 31 日
NVL2 函数 NVL2 表达式 根据指定表达式的结果是 NULL 或 NOT NULL,返回这两个值中的一个。 2014 年 10 月 16 日
MEDIAN 开窗函数 MEDIAN 开窗函数 计算某个窗口或分区中值的范围的中间值。 2014 年 10 月 16 日
GRANT 和 REVOKE 命令的 ON ALL TABLES IN SCHEMA schema_name 子句 GRANTREVOKE 命令已更新为可以使用 ON ALL TABLES IN SCHEMA schema_name 子句。使用此子句,您可以使用一个命令更改 schema 中所有表的权限。 2014 年 10 月 16 日
DROP SCHEMA、DROP TABLE、DROP USER 和 DROP VIEW 命令的 IF EXISTS 子句 DROP SCHEMADROP TABLEDROP USERDROP VIEW 命令已经更新为可以使用 IF EXISTS 子句。如果指定的对象不存在,使用此子句可让命令不执行任何更改并且返回消息,而不是以错误终止命名。 2014 年 10 月 16 日
CREATE SCHEMA 和 CREATE TABLE 命令的 IF NOT EXISTS 子句 CREATE SCHEMACREATE TABLE 命令已经更新为可以使用 IF NOT EXISTS 子句。如果指定的对象已经存在,使用此子句可让命令不执行任何更改并且返回消息,而不是以错误终止命名。 2014 年 10 月 16 日
COPY 支持 UTF-16 编码 COPY 命令现在支持从使用 UTF-16 编码以及 UTF-8 编码的数据文件加载。有关更多信息,请参阅 ENCODING 2014 年 9 月 29 日
新工作负载管理教程 教程:配置工作负载管理 (WLM) 队列以改进查询处理 为您介绍了配置工作负载管理 (WLM) 队列以改进查询处理和分配查询的流程。 2014 年 9 月 25 日
AES 128 位加密 当使用 Amazon S3 客户端加密从数据文件加载数据时,COPY 命令现在支持 AES 128 位加密和 AES 256 位加密。有关更多信息,请参阅 从 Amazon S3 加载加密数据文件 2014 年 9 月 29 日
PG_LAST_UNLOAD_COUNT 函数 PG_LAST_UNLOAD_COUNT 函数返回在最近的 UNLOAD 操作中处理的行数。有关更多信息,请参阅 PG_LAST_UNLOAD_COUNT() 2014 年 9 月 15 日
新的对查询进行问题排查部分 诊断查询提供了快速参考,帮助您识别和解决一些在使用 Amazon Redshift 查询时可能会遇到的最常见问题和最严重问题。 2014 年 7 月 7 日
新的数据加载教程 教程:从 Amazon S3 加载数据演练从 Amazon S3 存储桶中的数据文件将数据加载到 Amazon Redshift 数据库表中的完整过程。 2014 年 7 月 1 日
PERCENTILE_CONT 开窗函数 PERCENTILE_CONT 开窗函数 是一个假定连续分布模型的逆分布函数。该函数具有一个百分位数值和一个排序规范,并返回一个落入符合排序规范的给定百分位数值中的内插值。 2014 年 6 月 30 日
PERCENTILE_DISC 开窗函数 PERCENTILE_DISC 开窗函数 是一个假定离散分布模型的逆分布函数。该函数具有一个百分位数值和一个排序规范,并从集合中返回一个元素。 2014 年 6 月 30 日
GREATEST 和 LEAST 函数 GREATEST 和 LEAST 函数从表达式列表返回最大或最小值。 2014 年 6 月 30 日
跨区域 COPY COPY 命令支持从与 Amazon Redshift 集群位于不同区域的 Amazon S3 存储桶或 Amazon DynamoDB 表加载数据。有关更多信息,请参阅 COPY 命令参考中的REGION 2014 年 6 月 30 日
“最佳实践”已扩充 Amazon Redshift 最佳实践已经扩充、重新组织,并移至导航层次结构中的顶级,以便读者更容易发现。 2014 年 5 月 28 日
UNLOAD 到单个文件 UNLOAD 命令通过添加 PARALLEL OFF 选项,可以依次将表数据卸载到 Amazon S3 上的一个文件。如果数据的大小超过文件大小上限 (6.2 GB),UNLOAD 将创建更多文件。 2014 年 5 月 6 日
REGEXP 函数 REGEXP_COUNTREGEXP_INSTRREGEXP_REPLACE 函数根据正则表达式模式匹配处理字符串。 2014 年 5 月 6 日
新教程 新的教程:优化表设计为您介绍优化表设计的步骤,包括在优化之前和之后测试负载和查询性能。 2014 年 5 月 2 日
从 Amazon EMR 执行 COPY 的操作

COPY 命令支持直接从 Amazon EMR 集群加载数据。有关更多信息,请参阅 从 Amazon EMR 加载数据

2014 年 4 月 18 日
WLM 并发限制增加

现在,您可以将工作负载管理 (WLM) 配置在用户定义的查询队列中并发运行最多 50 个查询。这一增加为用户提供了更大的灵活性,可以通过修改 WLM 配置来管理系统性能。有关更多信息,请参阅 定义查询队列

2014 年 4 月 18 日
用于管理光标大小的新配置参数

max_cursor_result_set_size 配置参数定义了大型查询的每个光标结果集可以返回的数据大小(以兆字节为单位)。此参数值也会影响集群的并发光标数量,让您能够配置用于增加或减少集群光标数量的值。

有关更多信息,请参阅本指南中的 DECLARE 以及 Amazon Redshift Cluster Management Guide 中的配置光标结果集的最大大小

2014 年 3 月 28 日
从 JSON 格式数据执行的 COPY 操作 COPY 命令支持从 Amazon S3 上的数据文件以及从使用 SSH 的远程主机上加载 JSON 格式的数据。有关更多信息,请参阅 从 JSON 格式数据执行的 COPY 操作 使用说明。 2014 年 3 月 25 日
新系统表 STL_PLAN_INFO STL_PLAN_INFO 表补充了 EXPLAIN 命令,作为另一种查看查询计划的方式。 2014 年 3 月 25 日
新函数 REGEXP_SUBSTR 通过搜索正则表达式模式,REGEXP_SUBSTR 函数 返回从字符串提取的字符。 2014 年 3 月 25 日
STL_COMMIT_STATS 的新列 STL_COMMIT_STATS 表添加了两个新的列:numxidsoldestxid 2014 年 3 月 6 日
从 SSH 执行 COPY 支持 gzip 和 lzop 当通过 SSH 连接加载数据时,COPY 命令支持 gzip 和 lzop 压缩。 2014 年 2 月 13 日
新函数 ROW_NUMBER 开窗函数 返回当前行的数字。STRTOL 函数 将指定基数的数字的字符串表达式转换为相当的整数值。PG_CANCEL_BACKENDPG_TERMINATE_BACKEND 让用户可以取消查询和会话连接。已经添加 LAST_DAY 函数来实现对 Oracle 的兼容性。 2014 年 2 月 13 日
新系统表 STL_COMMIT_STATS 系统表提供与提交性能相关的指标,包括提交的各个阶段的时间以及提交的数据块的数量。 2014 年 2 月 13 日
FETCH 单一节点集群 对单一节点集群使用光标时,可以使用 FETCH 命令提取的最大行数是 1000。单一节点集群不支持使用 FETCH FORWARD ALL。 2014 年 2 月 13 日
DS_DIST_ALL_INNER 重新分配策略 EXPLAIN 计划输出中的 DS_DIST_ALL_INNER 指明整个内部表已重新分配到一个切片,因为外部表使用 DISTSTYLE ALL。有关更多信息,请参阅 联接类型示例评估查询计划 2014 年 1 月 13 日
查询的新系统表 Amazon Redshift 已添加新的系统表,客户可以使用它们来评估查询的执行情况,以进行优化和进行问题排查。有关更多信息,请参阅 SVL_COMPILESTL_SCANSTL_RETURNSTL_SAVE STL_ALERT_EVENT_LOG 2014 年 1 月 13 日
单节点光标 单一节点集群现在支持光标。单一节点集群一次能打开两个光标,结果集最大为 32 GB。在单一节点集群上,我们建议将 ODBC 缓存大小参数设置为 1000。有关更多信息,请参阅 DECLARE 2013 年 12 月 13 日
ALL 分配方式 ALL 分配可以显著缩短特定类型查询的执行时间。当表使用 ALL 分配方式时,该表的一个副本将分配到每个节点。因为该表有效地与其他每个表并置,因此在执行查询期间无需重新分配。ALL 分配并不适用于所有表,因为它会增加存储要求和加载时间。有关更多信息,请参阅 选择数据分配方式 2013 年 11 月 11 日
从远程主机执行 COPY 除了从 Amazon S3 上的数据文件和从 Amazon DynamoDB 表加载表之外,COPY 命令可以从 Amazon EMR 集群、Amazon EC2 实例和其他使用 SSH 连接的远程主机加载文本数据。Amazon Redshift 使用多个同时运行的 SSH 连接并行读取和加载数据。有关更多信息,请参阅 从远程主机加载数据 2013 年 11 月 11 日
WLM 内存使用率 您可以在工作负载管理 (WLM) 配置中为每个查询指定具体的内存百分比,来实现工作负载的平衡。有关更多信息,请参阅 定义查询队列 2013 年 11 月 11 日
APPROXIMATE COUNT(DISTINCT) 使用 APPROXIMATE COUNT(DISTINCT) 的查询执行速度更快,相对错误率大约为 2%。APPROXIMATE COUNT(DISTINCT) 行数使用 HyperLogLog 算法。有关更多信息,请参见 COUNT 函数 2013 年 11 月 11 日
用于检索最近的查询详细信息的新 SQL 函数 四个新的 SQL 函数可以检索有关最近查询和 COPY 命令的详细信息。这四个新函数让查询系统日志表更简单易行,而且在很多时候,可以无需访问系统表即提供必要的详细信息。有关更多信息,请参阅 PG_BACKEND_PID()PG_LAST_COPY_ID()PG_LAST_COPY_COUNT()PG_LAST_QUERY_ID() 2013 年 11 月 1 日
UNLOAD 的 MANIFEST 选项 UNLOAD 命令的 MANIFEST 选项可以补充 COPY 命令的 MANIFEST 选项。使用带 MANIFEST 选项的 UNLOAD 命令可自动创建一个清单文件,该文件显式列出了卸载操作在 Amazon S3 上创建的数据文件。然后您可以在 COPY 命令中使用该清单文件来加载数据。有关更多信息,请参阅 将数据卸载到 Amazon S3UNLOAD 示例 2013 年 11 月 1 日
COPY 的 MANIFEST 选项 您可以使用带 MANIFEST 选项的 COPY 命令来显式列出将要从 Amazon S3 加载的数据文件。 2013 年 10 月 18 日
用于对查询进行问题排查的系统表 为用于对查询进行问题排查的系统表添加了文档。用于记录的 STL 表 部分闲置包含以下系统表的文档:STL_AGGR、STL_BCAST、STL_DIST、STL_DELETE、STL_HASH、STL_HASHJOIN、STL_INSERT、STL_LIMIT、STL_MERGE、STL_MERGEJOIN、STL_NESTLOOP、STL_PARSE、STL_PROJECT、STL_SCAN、STL_SORT、STL_UNIQUE 和 STL_WINDOW。 2013 年 10 月 3 日
CONVERT_TIMEZONE 函数 CONVERT_TIMEZONE 函数 将一个时区的时间戳转换为另一个时区的时间戳,包含用于自动调整为夏令时的选项。 2013 年 10 月 3 日
SPLIT_PART 函数 SPLIT_PART 函数 用指定的分隔符拆分字符串,并返回指定位置的部分内容。 2013 年 10 月 3 日
STL_USERLOG 系统表 STL_USERLOG 记录创建、修改或删除数据库用户时发生的更改的详细信息。 2013 年 10 月 3 日
LZO 列编码和 LZOP 文件压缩。 LZO 列压缩编码既有非常高的压缩率,又有很好的性能。从 Amazon S3 进行 COPY 支持加载使用 LZOP 压缩进行压缩的文件。 2013 年 9 月 19 日
JSON、正则表达式和光标 添加了对分析 JSON 字符串的支持,使用正则表达式的模式匹配,以及使用光标通过 ODBC 连接检索大型数据集。有关更多信息,请参阅JSON 函数模式匹配条件DECLARE 2013 年 9 月 10 日
COPY 的 ACCEPTINVCHAR 选项 通过指定带 ACCEPTINVCHAR 选项的 COPY 命令,您可以成功地加载包含无效的 UTF-8 字符的数据。 2013 年 8 月 29 日
COPY 的 CSV 选项 COPY 命令现在支持从 CSV 格式的输入文件加载。 2013 年 8 月 9 日
CRC32 CRC32 函数 执行循环冗余检验。 2013 年 8 月 9 日
WLM 通配符 工作负载管理 (WLM) 支持在向队列添加用户组和查询组时使用通配符。有关更多信息,请参阅 通配符 2013 年 8 月 1 日
WLM 超时 要限制允许查询在给定 WLM 队列中停留的时间,您可以为每个队列设置 WLM 超时。有关更多信息,请参阅 WLM 超时 2013 年 8 月 1 日
新的 COPY 复制选项“auto”和“epochsecs” COPY 命令可执行自动的日期和时间格式识别。新的时间格式“epochsecs”和“epochmillisecs”可让 COPY 加载纪元格式的数据。 2013 年 7 月 25 日
CONVERT_TIMEZONE 函数 CONVERT_TIMEZONE 函数 将一个时区的时间戳转换为另一个时区的时间戳。 2013 年 7 月 25 日
FUNC_SHA1 函数 FUNC_SHA1 函数 使用 SHA1 算法转换字符串。 2013 年 7 月 15 日
max_execution_time 要限制允许使用的队列时间,您可以在配置 WLM 期间设置 max_execution_time 参数。有关更多信息,请参阅 修改 WLM 配置 2013 年 7 月 22 日
四字节的 UTF-8 字符 VARCHAR 数据类型现在支持四字节的 UTF-8 字符。不支持 5 个字节或更长的 UTF-8 字符。有关更多信息,请参阅 存储和范围 2013 年 7 月 18 日
SVL_QERROR SVL_QERROR 系统视图已淘汰。 2013 年 7 月 12 日
文件历史记录进行了修订 “文档历史记录”页面现在显示文档的更新日期。 2013 年 7 月 12 日
STL_UNLOAD_LOG STL_UNLOAD_LOG 记录卸载操作的详细信息。 2013 年 7 月 5 日
JDBC 提取大小参数 为了避免在使用 JDBC 检索大型数据集时出现客户端内存不足错误,您可通过设置 JDBC 提取大小参数来使您的客户端能够成批提取数据。有关更多信息,请参阅 设置 JDBC 提取大小参数 2013 年 6 月 27 日
UNLOAD 加密的文件 UNLOAD 现在支持向 Amazon S3 上的加密文件卸载表数据。 2013 年 5 月 22 日
临时凭证 COPYUNLOAD 现在支持使用临时凭证。 2013 年 4 月 11 日
已添加说明 “设计表”和“上载数据”的讨论更加清晰并有所扩充。 2013 年 2 月 14 日
添加了最佳实践 添加了设计表的最佳实践加载数据的最佳实践 2013 年 2 月 14 日
阐明了密码限制 阐明了针对 CREATE USER 和 ALTER USER 的密码限制,做出多处小修订。 2013 年 2 月 14 日

新指南

这是 Amazon Redshift 开发人员指南的首次发行。 2013 年 2 月 14 日