Amazon Redshift 集群 - Amazon Redshift
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Redshift 集群

在以下部分中,您可以通过启动一组计算节点(称为 Amazon Redshift 集群)了解创建数据仓库的基础知识。

Amazon Redshift 集群概述

Amazon Redshift 数据仓库是一个由称作节点的各种计算资源构成的集合,这些节点已整理到名为集群的组中。每个集群运行一个 Amazon Redshift 引擎并包含一个或多个数据库。

注意

目前提供 Amazon Redshift 版本 1.0 引擎。不过,随着引擎不断更新,我们可能会提供多个 Amazon Redshift 引擎版本供您选择。

Amazon Redshift 中的集群和节点

Amazon Redshift 集群由节点组成。每个集群包括一个领导节点以及一个或多个计算节点。领导节点接收来自客户端应用程序的查询、解析查询并制定查询执行计划。然后,领导节点和计算节点协调这些计划并行执行,之后,领导节点聚合来自计算节点的中间结果。然后,领导节点会将这些结果最终返回至客户端应用程序。

计算节点执行查询执行计划,并在节点自身之间传输数据以对这些查询提供服务。中间结果被送回至客户端应用程序之前,会先发送至领导节点进行聚合。有关领导节点和计算节点的更多信息,请参阅 https://docs.amazonaws.cn/redshift/latest/dg/c_high_level_system_architecture.html 中的数据仓库系统架构Amazon Redshift Database Developer Guide。

在 Amazon Redshift 控制台 (https://console.amazonaws.cn/redshift/) 上创建集群时,您可以获得基于数据和查询特征的集群配置建议。要使用此大小调整计算器,请在支持 RA3 节点类型的 AWS 区域中,在控制台上查找 Help me choose (帮助我选择)。有关更多信息,请参阅创建集群

当您启动集群时,您指定的一个选项是节点类型。节点类型决定了每个节点的 CPU、RAM、存储容量和存储驱动类型。

Amazon Redshift 提供不同的节点类型以满足您的工作负载要求,我们建议根据所需的性能、数据大小和预期数据增长选择 RA3 或 DC2。

通过使用具有托管存储的 RA3 节点,您可以单独扩展和支付计算和托管存储以优化数据仓库。通过使用 RA3,您可以根据性能要求选择节点数,并且仅为您使用的托管存储支付费用。根据您每天处理的数据量调整 RA3 集群大小。您可以在 Virtual Private Cloud (VPC) 中启动使用 RA3 节点类型的集群。您无法在 EC2-Classic 中启动 RA3 集群。有关更多信息,请参阅在 VPC 中创建集群.

Amazon Redshift 托管存储在每个 RA3 节点中使用大型高性能 SSDs 实现快速本地存储,并使用 Amazon S3 实现长期持久存储。如果节点中的数据超出大型本地 SSDs 的大小,Amazon Redshift 托管存储会自动将该数据卸载到 Amazon S3。无论数据位于高性能 Amazon Redshift 还是 SSDs 中,您为 Amazon S3 托管存储支付相同的较低费用。对于需要不断增长的存储的工作负载,您可以通过托管存储自动扩展数据仓库存储容量,而不添加额外节点和支付费用。

通过使用 DC2 节点,您可以创建包含本地 SSD 存储的计算密集型数据仓库。您可以根据数据大小和性能要求选择所需的节点数。DC2 节点在本地存储数据以获得较高的性能;随着数据大小增长,您可以添加更多计算节点以增加集群的存储容量。对于 1 TB 以下的数据集(压缩),我们建议使用 DC2 节点类型,从而以最低的价格获得最佳的性能。如果预计数据将会增长,我们建议您使用 RA3 节点,以便单独调整计算和存储大小以降低价格并提高性能。您可以在 Virtual Private Cloud (VPC) 中启动使用 DC2 节点类型的集群。您无法在 EC2-Classic 中启动 DC2 集群。有关更多信息,请参阅在 VPC 中创建集群

通过使用 DS2 节点,您可以使用硬盘驱动器 (HDD) 创建大型数据仓库,我们建议您改用 RA3 节点。如果您使用 DS2 节点,请参阅升级到 RA3 节点类型以了解升级准则。如果使用 8 个或更多 ds2.xlarge 节点或任意数量的 ds2.8xlarge 节点,您现在可以升级到 RA3,从而以相同的按需成本获得 2 倍的存储和更高的性能。

节点类型有各种不同的大小。节点大小和节点数决定了集群的总存储容量。有关更多信息,请参阅节点类型详细信息

一些节点类型允许一个节点(单节点)或者两个/更多节点(多节点)。某些节点类型的集群的最小节点数为两个节点。在单节点集群上,该节点由领导功能和计算功能共用。不建议使用单节点集群运行生产工作负载。在多节点集群上,领导节点与计算节点是分开的。领导节点与计算节点的节点类型相同。您仅需为计算节点付费。

Amazon Redshift 将配额应用于每个 AWS 区域中的每个 AWS 账户的资源。配额 限制您的账户可以在 AWS 区域中为给定资源类型(如节点或快照)创建的资源数。有关适用于 Amazon Redshift 资源的默认配额的更多信息,请参阅 中的 Amazon Redshift 限制Amazon Web Services 一般参考要申请增加限制,请提交 Amazon Redshift 限制增加表单

您的集群成本取决于 AWS 区域、节点类型、节点数以及 是否提前预留节点。有关节点成本的更多信息,请参阅 Amazon Redshift 定价页面。

节点类型详细信息

以下各表总结了每个节点类型和大小的节点规范。表中的标题具有以下含义:

  • vCPU 是每个节点的虚拟 CPUs 数。

  • RAM 指的是每个节点的内存量,以吉字节 (GiB) 为单位。

  • 每个节点的默认切片数 是指,在创建集群或使用经典调整大小调整集群大小时,将计算节点划分到的切片数。

    如果使用弹性调整大小来调整集群大小,则每个节点的切片数可能会发生变化。不过,在进行弹性调整大小后,集群中所有计算节点上的切片总数将保持不变。

    在使用从快照中还原操作创建集群时,如果更改节点类型,创建的集群的切片数可能与原始集群不同。

  • 存储指的是每个节点的容量和存储类型。

  • 节点范围 指的是针对节点类型和大小,Amazon Redshift 支持的最少和最多节点数。

    注意

    根据应用到所选 AWS 区域中您的 AWS 账户的配额,您可能只能使用少量节点。要申请增加限制,请提交 Amazon Redshift 限制增加表单

  • 总容量 指的是集群的总存储容量(如果您部署了节点范围中指定的最大数目的节点)。

R3 节点类型
节点大小 vCPU RAM (GiB) 每个节点的默认切片数 每个节点的托管存储配额 创建集群的节点范围 总托管存储容量
ra3.xlplus 4 32 2 32TB1 2–162 1024TB24
ra3.4xlarge 12 96 4 64 TB1 2–323 4096TB334
ra3.16xlarge 48 384 16 128TB1 2–128 16384TB4

1 表示 Amazon Redshift 托管存储的存储配额。

2 可以使用 16 个节点创建 ra3.xlplus 节点类型,但通过弹性调整大小将节点的大小调整为最多 32 个节点。

3 可以使用 32 个节点创建 ra3.4xlarge 节点类型,但可以将弹性调整大小调整为最多 64 个节点。

4 总托管存储配额是每个节点的最大节点数乘以托管存储配额。

密集存储节点类型
节点大小 vCPU RAM (GiB) 每个节点的默认切片数 每个节点的存储 节点范围 总容量
ds2.xlarge 4 31 2 2TB HDD 1–32 64 TB
ds2.8xlarge 36 244 16 16TB HDD 2–128 2PB
密集计算节点类型
节点大小 vCPU RAM (GiB) 每个节点的默认切片数 每个节点的存储 节点范围 总容量
dc2.large 2 15 2 160GB NVMe-SSD 1–32 5.12 TB
dc2.8xlarge 32 244 16 2.56TB NVMe-SSD 2–128 326 TB
dc1.large1 2 15 2 160GB SSD 1–32 5.12 TB
dc1.8xlarge1 32 244 32 2.56TB SSD 2–128 326 TB

1 我们建议使用 DC2 节点类型,而不是 DC1 节点类型。有关如何升级的更多信息,请参阅从 DC1 节点类型升级到 DC2 节点类型

以前的节点类型名称

在先前的 Amazon Redshift 版本中,某些节点类型的名称不同。您可以在 Amazon Redshift API 和 AWS CLI 中使用以前的名称。但是,我们建议您更新引用这些名称的所有脚本,以改用当前名称。当前名称和之前的名称如下所示。

当前名称 以前的名称
ds2.xlarge ds1.xlarge、dw.hs1.xlarge、dw1.xlarge
ds2.8xlarge ds1.8xlarge、dw.hs1.8xlarge、dw1.8xlarge
dc1.large dw2.large
dc1.8xlarge dw2.8xlarge

确定节点数

由于 Amazon Redshift 在集群的所有计算节点中并行分配和执行查询,因此,您可以通过向集群添加节点来提高查询性能。在运行具有至少两个计算节点的集群时,每个节点上的数据将镜像到其他节点的磁盘上,从而降低数据丢失的风险。

您可以在 Amazon Redshift console 中通过 Amazon CloudWatch 指标监控查询性能。您还可以根据需要添加或删除节点,以便在集群的价格和性能之间达到平衡。当您请求额外节点时,Amazon Redshift 会处理部署、负载均衡和数据维护方面的所有详细信息。有关集群性能的更多信息,请参阅监控 Amazon Redshift 集群性能

预留节点适合状态稳定的生产工作负载,可以提供比按需节点大得多的折扣。在运行试验和概念验证以验证生产配置后,您可以购买预留节点。有关更多信息,请参阅购买 Amazon Redshift 预留节点

在暂停集群时,您可以在集群暂停期间暂停按需计费。在该暂停时间内,您仅需为备份存储付费。这可避免规划和购买超出需求的数据仓库容量,并使您能够经济高效地管理环境以进行开发或测试。

有关按需和预留节点定价的信息,请参阅 Amazon Redshift 定价

在创建集群时使用 EC2-VPC

Amazon Redshift 集群在为您选择的 Amazon EC2 节点类型和大小配置的 Amazon Redshift 实例中运行。使用 EC2-VPC 创建集群。如果您仍在使用 EC2-Classic,我们建议您使用 EC2-VPC 以提高性能和安全性。有关这些网络平台的更多信息,请参阅 https://docs.amazonaws.cn/AWSEC2/latest/UserGuide/ec2-supported-platforms.html 中的支持的平台Amazon EC2 用户指南(适用于 Linux 实例)。您的 AWS 账户设置决定了您可以使用 EC2-VPC 还是 EC2-Classic。

注意

为了防止 SQL 客户端工具与 Amazon Redshift 数据库之间出现连接问题,建议执行下列两项操作之一。您可以配置一个允许主机协商数据包大小的入站规则。或者,您可以通过在 Amazon EC2 实例的网络接口 (NIC) 上将最大传输单位 (MTU) 设置为 1500 来禁用 TCP/IP 巨型帧。有关这些方法的更多信息,请参阅查询似乎挂起,有时无法连接到集群

EC2-VPC

在使用 EC2-VPC 时,集群在逻辑上与您的 AWS 账户隔离的 Virtual Private Cloud (VPC) 中运行。如果您在 EC2-VPC 中预置集群,则可以将一个或多个 VPC 安全组与集群关联以控制对集群的访问。有关更多信息,请参阅 https://docs.amazonaws.cn/AmazonVPC/latest/UserGuide/VPC_SecurityGroups.html 中的Amazon VPC 用户指南您的 VPC 的安全组

要在 VPC 中创建集群,您必须先通过提供 VPC 的子网信息来创建一个 Amazon Redshift 集群子网组,然后在启动集群时提供该子网组。有关更多信息,请参阅Amazon Redshift 集群子网组

有关 Amazon Virtual Private Cloud (Amazon VPC) 的更多信息,请参阅 Amazon VPC 产品详细信息页面

EC2-Classic

在 EC2-Classic 中,集群在一个与其他 AWS 客户共享的扁平化网络中运行。如果您在 EC2-Classic 中预置集群,则可以将一个或多个 Amazon Redshift 集群安全组与集群关联以控制对集群的访问。有关更多信息,请参阅Amazon Redshift 集群安全组

启动集群

您的 AWS 账户可以按区域启动 EC2-VPC 和 EC2-Classic 实例,或者仅启动 EC2-VPC 实例。要确定您的账户支持哪种网络平台并随后启动集群,请执行以下操作:

  1. 确定要部署集群的 AWS 区域。有关可使用 AWS 的 Amazon Redshift 区域的列表,请参阅 Amazon Redshift 中的 终端节点。Amazon Web Services 一般参考

  2. 找出您的账户在所选 AWS 区域中支持的 Amazon EC2 平台。您可以在 Amazon EC2 控制台中找到这些信息。有关分步说明,请参阅 https://docs.amazonaws.cn/AWSEC2/latest/UserGuide/ec2-supported-platforms.html 中的支持的平台Amazon EC2 用户指南(适用于 Linux 实例)。

  3. 如果您的账户支持这两种平台,我们建议使用 EC2-VPC。如果您的账户仅支持 EC2-VPC,则必须在 VPC 中部署集群。

  4. 启动 Amazon Redshift 集群。您可以使用 Amazon Redshift console、Amazon Redshift API、AWS CLI 或开发工具包库创建集群。有关这些选项的更多信息以及相关文档的链接,请参阅什么是 Amazon Redshift?

RA3 节点类型概述

我们建议您将 DS2 节点类型集群上运行的现有工作负载升级到 RA3 节点类型,以利用提升的性能并获得更多的存储容量。RA3 节点具有以下优点:

  • 它们可以灵活地增加计算容量,而不增加存储成本。此外,它们可以扩展存储,而不会超额预置计算容量。

  • 它们将高性能 SSDs 用于热数据,并将 Amazon S3 用于冷数据。因此,它们提供了易用性、经济高效的存储以及较高的查询性能。

  • 它们使用在 AWS Nitro 系统上构建的高带宽网络,以进一步减少将数据卸载到 Amazon S3 以及从中检索数据所花的时间。

在以下情况下,请考虑选择 RA3 节点类型:

  • 您需要将计算与存储分开,以灵活地扩展和支付费用。

  • 您查询的数据占总数据的一小部分。

  • 数据量正在迅速增长,或者预计会迅速增长。

  • 您希望仅根据性能需求灵活地调整集群大小。

要使用 RA3 节点类型,您的 AWS 区域必须支持 RA3。有关更多信息,请参阅AWS 区域中的 RA3 节点类型可用性

重要

只能对集群版本 1.0.21262 或更高版本使用 ra3.xlplus 节点类型。您可以使用 Amazon Redshift 控制台查看现有集群的版本。有关更多信息,请参阅确定集群维护版本

请确保在使用 RA3 节点类型时使用新的 Amazon Redshift 控制台。原始控制台并不支持所有 RA3 操作。

此外,要将 RA3 节点类型与使用维护跟踪的 Amazon Redshift 操作结合使用,必须将维护跟踪值设置为支持 RA3 的集群版本。有关维护跟踪的更多信息,请参阅选择集群维护跟踪

使用 Amazon Redshift 托管存储

借助 Amazon Redshift 托管存储,您可以在 Amazon Redshift 中存储和处理所有数据,同时可以更灵活地分别扩展计算容量和存储容量。您继续使用 COPY 或 INSERT 命令提取数据。 为了优化性能并管理跨存储层的自动数据放置,Amazon Redshift 利用诸如数据块温度、数据块使用期限和工作负载模式等优化功能。需要时,Amazon Redshift 自动将存储扩展到 Amazon S3,而无需任何手动操作。

有关存储成本的信息,请参阅 Amazon Redshift 定价

管理 RA3 节点类型

要利用将计算与存储分开的优势,您可以使用 RA3 节点类型创建或升级集群。要使用 RA3 节点类型,请在 Virtual Private Cloud (EC2-VPC) 中创建集群。

要更改具有 RA3 节点类型的 Amazon Redshift 集群的节点数,请执行以下操作之一:

  • 使用弹性调整大小操作添加或删除节点。在某些情况下,不允许使用弹性调整大小从 RA3 集群中删除节点。例如,在 2:1 节点计数升级将每个节点的切片数设置为 32 时。有关更多信息,请参阅调整集群大小。如果弹性调整大小不可用,请使用经典调整大小。

  • 使用经典调整大小操作添加或删除节点。当您将大小调整为无法通过弹性调整大小实现的配置时,请选择此选项。弹性调整大小比经典调整大小更快。有关更多信息,请参阅 调整集群大小

AWS 区域中的 RA3 节点类型可用性

RA3 节点类型仅在以下 AWS 区域中可用:

  • 美国东部(弗吉尼亚北部)地区(us-east-1)

  • 美国东部(俄亥俄)区域(us-east-2)

  • 美国西部(加利福利亚北部)区域 (us-west-1)

  • 美国西部(俄勒冈)区域(us-west-2)

  • 亚太地区(孟买)区域 (ap-south-1) – 目前不支持 ra3.xlplus

  • 亚太区域(首尔) (ap-northeast-2)

  • 亚太区域(新加坡) (ap-southeast-1) – 目前不支持 ra3.xlplus

  • 亚太区域(悉尼) (ap-southeast-2)

  • 亚太区域(东京) (ap-northeast-1)

  • 加拿大 (中部) 区域 (ca-central-1)

  • 欧洲(法兰克福)区域 (eu-central-1) – 目前不支持 ra3.xlplus

  • 欧洲(爱尔兰)区域(eu-west-1)

  • 欧洲(伦敦)区域(eu-west-2)

  • 欧洲(巴黎)区域 (eu-west-3)

  • 欧洲(斯德哥尔摩)区域 (eu-north-1) – 目前不支持 ra3.xlplus

  • 南美洲(圣保罗)区域 (sa-east-1)

升级到 RA3 节点类型

要将现有节点类型升级到 RA3,您可以使用以下方法更改节点类型:

  • 从快照中还原 – Amazon Redshift 使用 DS2 或 DC2 集群的最新快照,并还原该快照以创建新的 RA3 集群。在集群创建完成后(通常在几分钟内),RA3 节点可以立即运行全部生产工作负载。由于计算与存储分开并具有较大的网络带宽,因此,可以快速地将热数据存储到本地缓存中。如果您从最新的 DS2 或 DC2 快照还原,则 RA3 将保留 DS2 或 DC2 工作负载的热数据块信息,并使用最热的数据块填充其本地缓存。 有关更多信息,请参阅从快照还原集群

    要为应用程序和用户保持相同的终端节点,可以使用与原始 DS2 或 DC2 集群相同的名称重命名新的 RA3 集群。要重命名集群,请在 Amazon Redshift 控制台或 ModifyCluster API 操作中修改集群。有关更多信息,请参阅 重命名集群 中的 ModifyCluster API 操作。Amazon Redshift API Reference

  • 弹性调整大小 – 使用弹性调整大小调整集群大小。在使用弹性调整大小更改节点类型时,Amazon Redshift 自动创建快照,创建新的集群,删除旧集群并重命名新集群。可以按需运行弹性调整大小操作,也可以计划在将来的时间运行。您可以使用弹性调整大小将现有的 DS2 或 DC2 节点类型集群快速升级到 RA3。有关更多信息,请参阅弹性调整大小

下表显示了在升级到 RA3 节点类型时的建议。

现有的节点类型 现有节点数的范围 建议的新节点类型 升级操作

ds2.xlarge

1–7

ra3.xlplus

为每 3 个 ds2.xlarge 节点创建 2 个 ra3.xlplus 节点。

ds2.xlarge

8–128

ra3.4xlarge

为每 4 个 ds2.xlarge 节点创建 1 个 ra3.4xlarge 节点。

ds2.8xlarge

2–15

ra3.4xlarge

为每 1 个 ds2.8xlarge 节点创建 2 个 ra3.4xlarge 节点。

ds2.8xlarge

16–128

ra3.16xlarge

为每 2 个 ds2.8xlarge 节点创建 1 个 ra3.16xlarge 节点。

dc2.8xlarge

2–15

ra3.4xlarge

为每 1 个 dc2.8xlarge1 节点创建 2 个 ra3.4xlarge 节点。

dc2.8xlarge

16–128

ra3.16xlarge

为每 2 个 dc2.8xlarge1 节点创建 1 个 ra3.16xlarge 节点。

dc2.large

1–4

保留现有的 dc2.large 集群。

dc2.large

4–15

ra3.xlplus

为每 8 个 dc2.large1 节点创建 3 个 ra3.xlplus 节点。

dc2.large

16–128

ra3.4xlarge

为每 8 个 dc2.large1 节点创建 1 个 ra3.4xlarge 节点。

1根据工作负载要求,可能需要使用额外的节点。请根据所需的查询性能的计算要求添加或删除节点。

RA3 集群的最小节点数为 2 个节点。在创建 RA3 集群时,请考虑到这一点。

如果您已购买 DS2 预留节点,请与 AWS 联系以获得将 DS2 预留节点转换为 RA3 预留节点的帮助。要与 AWS 联系以获取更多信息,请参阅具有托管存储的 Amazon Redshift RA3 实例

从 DC1 节点类型升级到 DC2 节点类型

为了利用提升的性能,您可以将 DC1 集群升级到 DC2 节点类型。

使用 DC2 节点类型的集群必须在 Virtual Private Cloud (EC2-VPC) 中启动。

如果您的 DC1 集群不在 VPC 中:

  1. 创建 DC1 集群的快照。有关更多信息,请参阅Amazon Redshift 快照

  2. 创建 VPC,然后在 VPC 中创建 DC2 集群。有关更多信息,请参阅在 VPC 中管理集群

  3. 将快照还原到 VPC 中的新 DC2 集群。有关更多信息,请参阅从快照还原集群

如果您的 DC1 集群已在 VPC 中,请选择以下方法之一:

  • 作为操作的一部分,调整 DC1 集群的大小并将节点类型更改为 DC2。在调整大小操作期间,您的集群在一段时间内不可用。有关更多信息,请参阅在 Amazon Redshift 中调整集群大小

  • 创建 DC1 集群的快照,然后将快照还原到 VPC 中的 DC2 集群。有关更多信息,请参阅从快照还原集群

从 DC1 升级到 DC2 节点类型时,请考虑以下事项。

  • 100% 满的 DC1 集群可能不会升级到相同数量的 DC2 节点。如果需要更多磁盘空间,您可以:

    • 调整配置的大小,使其具有更多可用磁盘空间。

    • 通过截断表或删除行来清理不需要的数据。

  • DC2 集群不支持 EC2-Classic 网络。如果您的 DC1 集群未在 VPC 中运行,请为 DC2 迁移创建一个。有关更多信息,请参阅在 VPC 中管理集群

  • 如果您调整集群的大小,则在操作持续时间内可能会将其置于只读模式。有关更多信息,请参阅在 Amazon Redshift 中调整集群大小

  • 如果您购买了 DC1 预留节点,您可以在剩余期限内将 DC1 预留节点升级到 DC2 节点。有关如何使用 AWS CLI 更改预留的更多信息,请参阅使用 AWS CLI 升级预留节点

  • 如果使用还原从 dc1.large 升级到 dc2.large,并更改节点数量,则必须在集群版本 1.0.10013 或更高版本创建快照。

  • 如果使用还原从 dc1.8xlarge 升级到 dc2.8xlarge,则必须在集群版本 1.0.10013 或更高版本创建快照。

  • 如果使用弹性调整大小从 DC1 升级到 DC2,并更改节点数量,则集群必须为 1.0.10013 或更高版本。

  • 如果要升级的 dc1.8xlarge 集群的快照来自版本 1.0.10013 之前的集群,则首先将 dc1.8xlarge 集群中的快照还原到具有相同节点数的新 dc1.8xlarge 集群。然后,使用以下方法之一升级新的 dc1.8xlarge:

    • 使用新还原的集群中的快照升级到 dc2.8xlarge。

    • 使用弹性调整大小将新的还原的集群升级到 dc2.8xlarge。

将 EC2-Classic 上的 DS2 集群升级到 EC2-VPC

Amazon Redshift 集群在为您选择的 Amazon EC2 节点类型和大小配置的 Amazon Redshift 实例中运行。我们建议您升级 EC2-Classic 上的集群,以使用 EC2-VPC 在 VPC 中启动,从而提高性能和安全性。

将 EC2-Classic 上的 DS2 集群升级到 EC2-VPC

  1. 创建 DS2 集群的快照。有关更多信息,请参阅Amazon Redshift 快照

  2. 创建 VPC,然后在 VPC 中创建 DS2 集群。有关更多信息,请参阅在 VPC 中管理集群

  3. 将您的快照还原到 VPC 中的新 DS2 集群。有关更多信息,请参阅从快照还原集群

区域和可用区注意事项

可以在多个 AWS 区域使用 Amazon Redshift。默认情况下,Amazon Redshift 在所选的 AWS 区域内随机选择的可用区 (AZ) 中预置集群。所有集群节点是在同一可用区中预置的。

您可以选择请求特定的可用区(如果 Amazon Redshift 在该区域中可用)。例如,如果您已在某个可用区中运行 Amazon EC2 实例,您可能希望在同一可用区中创建 Amazon Redshift 集群以减少延迟。另一方面,您可能希望选择另一个可用区以获得更高的可用性。Amazon Redshift 可能并非在 AWS 区域内的所有可用区中都可用。

有关可以在其中预配置 Amazon Redshift 集群的受支持 AWS 区域的列表,请参阅 Amazon Redshift 中的 终端节点Amazon Web Services 一般参考。

集群维护

Amazon Redshift 定期执行维护以升级您的集群。在此类更新期间,无法对 Amazon Redshift 集群执行常规操作。您可以通过多种方式控制维护集群的方法。例如,您可以控制将更新部署到集群的时间。您还可以选择集群是运行最近发行的版本,还是运行以前发行的版本并升级到最近发行的版本。最后,您可以选择将非强制性维护更新推迟一段时间。

维护时段

Amazon Redshift 从 8 小时时间段中为每个 AWS 区域随机分配 30 分钟的维护时段,从而随机在一周内的某一天(周一至周日)执行维护。

默认维护时段

以下列表显示了为每个 AWS 区域分配默认维护时段的时间段:

  • 美国东部(弗吉尼亚北部) 地区: 03:00–11:00 UTC

  • 美国东部(俄亥俄州) 地区: 03:00–11:00 UTC

  • 美国西部(加利福尼亚北部) 地区: 06:00–14:00 UTC

  • 美国西部(俄勒冈) 地区: 06:00–14:00 UTC

  • 非洲(开普敦) 地区: 20:00–04:00 UTC

  • 亚太地区(香港) 地区: 13:00–21:00 UTC

  • 亚太地区(孟买) 地区: 16:30–00:30 UTC

  • 亚太区域 (大阪当地) 地区: 13:00–21:00 UTC

  • 亚太区域(首尔) 地区: 13:00–21:00 UTC

  • 亚太区域(新加坡) 地区: 14:00–22:00 UTC

  • 亚太区域(悉尼) 地区: 12:00–20:00 UTC

  • 亚太区域(东京) 地区: 13:00–21:00 UTC

  • 加拿大 (中部) 地区: 03:00–11:00 UTC

  • 中国(北京) 地区: 13:00–21:00 UTC

  • 中国 (宁夏) 地区: 13:00–21:00 UTC

  • 欧洲(法兰克福) 地区: 06:00–14:00 UTC

  • 欧洲(爱尔兰) 地区: 22:00–06:00 UTC

  • 欧洲(伦敦) 地区: 22:00–06:00 UTC

  • 欧洲(米兰) 地区: 21:00–05:00 UTC

  • 欧洲(巴黎) 地区: 23:00–07:00 UTC

  • 欧洲(斯德哥尔摩) 地区: 23:00–07:00 UTC

  • 中东(巴林) 地区: 13:00–21:00 UTC

  • 南美洲(圣保罗) 地区: 19:00–03:00 UTC

如果在指定周内安排了维护事件,则维护将在分配的 30 分钟维护时段内启动。当 Amazon Redshift 执行维护时,它会终止正在进行的任何查询或其他操作。大多数维护都将在 30 分钟的维护时段内完成,但某些维护任务可能在此时段结束后继续运行。如果在计划的维护时段没有要执行的维护任务,您的集群会在下个计划维护时段到来之前继续正常运行。

您可以通过编程方式或使用 Amazon Redshift console 对集群进行修改来更改计划的维护时段。该时段必须至少为 30 分钟,但不得超过 24 小时。有关更多信息,请参阅使用控制台管理集群

推迟维护

如果需要重新计划集群的维护时段,您可以选择将维护最多延迟 45 天。例如,如果集群的维护时段设置为星期三 8:30 – 9:00 UTC,并且您需要在该时间访问集群,则可以将维护推迟到以后的时间段。除非我们需要更新硬件,否则在您指定推迟时,我们不会对您的集群执行任何维护。

如果我们需要在您推迟期间更新硬件或进行其他强制更新,我们会通知您并进行必要的更改。在这些更新期间,您的集群不可用。

如果您推迟了集群的维护,则推迟时段后的维护时段是强制实施的。不能将它推迟。

注意

维护一旦开始便无法推迟。

有关更多信息,请参阅修改集群

选择集群维护跟踪

当 Amazon Redshift 发布新的集群版本时,您的集群将在其维护时段内更新。您可以控制集群是更新为最新的经审批版本还是先前版本。

维护跟踪控制将在维护时段内应用的集群版本。当 Amazon Redshift 发布新的集群版本时,该版本将分配给最新 跟踪,上一个版本将分配给尾随 跟踪。要为集群设置维护跟踪,请指定下列值之一:

  • 最新 – 使用最新的经批准的集群版本。

  • 尾随 – 使用最新版本之前的集群版本。

  • Preview (预览) – 使用包含可用于预览的新功能的集群版本。

例如,假设您的集群当前正在运行版本 1.0.2762,而 Amazon Redshift 的最新版本为 1.0.3072。如果将维护跟踪值设置为 Current (当前),则您的集群在下一个维护时段内将更新为版本 1.0.3072(下一个经审批的版本)。如果您将维护跟踪值设置成 Trailing (尾随),则在 1.0.3072 后面的新版本出现之前,您的集群不会更新。

预览跟踪

Preview (预览) 跟踪可能并非总是可以选择。在选择 Preview (预览) 跟踪时,还必须选择跟踪名称。预览跟踪及其相关资源是临时的,具有功能限制,并且可能不包含其他跟踪中可用的所有当前 Amazon Redshift 功能。在使用预览跟踪时:

  • 使用预览跟踪时,使用新的 Amazon Redshift 控制台。例如,当您创建要与预览功能一起使用的集群时。

  • 无法将集群从一个预览跟踪切换到另一个预览跟踪。

  • 无法将集群从当前跟踪或尾随跟踪切换到预览跟踪。

  • 无法从通过其他预览跟踪创建的快照中还原。

  • 只能在创建新集群或从快照还原时使用预览跟踪。

  • 您不能从通过其他预览跟踪创建的快照中进行还原,也不能使用晚于预览跟踪集群版本的集群维护版本进行还原。例如,在将集群还原到预览跟踪时,您只能使用通过早于预览跟踪的集群维护版本创建的快照。

在维护跟踪之间切换

更改集群的跟踪通常是一个一次性的决定。更改跟踪时要慎重。如果您将维护跟踪从 Trailing (尾随) 更改为 Current (最新),我们将在下一个维护时段内将集群更新为 Current (最新) 跟踪发布版。不过,如果您将集群的维护跟踪更改为 Trailing (尾随),则在 Current (最新) 跟踪发布版之后的新版本出现之前,我们不会更新您的集群。

维护跟踪和还原

快照将继承源集群的维护跟踪。如果您在制作快照后更改源集群的维护跟踪,则快照和源集群将位于不同的跟踪上。当您从快照进行还原时,新集群将位于从源集群继承的维护跟踪上。在还原操作完成后,您可以更改维护跟踪。调整集群的大小不会影响集群的维护跟踪。

有关更多信息,请参阅为集群设置维护跟踪

管理集群版本

维护跟踪是一系列的版本。您可以决定您的集群是在最新跟踪还是尾随跟踪上。如果您将集群放在最新跟踪上,则它在维护时段内将始终升级到最新的集群发布版。如果您将集群放在尾随跟踪上,则它将始终运行在最近发布的版本之前发布的集群发布版。

控制台集群列表中的 Release status (发布状态) 列指示您的某个集群是否可用于升级。Amazon Redshift

回滚集群版本

如果您的集群为最新版本,则您可以选择将其回滚到之前的版本。

有关每个集群版本包含的功能和改进的详细信息,请参阅 集群版本历史记录

注意

Amazon Redshift 有新的控制台可用。根据您使用的控制台,选择新控制台原始控制台说明。默认情况下会打开新控制台说明。

回滚回早期集群版本

  1. 登录 AWS 管理控制台并通过以下网址打开 Amazon Redshift 控制台:https://console.amazonaws.cn/redshift/

  2. 在导航菜单上,选择 CLUSTERS (集群)

  3. 选择要回滚的集群。

  4. 对于 Actions (操作),选择 Roll back cluster version (回滚集群版本)。这将显示 Roll back cluster version (回滚集群版本) 页面。

  5. 如果有可用于回滚的版本,请按照该页面上的说明进行操作。

  6. 选择 Roll back now (立即回滚)

回滚回早期集群版本

  1. 登录 AWS 管理控制台并通过以下网址打开 Amazon Redshift 控制台:https://console.amazonaws.cn/redshift/

  2. 在导航窗格中,选择 Clusters

  3. 选择要回滚的集群,然后选择 Status (状态) 选项卡。

    如果存在某个可回滚到的版本,它将显示在“details (详细信息)”页的“status (状态)”选项卡上。

    
                            回滚版本详细屏幕
  4. 选择Rollback to release (release number) (回滚到版本 (版本号))

确定集群维护版本

您可以使用 Amazon Redshift 控制台确定 Amazon Redshift 引擎和数据库版本。

注意

Amazon Redshift 有新的控制台可用。根据您使用的控制台,选择新控制台原始控制台说明。默认情况下会打开新控制台说明。

查找集群的版本

  1. 登录 AWS 管理控制台并通过以下网址打开 Amazon Redshift 控制台:https://console.amazonaws.cn/redshift/

  2. 在导航菜单上,选择 CLUSTERS (集群),然后从列表中选择集群名称以打开其详细信息。此时将显示集群的详细信息,包括 Cluster performance (集群性能)Query monitoring (查询监控)Maintenance and monitoring (维护和监控)Backup (备份)Properties (属性)Schedules (计划) 选项卡。

  3. 选择 Maintenance and monitoring (维护和监控) 选项卡以查看更多详细信息。

  4. Maintenance (维护) 部分中,找到 Current cluster version (当前集群版本)

注意

虽然这些信息在控制台的一个字段中显示,但在 Amazon Redshift API 中由两个参数来表示:ClusterVersionClusterRevisionNumber。 有关更多信息,请参阅 https://docs.amazonaws.cn/redshift/latest/APIReference/API_Cluster.html 中的集群Amazon Redshift API Reference。

您可以在 控制台的 Amazon RedshiftCluster Version 字段中确定集群的 引擎版本和数据库版本。该数字的前两部分表示集群版本,最后一部分表示集群中数据库的具体修订号。在以下示例中,集群版本为 1.0,数据库修订号为 884。

注意

虽然这些信息在控制台的一个字段中显示,但在 Amazon Redshift API 中由两个参数来表示:ClusterVersionClusterRevisionNumber。 有关更多信息,请参阅 https://docs.amazonaws.cn/redshift/latest/APIReference/API_Cluster.html 中的集群Amazon Redshift API Reference。

要指定是否在 Amazon Redshift 引擎的新版本可用时自动升级该引擎,请使用 Allow version upgrade (允许版本升级) 设置。该设置不影响数据库版本升级,这些升级会在您为集群指定的维护时段应用。Amazon Redshift 引擎升级属于主要版本升级,Amazon Redshift 数据库升级属于次要版本升级。您只能禁用主要版本的自动版本升级。有关次要版本升级的维护时段的更多信息,请参阅维护时段

默认磁盘空间警报

创建 Amazon Redshift 集群时,您可以选择配置一个 Amazon CloudWatch 警报来监控在集群的所有节点中已用磁盘空间所占的平均百分比。我们将此警报称为默认磁盘空间警报

默认磁盘空间警报的目的是帮助您监控集群的存储容量。您可以根据数据仓库的需要配置此警报。例如,您可以使用警告作为可能需要调整集群大小的指示器。您可以将大小调整为不同的节点类型或添加节点,或者购买预留节点以供将来扩展。

当磁盘的使用率在指定持续时间达到或超出指定百分比一定次数,则会触发默认磁盘空间警报。默认情况下,当磁盘的使用率达到您指定的百分比并保持或超出这一百分比五分钟或更长时间,则会触发此警报。启动集群后,您可以编辑默认值。

当触发 CloudWatch 警报时,Amazon Simple Notification Service (Amazon SNS) 会向指定接收方发送通知以提醒他们已达到百分比阈值。Amazon SNS 通过主题来指定接收方,并以通知的形式发送消息。您可以使用现有 Amazon SNS 主题;如果不使用的话,系统会根据您启动集群时指定的设置创建一个主题。启动集群后,您可以编辑此警报的主题。有关创建 Amazon SNS 主题的更多信息,请参阅 Amazon Simple Notification Service 入门

启动集群后,您可以从集群的 Status (状态) 窗口上的 Alarms (警报)CloudWatch 下查看和编辑警报。名称为 percentage-disk-space-used-default-<string>。 您可以打开警报以查看与它关联的 Amazon SNS 主题并编辑警报设置。如果您未选择要使用的现有 Amazon SNS 主题,则为您创建的主题将命名为 <clustername>-default-alarms (<)recipient>);例如,examplecluster-default-alarms (notify@example.com)

有关配置和编辑默认磁盘空间警报的更多信息,请参阅创建集群创建或编辑磁盘空间警报

注意

如果您将集群删除,与该集群相关联的警报不会被删除,但也不会触发。如果您不再需要该警报,可以从 CloudWatch 控制台中将其删除。

集群状态

集群状态显示了集群的当前状态。下表提供了对每个集群状态的说明。

状态 描述
available 集群正在运行且可供使用。
available, prep-for-resize 该集群正在为弹性调整大小操作做准备。集群正在运行且可用于读取和写入查询,但集群操作(例如,创建快照)不可用。
available, resize-cleanup 弹性调整大小操作正在完成到新集群节点的数据传输。集群正在运行且可用于读取和写入查询,但集群操作(例如,创建快照)不可用。
cancelling-resize 正在取消调整大小操作。
creating Amazon Redshift 正在创建集群。有关更多信息,请参阅创建集群
deleting Amazon Redshift 正在删除集群。有关更多信息,请参阅删除集群
final-snapshot Amazon Redshift 正在删除集群前对其制作最终快照。有关更多信息,请参阅删除集群
hardware-failure

集群发生了硬件故障。

如果您的集群为单节点集群,则该节点无法替换。要恢复您的集群,请还原快照。有关更多信息,请参阅Amazon Redshift 快照

incompatible-hsm Amazon Redshift 无法连接到硬件安全模块 (HSM)。检查集群和 HSM 之间的 HSM 配置。有关更多信息,请参阅使用硬件安全模块的 Amazon Redshift 加密
incompatible-network 基本网络配置出现问题。确保您在其中启动集群的 VPC 及其设置正确无误。有关更多信息,请参阅在 VPC 中管理集群
incompatible-parameters 相关联的参数组中的一个或多个参数值出现问题,此时无法应用这些参数值。修改参数组并更新所有无效值。有关更多信息,请参阅Amazon Redshift 参数组
incompatible-restore 从快照中还原集群时出现问题。使用其他快照再次尝试还原集群。有关更多信息,请参阅Amazon Redshift 快照
modifying Amazon Redshift 正在将更改应用于集群。有关更多信息,请参阅修改集群
paused 集群已暂停。有关更多信息,请参阅暂停和恢复集群
rebooting Amazon Redshift 正在重启集群。有关更多信息,请参阅重新引导集群
renaming Amazon Redshift 正在将新名称应用于集群。有关更多信息,请参阅重命名集群
resizing Amazon Redshift 正在调整集群的大小。有关更多信息,请参阅调整集群大小
rotating-keys Amazon Redshift 正在轮换集群的加密密钥。有关更多信息,请参阅Amazon Redshift 中的加密密钥轮换
storage-full 集群已达到其存储容量。调整集群的大小以添加节点或选择其他节点大小。有关更多信息,请参阅调整集群大小
updating-hsm Amazon Redshift 正在更新 HSM 配置。。