在 Amazon Redshift 中创建具体化视图 - Amazon Redshift
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon Redshift 中创建具体化视图

在数据仓库环境中,应用程序通常需要对大型表执行复杂的查询 — 例如 SELECT 语句,此类语句对包含数十亿行的表执行多表联接和聚合。就系统资源和计算结果所需的时间而言,处理这些查询的成本可能会很高。

Amazon Redshift 中的具体化视图提供了解决这些问题的方法。具体化视图 包含一个预计算的结果集,该结果集基于对一个或多个基表进行的 SQL 查询。您可以发出 SELECT 语句来查询具体化视图,这与查询数据库中的其他表或视图的方式相同。Amazon Redshift 从具体化视图返回预先计算的结果,而根本不必访问基表。从用户的角度来看,与从基表中检索相同的数据相比,查询结果的返回速度要快得多。

具体化视图对于加快可预测和重复的查询特别有用。应用程序可以查询具体化视图并检索预先计算的结果集,而不是对大型表(如聚合或多个联接)执行资源密集型查询。例如,请考虑使用一组查询来填充控制面板的情况,例如 Amazon QuickSight。 该使用案例非常适合具体化视图,因为查询是可预测的,并且会反复重复。

在您创建具体化视图时,Amazon Redshift 会运行用户指定的 SQL 语句以从一个或多个基表中收集数据并存储结果集。下图概述了 tickets_mv SQL 查询使用两个基表 events 和 定义的具体化视图sales

然后,您可以在查询中使用这些具体化视图来加快它们的速度。此外, Amazon Redshift 可以自动重写这些查询以使用具体化视图,即使查询未显式引用具体化视图也是如此。当您运行查询时无法更改具体化视图时,自动重写查询在提高性能方面尤其强大。

要更新具体化视图中的数据,您可以随时使用 REFRESH MATERIALIZED VIEW 语句来手动刷新具体化视图。 Amazon Redshift 标识在一个或多个基表中发生的更改,然后将这些更改应用于具体化视图。由于自动重写查询要求具体化视图是最新的,因此作为具体化视图拥有者,请确保在基表发生更改时刷新具体化视图。

Amazon Redshift 提供了几种方法来使具体化视图保持最新,以便自动重写。您可以使用自动刷新选项配置具体化视图,以便在更新具体化视图的基础表时刷新具体化视图。自动刷新操作在集群资源可用时运行,以最大程度地减少对其他工作负载的中断。由于自动刷新的计划与工作负载相关,因此,您可以在 Amazon Redshift 刷新具体化视图时更好地控制 。您可以使用Amazon Redshift计划程序 API 和控制台集成来计划具体化视图刷新作业。有关查询计划的更多信息,请参阅 Amazon Redshift 控制台上的计划查询。当具体化视图中存在最新数据的 服务等级协议 (SLA) 要求时,执行此操作特别有用。您还可以手动刷新任何可自动刷新的具体化视图。有关如何创建具体化视图的信息,请参阅CREATE MATERIALIZED VIEW

您可以发出 SELECT 语句来查询具体化视图。有关如何查询具体化视图的信息,请参阅查询具体化视图。在基表中插入、更新和删除数据时,结果集最终会变得过时。您可以随时刷新具体化视图,以使用基表中的最新更改对其进行更新。有关如何刷新具体化视图的信息,请参阅REFRESH MATERIALIZED VIEW

有关用于创建和管理具体化视图的 SQL 命令的详细信息,请参阅以下命令主题:

有关用于监视具体化视图的系统表和视图的信息,请参阅以下主题: