Amazon Redshift
数据库开发人员指南 (API Version 2012-12-01)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。点 击 Getting Started with Amazon AWS to see specific differences applicable to the China (Beijing) Region.

示例数据库

Amazon Redshift 文档中的多数示例都使用一个称为 TICKIT 的示例数据库。这个小型数据库包含七个表:两个事实表和五个维度。您可以按照 Amazon Redshift 入门 中步骤 6:从 Amazon S3 中加载示例数据部分所述的步骤加载 TICKIT 数据集。

此示例数据库应用程序帮助分析人员跟踪虚构的 TICKIT 网站的销售活动,用户可以在该网站上在线购买和销售体育赛事、演出和音乐会的门票。具体而言,分析人员可以识别一段时间内门票的变化、卖方的成功率以及最畅销的活动、场馆和季节。分析人员可以使用这些信息向经常访问该站点的买方和卖方提供奖励,吸引新用户,以及推动广告和促销活动。

例如,下面的查询根据 2008 年销售的门票数,查找圣地亚哥排名前五的卖方:

Copy
select sellerid, username, (firstname ||' '|| lastname) as name, city, sum(qtysold) from sales, date, users where sales.sellerid = users.userid and sales.dateid = date.dateid and year = 2008 and city = 'San Diego' group by sellerid, username, name, city order by 5 desc limit 5; sellerid | username | name | city | sum ----------+----------+-------------------+-----------+----- 49977 | JJK84WTE | Julie Hanson | San Diego | 22 19750 | AAS23BDR | Charity Zimmerman | San Diego | 21 29069 | SVL81MEQ | Axel Grant | San Diego | 17 43632 | VAG08HKW | Griffin Dodson | San Diego | 16 36712 | RXT40MKU | Hiram Turner | San Diego | 14 (5 rows)

用于本指南中示例的数据库包含一个小的数据集,其中包含两个事实表,每个表包含的行数不超过 200000,维度范围从 CATEGORY 表中的 11 行到 USERS 表中的大约 50000 行。

具体而言,本指南中的数据库示例演示 Amazon Redshift 表设计的主要功能:

  • 数据分布

  • 数据排序

  • 列式压缩