示例数据库 - Amazon Redshift
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

示例数据库

Amazon Redshift 文档中的多数示例都使用一个称为 TICKIT 的示例数据库。这个小型数据库包含七个表:两个事实表和五个维度。您可以按照《Amazon Redshift 入门指南》中的步骤 4:从 Amazon S3 将数据加载到 Amazon Redshift 中的步骤加载 TICKIT 数据集。

此示例数据库应用程序帮助分析人员跟踪虚构的 TICKIT 网站的销售活动,用户可以在该网站上在线购买和销售体育赛事、演出和音乐会的门票。具体而言,分析人员可以识别一段时间内门票的变化、卖方的成功率以及最畅销的活动、场馆和季节。分析人员可以使用这些信息向经常访问该站点的买方和卖方提供奖励,吸引新用户,以及推动广告和促销活动。

例如,下面的查询根据 2008 年销售的门票数,查找圣地亚哥排名前五的卖方:

select sellerid, username, (firstname ||' '|| lastname) as name, city, sum(qtysold) from sales, date, users where sales.sellerid = users.userid and sales.dateid = date.dateid and year = 2008 and city = 'San Diego' group by sellerid, username, name, city order by 5 desc limit 5; sellerid | username | name | city | sum ----------+----------+-------------------+-----------+----- 49977 | JJK84WTE | Julie Hanson | San Diego | 22 19750 | AAS23BDR | Charity Zimmerman | San Diego | 21 29069 | SVL81MEQ | Axel Grant | San Diego | 17 43632 | VAG08HKW | Griffin Dodson | San Diego | 16 36712 | RXT40MKU | Hiram Turner | San Diego | 14 (5 rows)

用于本指南中示例的数据库包含一个小的数据集,其中包含两个事实表,每个表包含的行数不超过 200000,维度范围从 CATEGORY 表中的 11 行到 USERS 表中的大约 50000 行。

具体而言,本指南中的数据库示例演示 Amazon Redshift 表设计的主要功能:

  • 数据分布

  • 数据排序

  • 列式压缩