第 5 步:使用 Amazon Athena 查询受管理的表 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

第 5 步:使用 Amazon Athena 查询受管理的表

现在开始查询您使用 Amazon Athena 创建的受管理表。

如果这是您第一次在 Athena 中运行查询,则需要配置查询结果位置。有关更多信息,请参阅 。指定查询结果位置.

运行简单的查询

  • 要运行简单的查询,请登录 Athena 控制台https://console.aws.amazon.com/athena/在美国东部(弗吉尼亚北部)区域中,DataAnalyst1用户。运行以下查询以预览存储在受管理表中的 10 条记录:

    SELECT * FROM lakeformation_tutorial_amazon_reviews.amazon_reviews_governed LIMIT 10

    结果如下所示:

运行分析查询

  • 运行以下脚本以运行包含聚合的分析查询以模拟真实世界的使用案例:

    SELECT product_category, count(*) as TotalReviews, avg(star_rating) as AverageRating FROM lakeformation_tutorial_amazon_reviews.amazon_reviews_governed GROUP BY product_category

    此查询返回每个产品类别的评论总数和平均评分。

使用时间旅行运行分析查询

受管辖的表可实现时间旅行 — 您可以从前一段时间查询表格。

注意

为了在 Athena 中运行时间旅行查询,你需要使用 Athena 引擎版本 2。如果您的工作组仍使用 Athena 引擎版本 1,请更新您的工作组以使用 Athena 引擎版本 2。

  • 要提交时间旅行查询,请使用FOR SYSTEM_TIME AS OF在中表名称之后的时间戳SELECT语句,如下面的示例语法所示:

    SELECT * FROM database.table FOR SYSTEM_TIME AS OF timestamp

    时间戳参数可以是时间戳,也可以是带时区的时间戳。如果未指定,Athena 将该值视为以 UTC 时间表示的时间戳。运行时间旅行查询以检索截至 2021-05-26 日 08:15:00 时的数据:

    SELECT product_category, count(*) as TotalReviews, avg(star_rating) as AverageRating FROM lakeformation_tutorial_amazon_reviews.amazon_reviews_governed FOR SYSTEM_TIME AS OF TIMESTAMP '2021-05-26 08:15:00 UTC' GROUP BY product_category

    这些区域有:结果屏幕包含的记录product_category=Camera. 这是因为该文件product_category=Books在时间戳之后添加了 (世界标准时间 2021-05-26 08:15:00),已在FOR SYSTEM_TIME AS OF.