步骤 4:查询和扫描数据 - Amazon DynamoDB
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

步骤 4:查询和扫描数据

您可以使用 query 方法来检索表中的数据。您必须指定分区键值。排序键可选。

Movies 表的主键由以下部分组成:

  • year – 分区键。属性类型是 number。 

  • title – 排序键。属性类型是 string

要查找一年当中发行的所有电影,您只需指定 year。您也可以提供 title,以根据某种条件 (作用于排序键) 来检索电影子集。例如,您可以查找在 2014 年发行并且标题以字母“A”开头的电影。

除了 query 方法以外,您还可以使用 scan 方法检索所有表数据。

要了解有关查询和扫描数据的更多信息,请分别参阅在 DynamoDB 中使用查询在 DynamoDB 中使用扫描

步骤 4.1:查询 - 一年中发行的所有电影

此步骤中包含的程序将检索 year 1985 发行的所有电影。

  1. 将以下程序复制并粘贴到名为 MoviesQuery01.py 的文件中。

    import boto3 from boto3.dynamodb.conditions import Key def query_movies(year, dynamodb=None): if not dynamodb: dynamodb = boto3.resource('dynamodb', endpoint_url="http://localhost:8000") table = dynamodb.Table('Movies') response = table.query( KeyConditionExpression=Key('year').eq(year) ) return response['Items'] if __name__ == '__main__': query_year = 1985 print(f"Movies from {query_year}") movies = query_movies(query_year) for movie in movies: print(movie['year'], ":", movie['title'])
    注意

    当您使用从 ConditionExpression 导入的 KeyAttr 函数时,Boto 3 开发工具包会为您构建一个 boto3.dynamodb.conditions。您还可以字符串形式指定 ConditionExpression

    有关 Amazon DynamoDB 的可用条件列表,请参阅 适用于 Python 的 AWS 软件开发工具包 (Boto3) 使用入门 中的 DynamoDB 条件

    有关更多信息,请参阅 条件表达式

  2. 要运行该程序,请输入以下命令。

    python MoviesQuery01.py

注意

前面的程序演示了如何按主键属性对表进行查询。在 DynamoDB 中,您可以选择在表上创建一个或多个二级索引,并采用查询表的相同方法来查询这些索引。二级索引允许对非键属性进行查询,从而为您的应用程序带来额外的灵活性。有关更多信息,请参阅使用二级索引改进数据访问

步骤 4.2:查询 - 一年中发行的所有包含特定标题的电影

此步骤中包含的程序将检索 year 1992 发行并且 title 以字母“A”至字母“L”开头的所有电影。

  1. 将以下程序复制并粘贴到名为 MoviesQuery02.py 的文件中。

    from pprint import pprint import boto3 from boto3.dynamodb.conditions import Key def query_and_project_movies(year, title_range, dynamodb=None): if not dynamodb: dynamodb = boto3.resource('dynamodb', endpoint_url="http://localhost:8000") table = dynamodb.Table('Movies') print(f"Get year, title, genres, and lead actor") # Expression attribute names can only reference items in the projection expression. response = table.query( ProjectionExpression="#yr, title, info.genres, info.actors[0]", ExpressionAttributeNames={"#yr": "year"}, KeyConditionExpression= Key('year').eq(year) & Key('title').between(title_range[0], title_range[1]) ) return response['Items'] if __name__ == '__main__': query_year = 1992 query_range = ('A', 'L') print(f"Get movies from {query_year} with titles from " f"{query_range[0]} to {query_range[1]}") movies = query_and_project_movies(query_year, query_range) for movie in movies: print(f"\n{movie['year']} : {movie['title']}") pprint(movie['info'])
  2. 要运行该程序,请输入以下命令。

    python MoviesQuery02.py

步骤 4.3:扫描

scan 方法将读取整个表中的所有项目,并返回表中的所有数据。您可提供一个可选的 filter_expression,以便仅返回符合条件的项目。但是,筛选条件仅在扫描整个表后应用。

以下程序将扫描整个 Movies 表,表中包含约 5000 个项目。扫描时可指定可选筛选条件,以便仅检索 20 世纪 50 年代以来的电影 (约 100 个项目),同时舍弃所有其他项目。

  1. 将以下程序复制并粘贴到名为 MoviesScan.py 的文件中。

    from pprint import pprint import boto3 from boto3.dynamodb.conditions import Key def scan_movies(year_range, display_movies, dynamodb=None): if not dynamodb: dynamodb = boto3.resource('dynamodb', endpoint_url="http://localhost:8000") table = dynamodb.Table('Movies') scan_kwargs = { 'FilterExpression': Key('year').between(*year_range), 'ProjectionExpression': "#yr, title, info.rating", 'ExpressionAttributeNames': {"#yr": "year"} } done = False start_key = None while not done: if start_key: scan_kwargs['ExclusiveStartKey'] = start_key response = table.scan(**scan_kwargs) display_movies(response.get('Items', [])) start_key = response.get('LastEvaluatedKey', None) done = start_key is None if __name__ == '__main__': def print_movies(movies): for movie in movies: print(f"\n{movie['year']} : {movie['title']}") pprint(movie['info']) query_range = (1950, 1959) print(f"Scanning for movies released from {query_range[0]} to {query_range[1]}...") scan_movies(query_range, print_movies)

    在代码中,请注意以下情况:

    • ProjectionExpression 用于指定要在扫描结果中包含的属性。

    • FilterExpression 用于指定一个条件,以便仅返回符合条件的项目。所有其他项目都将被舍弃。

    • scan 方法每次返回项目的一个子集(称为页面)。响应中的 LastEvaluatedKey 值随后通过 scan 参数传递给 ExclusiveStartKey 方法。当返回最后一页后,LastEvaluatedKey 将不是响应的一部分。

    注意
    • ExpressionAttributeNames 提供名称替换功能。我们使用此参数是因为 year 是 DynamoDB 中的保留字 — 您不能直接在任何表达式中使用它,包括 KeyConditionExpression。您可使用表达式属性名称 #yr 来解决此问题。

    • ExpressionAttributeValues 提供值替换功能。使用此参数是因为您不能在任何表达式 (包括 KeyConditionExpression) 中使用文本。您可使用表达式属性值 :yyyy 来解决此问题。

  2. 要运行该程序,请输入以下命令。

    python MoviesScan.py

注意

您还可以对在表上创建的任意二级索引使用 Scan 操作。有关更多信息,请参阅使用二级索引改进数据访问