在 Amazon Glacier 中下载文件库清单 - Amazon Glacier
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

此页面仅适用于使用文件库和 2012 年原始 REST API 的 Amazon Glacier 服务的现有客户。

如果您正在寻找归档存储解决方案,建议使用 Amazon S3 中的 Amazon Glacier 存储类别 S3 Glacier Instant Retrieval、S3 Glacier Flexible Retrieval 和 S3 Glacier Deep Archive。要了解有关这些存储选项的更多信息,请参阅 Amazon Glacier 存储类别

从 2025 年 12 月 15 日起,Amazon Glacier(最初基于独立文件库的服务)将不再接受新客户,对现有客户不存在任何影响。Amazon Glacier 是一项独立服务,拥有自己的 API,可将数据存储在文件库中,与 Amazon S3 和 Amazon S3 Glacier 存储类别不同。在 Amazon Glacier 中,您现有的数据将确保安全,并且可以无限期地访问。无需进行迁移。对于低成本、长期的存档存储,Amazon 建议使用 Amazon S3 Glacier 存储类别,该类别可通过基于 S3 存储桶的 API、完全的 Amazon Web Services 区域可用性、更低的成本和 Amazon 服务集成,提供卓越的客户体验。如果您希望加强功能,可以考虑使用我们的 Amazon 将数据从 Amazon Glacier 文件库传输到 Amazon S3 Glacier 存储类别的解决方案指南,迁移到 Amazon S3 Glacier 存储类别。

在 Amazon Glacier 中下载文件库清单

您向文件库上传第一个档案后,Amazon Glacier(Amazon Glacier)会自动创建文件库清单,然后大约每天更新一次。Amazon Glacier 创建第一份清单后,通常需要经过半天(最多一天)时间,该清单才可供检索。您可以通过以下流程(该流程分为两个步骤)从 Amazon Glacier 检索文件库清单:

  1. 使用启动任务(POST jobs)操作启动清单检索任务。

    重要

    数据检索策略可能导致您启动检索任务的请求失败,并发生 PolicyEnforcedException 异常。有关数据检索策略的更多信息,请参阅 Amazon Glacier 数据检索策略。有关 PolicyEnforcedException 异常的更多信息,请参阅错误响应

  2. 在任务完成后,使用获取任务输出(GET output)操作下载字节。

例如,检索档案或文件库清单的操作要求您首先启动检索任务。任务请求会异步运行。当您启动检索任务时,Amazon Glacier 会创建任务并在响应中返回任务 ID。Amazon Glacier 完成任务时,您可以获取任务输出(归档字节或文件库清单数据)。

任务必须先完成,然后,您才能获取其输出。要确定任务的状态,您有以下选择:

  • 等待任务完成通知 – 您可以指定 Amazon Glacier 在完成任务后可以向其发布通知的 Amazon Simple Notification Service(Amazon SNS)主题。您可以使用以下方法指定 Amazon SNS 主题:

    • 为每个任务指定 Amazon SNS 主题。

      启动任务时,您可以选择性地指定 Amazon SNS 主题。

    • 设置文件库的通知配置。

      您可以设置文件库的特定事件的通知配置(参阅在 Amazon Glacier 中配置文件库通知)。只要发生特定事件,Amazon Glacier 就会向指定的 SNS 主题发送消息。

    如果您设置了文件库的通知配置,并且在启动任务时也指定了 Amazon SNS 主题,则 Amazon Glacier 会向这两个主题发送任务完成消息。

    您可以将 SNS 主题配置为通过电子邮件通知您或者将消息存储在应用程序可以轮询的 Amazon Simple Queue Service(Amazon SQS)中。当该队列中出现消息时,您可以检查任务是否已成功完成,然后下载任务输出。

  • 显式请求任务信息 – Amazon Glacier 也提供了描述任务操作(描述任务(GET JobID)),该操作可让您轮询任务信息。您可以定期发送此请求,以获取任务信息。但是,使用 Amazon SNS 通知才是推荐的选择。

注意

您通过 SNS 通知获取的信息与通过调用描述任务获取的信息相同。

关于清单

从您第一次将档案上传到文件库的日期开始,Amazon Glacier 至少每天都会更新一次文件库清单。如果在上次清单盘点后没有对文件库执行过添加或删除档案的操作,则不会更新清单日期。当您为文件库清单启动任务时,Amazon Glacier 返回其最近一次生成的清单,该清单是时间点快照,而不是实时数据。请注意,Amazon Glacier 为文件库创建第一份清单后,通常需要经过半天(最多一天)时间,该清单才可用于检索操作。

您可能没有发现为每个档案上传操作检索文件库清单有什么好处。但是,假设您在客户端维护数据库,且该客户端关联了您上传到 Amazon Glacier 的档案的元数据。此时,您可能会发现,文件库清单对于根据需要将您数据库中的信息与实际文件库清单进行协调很有用。您可以通过筛选存档创建日期或设置配额,来限制检索的清单项目数。有关限制清单检索的更多信息,请参阅确定清单检索范围

清单可以按两种格式返回:逗号分隔值(CSV)或 JSON。启动清单任务时,您可以选择性地指定格式。默认格式为 JSON。有关清单任务输出中返回的数据字段的更多信息,请参阅“获取任务输出 API”响应正文