使用 Amazon 控制台检索 S3 Glacier 档案 - Amazon S3 Glacier
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

如果您不熟悉 Amazon Simple Storage Service (Amazon S3) 中的归档存储功能,建议您先详细了解 Amazon S3 中的 S3 Glacier 存储类、S3 Glacier 即时检索S3 Glacier 灵活检索S3 Glacier 深度归档。有关更多信息,请参阅 Amazon S3 用户指南中的 S3 Glacier 存储类和用于存档对象的存储类。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon 控制台检索 S3 Glacier 档案

从 Amazon S3 Glacier 检索档案是一个异步操作,您首先需要启动任务,然后在任务完成后下载输出。要启动档案检索任务,您可以使用启动作业(POST 作业) REST API 操作,或者 Amazon CLI 或 Amazon SDK 中的等同命令。

从 S3 Glacier 检索档案是一个分为两个步骤的过程。

检索档案
  1. 启动档案检索任务。

    1. 获得您要检索的档案的 ID。您可以从文件库清单获取档案 ID。您可以通过 REST API、Amazon CLI 或 Amazon SDK 获取档案 ID。有关更多信息,请参阅在 Amazon S3 Glacier 中下载文件库清单

    2. 使用启动作业(POST 作业) 操作启动任务,请求 S3 Glacier 为后续下载准备整个档案或档案的一部分。

    当您启动任务时,S3 Glacier 会在响应中返回任务 ID 并异步运行任务。(如步骤 2 所述,在任务完成之前,您不能下载任务输出。)

    重要

    数据检索策略可能导致您的 Initiate Job 请求失败,并发生 PolicyEnforcedException 异常,但这仅限于标准检索。有关数据检索策略的更多信息,请参阅S3 Glacier 数据检索策略。有关 PolicyEnforcedException 异常的更多信息,请参阅错误响应

    如果需要,您可以还原存储在 S3 Glacier 中的大型数据段。有关从 S3 Glacier 存储类恢复数据的更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的用于归档对象的存储类

  2. 在任务完成后,使用获取任务输出(获取输出) 操作下载字节。

    您可以下载所有字节,或者指定字节范围,只下载任务输出的一部分。对于较大的输出,以区块下载输出的方式在下载失败(例如,由于网络发生故障而失败)时对您有所帮助。如果您在单一请求中获取任务输出,并且网络发生故障,则您不得不从头重新开始下载输出。但是,如果您以区块下载输出,万一发生任何故障,则您只需重新开始下载较小的部分,而不是整个输出。

S3 Glacier 必须先完成任务,然后,您才能获取其输出。任务在完成后的至少 24 小时内都不会过期,这意味着,您可以在任务完成后的 24 小时期限内下载输出。要确定您的任务是否已完成,请使用以下选项之一检查其状态:

  • 等待任务完成通知 –您可以指定 S3 Glacier 在完成任务后可以向其发布通知的 Amazon Simple Notification Service (Amazon SNS) 主题。S3 Glacier 只有在完成任务后才会发送通知。

    启动任务时,您可以为该任务指定 Amazon SNS 主题。除了在您的任务请求中指定 Amazon SNS 主题以外,如果您的文件库已为档案检索事件设置了通知配置,S3 Glacier 也会向该 SNS 主题发布通知。有关更多信息,请参阅在 Amazon S3 Glacier 中配置文件库通知

  • 显式请求任务信息 –您也可以使用 S3 Glacier Describe Job API operation (描述任务(获取任务 ID)),以定期轮询任务信息。但是,建议使用 Amazon SNS 通知。

注意

使用 Amazon SNS 通知获取的信息与调用 Describe Job API 操作所获取的信息相同。

档案检索选项

在启动检索档案的任务时,您可以根据访问时间和成本需求指定以下检索选项之一。有关检索定价的信息,请参阅 Amazon S3 Glacier 定价

  • 加速 - 加速检索允许您在偶尔需要紧急请求还原档案时快速访问存储在 S3 Glacier Flexible Retrieval 存储类或 S3 Intelligent-Tiering 归档访问层中的数据。对于除了最大型档案(250 MB 以上)之外的所有其他档案,使用加速检索访问的数据通常在 1 到 5 分钟内可用。预配置容量确保在您需要时,可以使用针对加速检索的检索容量。有关更多信息,请参阅预配置容量

  • 标准 –标准检索允许您在数小时内访问您的任意档案。标准检索通常在 3 到 5 小时内完成。“标准”是未指定检索选项的检索请求的原定设置选项。

  • 批量 – 批量检索是 S3 Glacier 最低成本的检索选项,使您可以在一天内以较低的成本检索大量(甚至是 PB 级)的数据。批量检索通常在 5 到 12 小时内完成。

下表总结了归档检索选项。有关定价的信息,请参阅 Amazon S3 Glacier 定价

服务 加速 标准 批量

Amazon S3 Glacier

1–5 分钟

3–5 小时

5–12 小时

要进行 ExpeditedStandardBulk 检索,请将 RestoreObject REST API 操作请求中的 Tier 请求元素设置为您需要的选项,或 Amazon Command Line Interface(Amazon CLI)或 Amazon SDK 中的等效选项。如果您购买了预配置容量,则所有加速检索都会通过您的预配置容量自动获得处理。

预配置容量

预配置容量帮助确保在您需要时,可以使用针对加速检索的检索容量。每个容量单位确保每 5 分钟至少可以执行 3 个加速检索,并提供高达 150MB/秒(MBps)的检索吞吐量。

如果您的工作负载需要极高的稳定性和对数据子集可预测的访问性能(以分钟为单位),建议您购买预调配检索容量。没有预配置容量的加速检索通常也可以接受,但是在极少情况下会出现不寻常的高需求。不过,如果您需要随时可以访问加速检索,您必须购买预配置检索容量。

购买预配置容量

您可以使用 S3 Glacier 控制台、购买预配置容量 (POST provisioned-capacity) REST API、Amazon SDK 或 Amazon CLI 购买预配置容量单位。有关预配置容量的定价信息,请参阅 Amazon S3 Glacier 定价

预配置容量单位将持续一个月,从购买日期和时间开始计算。

如果开始日期为一个月的第 31 天,过期日期为下个月的最后一天。例如,如果开始日期为 8 月 31 日,则过期日期为 9 月 30 日。如果开始日期为 1 月 31 日,则过期日期为 2 月 28 日。

使用 Amazon S3 Glacier 控制台购买预配置容量
  1. 登录到 Amazon Web Services Management Console,然后通过以下网址打开 S3 Glacier 控制台:https://console.aws.amazon.com/glacier/home

  2. 在左侧的导航窗格中,选择数据检索设置

  3. 预配置容量单位 (PCU) 下,选择购买 PCU。此时将显示购买 PCU 对话框。

  4. 如果要购买预配置容量,请在确认购买框中输入 confirm

  5. 选择购买 PCU

关于限范围的档案检索

当您从 S3 Glacier 检索档案时,您可以选择性地指定要检索的档案范围(部分)。默认为检索整个档案。如果您要执行以下操作,指定字节范围会很有用:

  • 管理您的数据下载 – S3 Glacier 允许您在检索请求完成后的 24 小时内下载检索的数据。因此,您可能只想要检索档案的某些部分,以便在给定的下载时间窗内管理下载时间表。

  • 检索大型档案的目标段 – 例如,假设您之前聚合了许多文件并以单一档案的形式上传了这些文件,您现在想检索这些文件中的一些文件。在这种情况下,您可以通过使用一个检索请求指定档案的范围,该范围包含您感兴趣的文件。或者,您可以启动多个检索请求,每个请求均具有一个针对一个或多个文件的范围。

当使用范围检索启动检索任务时,您必须提供以兆字节对齐的范围。也就是说,字节范围可以从零(档案的开头)开始,或者从其后的任何 1-MB 间隔(1MB、2MB、3MB,依此类推)处开始。

该范围的结尾可以是您档案的结尾或大于范围开头的任何 1MB 间隔处。此外,如果您要在(检索任务完成后)下载数据时获取校验和值,则您在任务启动中请求的范围还必须以树形哈希对齐。可以使用校验和来确保数据在传输过程中没有损坏。有关兆字节对齐和树形哈希对齐的更多信息,请参阅“下载数据时接收校验和”。