Amazon Simple Storage Service
开发人员指南 (API 版本 2006-03-01)
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

Amazon S3 存储类

Amazon S3 中的每个对象都有与之关联的存储类。例如,如果您列出 S3 存储桶中的对象,则控制台会在列表中显示所有对象的存储类。


        显示 Amazon S3 控制台中的存储类示例。

Amazon S3 将为您存储的对象提供一系列存储类。根据您的使用案例场景和性能访问要求选择一个类。所有这些存储类都提供高持久性存储。

经常访问对象的存储类

对于性能敏感的使用案例 (需要毫秒级访问时间的用例) 和经常访问的数据,Amazon S3提供以下存储类:

  • STANDARD — 默认存储类。如果上传对象时未指定存储类,Amazon S3 会分配 STANDARD 存储类。

     

  • REDUCED_REDUNDANCY — 低冗余存储 (RRS) 存储类设计用于可使用低于 STANDARD 存储类的冗余级别存储的非关键性可再生数据。

    重要

    我们建议您不要使用此存储类。STANDARD 存储类更经济高效。

    为了实现持久性,RRS 对象的平均每年对象损失率为 0.01%。如果 RRS 对象丢失,则在对该对象发出请求时,Amazon S3 会返回 405 错误。

可自动优化经常访问和不经常访问的对象的存储类

INTELLIGENT_TIERING 存储类设计为通过自动将数据移至最经济高效的存储访问层来优化存储成本,不会影响性能或产生运营开销。当访问模式不断变化时,INTELLIGENT_TIERING 会在粒度对象级别在两个访问层(经常访问层与较低成本的不经常访问层)之间移动数据,从而自动实现成本节省。当访问模式未知或不可预测时,如果您要自动为长期存在的数据优化存储成本,INTELLIGENT_TIERING 是理想的存储类。

INTELLIGENT_TIERING 存储类将对象存储在两个访问层中:一个是针对频繁访问进行了优化的层,另一个是针对不频繁访问的数据进行了优化的更低成本的层。对于每个对象的小额月度监控和自动化费用,Amazon S3 监控 INTELLIGENT_TIERING 存储类中对象的访问模式,然后将连续 30 天未访问的对象移至不频繁访问层。使用 INTELLIGENT_TIERING 存储类时没有检索费用。如果不频繁访问层中的对象被访问,则对象将自动移回频繁访问层。在 INTELLIGENT_TIERING 存储类中的访问层之间移动对象时,不会产生额外的分层费用。

注意

INTELLIGENT_TIERING 存储类适用于您计划存储至少 30 天并且大小超过 128 KB 的对象。如果对象大小小于 128 KB,则不符合自动分层条件。可以存储更小的对象,但始终按 INTELLIGENT_TIERING 存储类中的频繁访问层费率计费。如果您在 30 天的最短存储期结束前删除对象,则需支付 30 天的费用。有关定价信息,请参阅 Amazon S3 定价

不经常访问对象的存储类

STANDARD_IAONEZONE_IA 存储类用于长时间运行且不经常访问的数据。(IA 表示不经常访问。) STANDARD_IA 和 ONEZONE_IA 对象可用于毫秒级访问(类似于 STANDARD 存储类)。Amazon S3 会对这些对象收取检索费用,所以它们最适合用于不常访问的数据。有关定价信息,请参阅 Amazon S3 定价

例如,您可以选择 STANDARD_IA 和 ONEZONE_IA 存储类:

  • 用于存储备份。

     

  • 用于不经常访问但仍需要毫秒级访问的旧数据。例如,上传数据时,您可能会选择 STANDARD 存储类,然后使用生命周期配置指示 Amazon S3 将对象转换为 STANDARD_IA 或 ONEZONE_IA 类。有关生命周期管理的更多信息,请参阅对象生命周期管理

注意

STANDARD_IA 和 ONEZONE_IA 存储类适用于您计划存储至少 30 天并且大小超过 128 KB 的对象。如果对象小于 128 KB,Amazon S3 会收取 128 KB 的费用。如果您在 30 天的最短存储期结束前删除对象,则需支付 30 天的费用。有关定价信息,请参阅 Amazon S3 定价

这些存储类在以下方面有所不同:

  • STANDARD_IA — Amazon S3 跨多个地理位置独立的可用区存储冗余对象数据(类似于 STANDARD 存储类)。STANDARD_IA 对象可在出现可用区丢失时复原。此存储类可提供比 ONEZONE_IA 类更好的可用性和弹性。

     

  • ONEZONE_IA — Amazon S3 只在一个可用区存储对象数据,因此比 STANDARD_IA 更便宜。但是,数据无法灵活地应对由于地震和洪水灾害而造成可用区物理丢失的情况。ONEZONE_IA 存储类和 STANDARD_IA 一样具有持久性,但是可用性和弹性较差。有关存储类的持久性和可用性比较,请参阅此部分结尾的持久性和可用性表。有关定价,请参阅 Amazon S3 定价

我们建议执行下列操作:

  • STANDARD_IA — 用于主数据或无法重新创建的数据副本。

  • ONEZONE_IA — 如果在可用区出现故障时可重新创建数据,可在设置跨区域复制 (CRR) 时用于对象副本。

用于存档对象的存储类

GLACIERDEEP_ARCHIVE 存储类专为低成本数据存档而设计。这些存储类提供与 STANDARD 存储类相同的持久性和弹性。有关存储类的持久性和可用性比较,请参阅此部分结尾的持久性和可用性表。

这些存储类在以下方面有所不同:

  • GLACIER — 用于可能需要在几分钟内检索其部分数据的存档。存储在 GLACIER 存储类中的数据的最短存储持续时间为 90 天,使用加速检索只需 1-5 分钟即可访问。如果您在 90 天的最短使用期限之前已删除、覆盖数据或将其转换到不同的存储类,则您需支付 90 天的费用。有关定价信息,请参阅 Amazon S3 定价

     

  • DEEP_ARCHIVE — 用于存档很少需要访问的数据。存储在 DEEP_ARCHIVE 存储类中的数据的最短存储持续时间为 180 天,默认检索时间为 12 小时。如果您在 180 天的最短使用期限之前已删除、覆盖数据或将其转换到不同的存储类,则您需支付 180 天的费用。有关定价信息,请参阅 Amazon S3 定价

    DEEP_ARCHIVE 是 AWS 中最低成本的存储选项。DEEP_ARCHIVE 的存储成本低于 GLACIER 存储类。您可以使用批量检索来减少 DEEP_ARCHIVE 检索成本,批量检索会在 48 小时内返回数据。

检索存档的对象

您可以按照与其他存储类相同的方式将对象的存储类设置为 GLACIER 或 DEEP_ARCHIVE,如设置对象的存储类部分所述。但是,GLACIER 和 DEEP_ARCHIVE 对象不可用于实时访问。您必须先还原 GLACIER 和 DEEP_ARCHIVE 对象才能访问它们(STANDARD、RRS、STANDARD_IA、ONEZONE_IA 和 INTELLIGENT_TIERING 对象可随时访问)。有关检索已存档对象的更多信息,请参阅还原存档对象

重要

如果选择 GLACIER 或 DEEP_ARCHIVE 存储类,您的对象将在 Amazon S3 中保留。您无法直接通过单独的 Amazon S3 Glacier 服务访问它们。

要了解有关 Amazon S3 Glacier 服务的更多信息,请参阅Amazon S3 Glacier 开发人员指南

比较 Amazon S3 存储类

下表对存储类进行了比较。

存储类 设计专门针对 持久性 (设计目标) 可用性 (设计目标) 可用区 最小存储持续时间 最小可计费对象大小 其他考虑因素

STANDARD

经常访问的数据

99.999999999%

99.99%

>=3

STANDARD_IA

长时间存在的、不经常访问的数据

99.999999999%

99.9%

>=3

30 天

128 KB

按每 GB 收取检索费用。

INTELLIGENT_TIERING

访问模式发生变化或未知的长时间存在的数据

99.999999999%

99.9%

>=3

30 天

按对象收取监控和自动化费用。无检索费用。

ONEZONE_IA

长时间存在的、不经常访问的、非关键数据

99.999999999%

99.5%

1

30 天

128 KB

按每 GB 收取检索费用。无法灵活地应对可用区丢失的情况。

GLACIER

检索时间从数分钟到数小时不等的长期数据存档 99.999999999%

99.99% (在您还原对象之后)

>=3

90 天

按每 GB 收取检索费用。您必须先还原存档对象,然后才可以访问它们。有关更多信息,请参阅 还原存档对象

DEEP_ARCHIVE

存档很少访问的数据,默认检索时间为 12 小时 99.999999999%

99.99% (在您还原对象之后)

>=3

180 天

按每 GB 收取检索费用。您必须先还原存档对象,然后才可以访问它们。有关更多信息,请参阅 还原存档对象

RRS(不推荐)

经常访问的非关键数据

99.99%

99.99%

>=3

除 ONEZONE_IA 之外的所有存储类均采用灵活的弹性设计,适用于单个可用区同时丢失完整数据以及另一个可用区丢弃部分数据的情况。

除了应用程序场景的性能要求之外,还考虑了价格问题。有关存储类定价,请参阅 Amazon S3 定价

设置对象的存储类

Amazon S3 API 支持按照以下方式设置 (或更新) 对象的存储类:

  • 创建新对象时,可以指定其存储类。例如,使用 PUT 对象POST 对象启动分段上传 API 时,添加 x-amz-storage-class 请求标头以指定存储类。如果您未添加此标头,Amazon S3 将 STANDARD 存储类作为默认存储类。

     

  • 您还可以通过使用 PUT Object - Copy API 来复制对象,从而将已存储在 Amazon S3 中的对象的存储类更改为任何其他存储类。但是,您无法使用 PUT Object - Copy 来复制存储在 GLACIER 或 DEEP_ARCHIVE 存储类中的对象。

    您使用相同键名复制相同存储桶中的对象并按照以下方式指定请求标头:

    • x-amz-metadata-directive 标头设置为 COPY。

    • x-amz-storage-class 设置为要使用的存储类。

    在启用版本控制的存储桶中,您无法更改特定版本对象的存储类。当您复制对象时,Amazon S3 将为其指定新的版本 ID。

     

  • 您可以通过向存储桶添加生命周期配置来指示 Amazon S3 更改对象的存储类。有关更多信息,请参阅 对象生命周期管理

     

  • 在设置复制 (CRR) 配置时,您可以将复制对象的存储类设置为任何其他存储类。但是,您无法复制存储在 GLACIER 或 DEEP_ARCHIVE 存储类中的对象。有关更多信息,请参阅 复制配置概述

要创建和更新对象存储类,您可以使用 Amazon S3 控制台、AWS 开发工具包或 AWS Command Line Interface (AWS CLI)。每个都使用 Amazon S3 API 向 Amazon S3 发送请求。