Amazon Elastic Compute Cloud
用户指南(适用于 Linux 实例)
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

Spot 队列的工作原理

Spot 队列 是 Spot 实例 和可选的 按需实例 的集合或队列。

Spot 队列 会尝试启动适当数量的 Spot 实例 和 按需实例,以满足在 Spot 队列 请求中指定的目标容量要求。如果具有可用的容量,并且在 Spot 实例请求中指定的最高价格超过当前 Spot 价格,则会完成该请求。如果 Spot 实例中断,Spot 队列还会尝试保持其目标容量队列。

也可以设置您愿意为队列支付的每小时最大金额,Spot 队列将启动实例,直至达到最大金额。在达到您愿意支付的最大金额时,即使队列未达到目标容量,队列也会停止启动实例。

Spot 实例 池 是一组未使用的 EC2 实例,具有相同的实例类型(例如 m5.large)、操作系统、可用区和网络平台。在您发出Spot 队列请求时,您可以指定多个启动规范 (因实例类型、AMI、可用区或子网而异)。Spot 队列 会基于 Spot 队列 请求中包含的启动规范以及 Spot 队列 的配置来选择用于执行请求的 Spot 实例 池。Spot 实例来自所选的池。

Spot 队列中的按需容量

为确保始终拥有实例容量,您可以在 Spot 队列请求中包含按需容量请求。在 Spot 队列请求中,您需要指定所需的目标容量以及该容量中有多少必须是按需容量。余量由 Spot 容量组成,后者在有可用的 Amazon EC2 容量并且可用时启动。例如,如果您在 Spot 队列 请求中指定目标容量为 10,按需容量为 8,则 Amazon EC2 启动 8 个容量单位作为按需实例,启动 2 个容量单位 (10-8=2) 作为 Spot 实例。

针对按需容量优化实例类型

Spot 队列 尝试满足您的按需容量时,它会默认首先启动价格最低的实例类型。如果 OnDemandAllocationStrategy 设置为 prioritized,Spot 队列使用优先级来确定首先使用什么实例类型来满足按需容量。优先级分配给启动模板覆盖,优先级最高的最先启动。

例如,您可以配置三个启动模板覆盖,每个覆盖具有不同的实例类型:c3.largec4.largec5.largec5.large 的按需价格低于 c4.largec3.large 价格最低。如果您不使用优先级来确定顺序,则机群按照从 c3.large 开始、然后 c5.large 的顺序满足按需容量。由于您的 c4.large 经常会有未使用的预留实例,您可以设置启动模板覆盖优先级,这样其顺序就是 c4.largec3.largec5.large

Spot 实例分配策略

Spot 队列 中 Spot 实例 的分配策略决定了如何根据启动规范从可能的 Spot 实例 池执行 Spot 队列 请求。以下是您在Spot 队列请求中可以指定的分配策略:

lowestPrice

Spot 实例来自价格最低的池。这是默认策略。

diversified

Spot 实例分布在所有池中。

capacityOptimized

Spot 实例来自为启动的实例数量提供最佳容量的池。

InstancePoolsToUseCount

Spot 实例分布在您指定数量的 Spot 池中。此参数仅在与 lowestPrice 结合使用时有效。

维持目标容量

在 Spot 实例 因 Spot 实例 池的 Spot 价格或可用容量发生变化而终止之后,maintain 类型的 Spot 队列 会启动替换 Spot 实例。如果分配策略是 lowestPrice,则 队列在当前具有最低 Spot 价格的池中启动替换实例。如果分配策略是 diversified,则队列在其余池间分配替换 Spot 实例。如果分配策略是 lowestPriceInstancePoolsToUseCount 的组合,则队列选择具有最低价格的 Spot 池并跨您指定数量的 Spot 池启动 Spot 实例。

配置 Spot 队列,实现成本优化

使用 Spot 实例,定价会根据长期供需趋势缓慢发生变化,但容量会实时波动。capacityOptimized 策略通过查看实时容量数据并预测可用性最高的池,自动在可用性最高的池中启动 Spot 实例。这适用于与中断相关的重启工作和检查点成本较高的工作负载,例如大数据和分析、图像和媒体渲染、机器学习以及高性能计算。通过实现更低的中断可能性,capacityOptimized 策略可以降低您工作负载的整体成本。

配置 Spot 队列 以实现成本优化和多元化

要以低成本且多元化的方式创建 Spot 实例队列,请将 lowestPrice 分配策略与 InstancePoolsToUseCount 结合使用。Spot 队列基于您指定数量的 Spot 池中的当前 Spot 价格,自动部署实例类型和可用区的最低成本组合。此组合可用于避免最昂贵的 Spot 实例。

配置 Spot 队列以实现容量优化

使用 Spot 实例,定价会根据长期供需趋势缓慢发生变化,但容量会实时波动。capacityOptimized 策略通过查看实时容量数据并预测可用性最高的池,自动在可用性最高的池中启动 Spot 实例。这适用于与中断相关的重启工作和检查点成本较高的工作负载,例如大数据和分析、图像和媒体渲染、机器学习以及高性能计算。通过实现更低的中断可能性,capacityOptimized 策略可以降低您工作负载的整体成本。

选择合适的分配策略

您可以基于自己的使用案例来优化 Spot 队列。

如果您的队列较小或只是短时间运行,则您的 Spot 实例 实例中断的可能性较低(即使所有实例都在同一个 Spot 实例 池中)。因此,lowestPrice 策略可能会满足您的需求,同时提供最低的成本。

如果队列较大或长时间运行,则可以通过在多个池间分配 Spot 实例来提高队列的可用性。例如,如果 Spot 队列 请求指定 10 个池,目标容量为 100 个实例,则队列会在每个池中启动 10 个 Spot 实例。如果某个池的 Spot 价格超过您在该池中的最高价,您的队列仅 10% 受到影响。使用此策略还可降低您的队列对单个池的 Spot 价格随时间上涨的敏感度。

使用 diversified 策略时,Spot 队列不在 Spot 价格等于或高于按需价格的任何池中启动 Spot 实例。

要创建低成本且多元化的机群,请将 lowestPrice 策略与 InstancePoolsToUseCount 结合使用。您可以使用少量或大量的 Spot 池以在其中分配您的 Spot 实例。例如,如果您运行批处理,我们建议指定少量的 Spot 池(例如,InstancePoolsToUseCount=2)以确保队列始终具有计算容量,同时尽可能节省成本。如果您运行 Web 服务,我们建议指定较大数量的 Spot 池(例如,InstancePoolsToUseCount=10 个)以最大限度减少 Spot 实例池暂时不可用造成的影响。

如果您的队列运行的工作负载可能会因重启工作和检查点而导致更高的中断成本,则使用 capacityOptimized 策略。此策略提供更低的中断可能性,这可以降低您工作负载的整体成本。

Spot 价格覆盖

每个 Spot 队列 请求可能包含全局最高价,或者使用默认价格(按需价格)。Spot 队列 将该价格作为每个启动规范的默认最高价。

您可以选择在一个或多个启动规范中指定最高价。该价格是启动规范特有的。如果启动规范包含特定的价格,则Spot 队列使用该最高价以覆盖全局最高价。不包含特定最高价的任何其他启动规范仍使用全局最高价。

控制支出

在达到目标容量或您愿意支付的最大金额时,Spot 队列停止启动实例。要控制您每小时为队列支付的金额,您可以为 Spot 实例指定 SpotMaxTotalPrice 并为按需实例指定 OnDemandMaxTotalPrice。在达到最高总价时,即使未达到目标容量,Spot 队列 也会停止启动实例。

以下示例显示了两个不同的方案。在第一个方案中,在达到目标容量时,Spot 队列停止启动实例。在第二个方案中,在达到您愿意支付的最大金额时,Spot 队列停止启动实例。

示例:在达到目标容量时,停止启动实例

假设发出 m4.large 按需实例请求,其中:

  • 按需价格:每小时 0.10 美元

  • OnDemandTargetCapacity:10

  • OnDemandMaxTotalPrice:1.50 美元

Spot 队列启动 10 个按需实例,因为总价 1.00 美元(10 个实例 x 0.10 美元)不超过 OnDemandMaxTotalPrice(1.50 美元)。

示例:在达到最高总价时,停止启动实例

假设发出 m4.large 按需实例请求,其中:

  • 按需价格:每小时 0.10 美元

  • OnDemandTargetCapacity:10

  • OnDemandMaxTotalPrice:0.80 美元

如果 Spot 队列启动按需目标容量(10 个按需实例),则每小时的总成本为 1.00 美元。该值超过了为 OnDemandMaxTotalPrice 指定的金额(0.80 美元)。为了防止支出超过您愿意支付的金额,Spot 队列仅启动 8 个按需实例(低于按需目标容量),因为启动更多实例将超过 OnDemandMaxTotalPrice

Spot 队列实例权重

在请求 Spot 实例 队列时,可以使用实例权重 定义每种实例类型为应用程序能贡献的容量单位,并相应地为每个 Spot 实例 池调整最高价。

默认情况下,您指定的价格是每实例小时 价格。在使用实例权重功能时,您指定的价格是每单位小时 价格。您可以通过将实例类型出价除以它表示的单位数来计算每单位小时价格。Spot 队列 将目标容量除以实例权重以计算要启动的 Spot 实例 数。如果结果不是整数,则 Spot 队列 会将其向上舍入到下一个整数,以便队列的大小不低于其目标容量。Spot 队列 可以选择您在启动规范中指定的任意池,即使所启动实例的容量超过请求的目标容量也是如此。

下表提供了确定目标容量为 10 的 Spot 队列请求的每单位价格的计算示例。

实例类型 实例权重 每实例小时价格 每单位小时价格 启动的实例数

r3.xlarge

2

0.05 美元

0.025

(0.05 除以 2)

5

(10 除以 2)

实例类型 实例权重 每实例小时价格 每单位小时价格 启动的实例数

r3.8xlarge

8

0.10 美元

0.0125

(0.10 除以 8)

2

(10 除以 8,结果向上舍入)

按如下所示使用 Spot 队列实例权重,在执行时具有每单位最低价格的池中预置所需的目标容量:

  1. 采用实例 (默认设置) 或采用所选单位 (如虚拟 CPU、内存、存储或吞吐量) 为Spot 队列设置目标容量。

  2. 设置每单位价格。

  3. 对于每个启动配置,指定权重,这是实例类型向目标容量提供的单位数。

实例权重示例

考虑一个具有以下配置的Spot 队列请求:

  • 目标容量为 24

  • 一个实例类型为 r3.2xlarge 且权重为 6 的启动规范

  • 一个实例类型为 c3.xlarge 且权重为 5 的启动规范

每个权重表示相应实例类型向目标容量提供的单位数。如果第一个启动规范提供了最低的每单位价格 (r3.2xlarge 每实例小时价格除以 6),Spot 队列将启动其中的四个实例 (24 除以 6)。

如果第二个启动规范提供了最低的每单位价格(c3.xlarge 每实例小时价格除以 5),则 Spot 队列会启动 5 个这样的实例(24 除以 5,结果向上舍入)。

实例权重和分配策略

考虑一个具有以下配置的Spot 队列请求:

  • 目标容量为 30

  • 一个实例类型为 c3.2xlarge 且权重为 8 的启动规范

  • 一个实例类型为 m3.xlarge 且权重为 8 的启动规范

  • 一个实例类型为 r3.xlarge 且权重为 8 的启动规范

Spot 队列会启动四个实例 (30 除以 8,结果向上舍入)。在使用 lowestPrice 策略时,所有四个实例均来自提供最低每单位价格的池。使用 diversified 策略时,Spot 队列 会在所有三个池中各启动一个实例,并在三个池中提供最低每单位价格的那个池中启动第四个实例。

演练:将 Spot 队列 与实例权重结合使用

该演练使用一个名为 Example Corp 的虚构公司说明使用实例权重请求Spot 队列的过程。

目标

Example Corp 是一家医药公司,该公司想要利用 Amazon EC2 的计算功能来筛查可能用于对抗癌症的化学成分。

计划

Example Corp 首先查看Spot 最佳实践。然后,Example Corp 确定了他们的Spot 队列的以下要求。

实例类型

Example Corp 有一个计算和内存密集型应用程序,该应用程序在至少 60 GB 内存和八个虚拟 CPU (vCPU) 的情况下性能最佳。他们希望以尽可能低的价格为该应用程序提供尽可能多的这些资源。Example Corp 认定以下任意 EC2 实例类型都能满足其需求:

实例类型 内存 (GiB) vCPU

r3.2xlarge

61

8

r3.4xlarge

122

16

r3.8xlarge

244

32

以单位数表示的目标容量

采用实例权重,目标容量可以等于几个实例 (默认) 或一些因素 (如内核 (vCPU)、内存 (GiB) 和存储 (GB)) 的组合。将其应用程序的基本要求 (60 GB RAM 和八个 vCPU) 作为 1 个单位,Example Corp 决定 20 倍此数量可满足其需求。因此该公司将其Spot 队列请求的目标容量设置为 20。

实例权重

确定目标容量后,Example Corp 计算了实例权重。为了计算每个实例类型的实例权重,他们按如下所示确定每个实例类型需要多少单位才能达到目标容量:

  • r3.2xlarge (61.0 GB, 8 vCPUs) = 1 个 20 单位

  • r3.4xlarge (122.0 GB, 16 vCPUs) = 2 个 20 单位

  • r3.8xlarge (244.0 GB, 32 vCPUs) = 4 个 20 单位

因此,Example Corp 在其Spot 队列请求中将实例权重 1、2 和 4 分配给相应的启动配置。

每单位小时价格

Example Corp 将每实例小时按需价格作为其价格的起点。他们也可以使用最近的 Spot 价格或两者的组合。为了计算每单位小时价格,他们将每实例小时起始价格除以权重。例如:

实例类型 按需价格 实例权重 每单位小时价格

r3.2xLarge

0.7 美元

1

0.7 美元

r3.4xLarge

1.4 美元

2

0.7 美元

r3.8xLarge

2.8 美元

4

0.7 美元

Example Corp 可能会使用每单位小时全局价格 0.7 美元,这对于所有三种实例类型来说是非常有竞争力的。他们可能还会使用每单位小时全局价格 0.7 美元,并在 r3.8xlarge 启动规范中使用特定的每单位小时价格 0.9 美元。

验证权限

在创建 Spot 队列 请求之前,Example Corp 会验证它是否拥有具备所需权限的 IAM 角色。有关更多信息,请参阅Spot 队列先决条件

创建请求

Example Corp 为其 Spot 队列 请求创建一个具有以下配置的文件 config.json

{ "SpotPrice": "0.70", "TargetCapacity": 20, "IamFleetRole": "arn:aws-cn:iam::123456789012:role/aws-ec2-spot-fleet-tagging-role", "LaunchSpecifications": [ { "ImageId": "ami-1a2b3c4d", "InstanceType": "r3.2xlarge", "SubnetId": "subnet-482e4972", "WeightedCapacity": 1 }, { "ImageId": "ami-1a2b3c4d", "InstanceType": "r3.4xlarge", "SubnetId": "subnet-482e4972", "WeightedCapacity": 2 }, { "ImageId": "ami-1a2b3c4d", "InstanceType": "r3.8xlarge", "SubnetId": "subnet-482e4972", "SpotPrice": "0.90", "WeightedCapacity": 4 } ] }

Example Corp 使用以下 request-spot-fleet 命令创建 Spot 队列 请求:

aws ec2 request-spot-fleet --spot-fleet-request-config file://config.json

有关更多信息,请参阅Spot 队列请求

执行

分配策略确定 Spot 实例所来自的 Spot 实例池。

在使用 lowestPrice 策略 (这是默认策略) 时,Spot 实例来自在完成请求时具有最低每单位价格的池。为了提供 20 个单位的容量,Spot 队列 有三种做法:启动 20 个 r3.2xlarge 实例(20 除以 1)、10 个 r3.4xlarge 实例(20 除以 2)或 5 个 r3.8xlarge 实例(20 除以 4)。

如果 Example Corp 使用 diversified 策略,则 Spot 实例来自所有三个池。Spot 队列会启动 6 个 r3.2xlarge 实例(提供 6 个单位)、3 个 r3.4xlarge 实例(提供 6 个单位)和 2 个 r3.8xlarge 实例(提供 8 个单位),总共 20 个单位。