选择节点大小 - Amazon ElastiCache
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

选择节点大小

您为 ElastiCache 集群选择的节点大小会影响成本、性能和容错能力。

节点大小(Valkey 和 Redis OSS)

有关 Graviton 处理器的优势的信息,请参阅 Amazon Graviton 处理器

回答以下问题可帮助您决定实施 Valkey 或 Redis OSS 所需的最小节点类型:

  • 是否预期会出现采用多个客户端连接但吞吐量受限的工作负载?

    如果是这种情况,并且您运行的是 Redis OSS 版本 5.0.6 或更高版本,则可以代表 Redis OSS 引擎使用我们的增强 I/O 功能获得更好的吞吐量和延迟,该功能用于卸载客户端连接。CPUs 如果你运行的是 Redis OSS 7.0.4 或更高版本,那么除了增强I/O, you will get additional acceleration with enhanced I/O multiplexing, where each dedicated network IO thread pipelines commands from multiple clients into the Redis OSS engine, taking advantage of Redis OSS' ability to efficiently process commands in batches. In ElastiCache for Redis OSS v7.1 and above, we extended the enhanced I/O threads functionality to also handle the presentation layer logic. By presentation layer, what we mean is that Enhanced I/O线程之外,现在不仅可以读取客户端输入,还可以将输入解析为 Redis OSS 二进制命令格式,然后将其转发到主线程执行,从而提高性能。有关更多详细信息,请参阅博客文章支持的版本页面。

  • 您是否有仅会经常访问少部分数据的工作负载?

    如果是这种情况,并且您运行的是 Redis OSS 6.2 版或更高版本的引擎,您可以通过选择 r6gd 节点类型来使用数据分层功能。使用数据分层功能时,最近极少使用的数据将存储到 SSD 中。在检索这些数据时,虽然延迟会轻微增加,但是可以节省成本。有关更多信息,请参阅 数据分层 ElastiCache

    有关更多信息,请参阅 受支持的节点类型

  • 您的数据共需要多少内存量?

    要获得一般估计值,请取要缓存的项目的大小。将此大小乘以同时要保留在缓存中的项目数。要获得项目大小的合理估计值,请先序列化您的缓存项目,再计算字符数。然后将该值除以集群中的分区数。

    有关更多信息,请参阅 受支持的节点类型

  • 您运行 Redis OSS 的哪个版本?

    对于 2.8.22 版之前的 Redis,您需要预留更多内存以用于失效转移、快照、同步和将副本提升为主节点的操作。之所以有此要求,是因为您必须具有足够的内存来执行过程中的所有写入。

    Redis OSS 2.8.22 和更高版本使用无分支保存过程,相比之前的过程,所需可用内存更少。

    有关更多信息,请参阅下列内容:

  • 您的应用程序的写操作有多密集?

    在拍摄快照或进行故障转移时,写操作密集的应用程序需要多得多的可用内存( 数据未使用的内存)。无论何时执行 BGSAVE 进程,必须有足够的、数据未使用的内存,以容纳在 BGSAVE 过程中执行的所有写入。例如,拍摄快照时、将主集群与集群中的副本同步时以及启用仅附加文件 (AOF) 功能时。另一个示例是将副本提升为主节点时(如果您启用了多可用区)。最糟糕的情况是在此过程中重写所有数据。在这种情况下,您需要的节点实例大小是数据所需的内存量的两倍。

    有关更多详细信息,请参阅 确保具有用于创建 Valkey 或 Redis OSS 快照的足够内存

  • 您的实施是一个独立的 Valkey 或 Redis OSS(已禁用集群模式)集群,还是具有多个分片的 Valkey 或 Redis OSS(已启用集群模式)集群?

    Valkey 或 Redis OSS(已禁用集群模式)集群

    如果您实施的是 Valkey 或 Redis OSS(已禁用集群模式)集群,则节点类型必须能够容纳所有数据及必要的开销,如上一要点中所述。

    例如,假设您估计所有项目的总大小为 12GB。在此情况下,您可以使用具有 13.3GB 内存的 cache.m3.xlarge 节点 或具有 13.5GB 内存的 cache.r3.large 节点。但是,您可能需要更多内存才能执行 BGSAVE 操作。如果您的应用程序写入操作繁重,请将内存要求翻倍至至少 24GB。因此,使用具有 27.9GB 内存的 cache.m3.2xlarge 或具有 30.5GB 内存的 cache.r3.xlarge

    具有多个分片的 Valkey 或 Redis OSS 集群(已启用集群模式)

    如果您实施的是具有多个分片的 Valkey 或 Redis OSS(已启用集群模式)集群,则节点类型必须能够容纳 bytes-for-data-and-overhead / number-of-shards 字节的数据。

    例如,假设您估计所有项目的总大小为 12GB 且您具有两个分区。在此情况下,您可以使用具有 6.05GB 内存的 cache.m3.large 节点(12GB/2)。但是,您可能需要更多内存才能执行 BGSAVE 操作。如果您的应用程序写入操作繁重,请将内存要求翻倍至至少每个分区 12GB。因此,使用具有 13.3GB 内存的 cache.m3.xlarge 或具有 13.5GB 内存的 cache.r3.large

  • 您是否正在使用 Local Zones?

    L@@ ocal Zones 允许您将诸如 ElastiCache 集群之类的资源放置在靠近用户的多个位置。但是,当您选择节点大小时,请注意,无论容量要求如何,本次可用节点大小目前仅限于以下内容:

    • 最新一代:

      M5 节点类型:cache.m5.largecache.m5.xlargecache.m5.2xlargecache.m5.4xlargecache.m5.12xlargecache.m5.24xlarge

      R5 节点类型:cache.r5.largecache.r5.xlargecache.r5.2xlargecache.r5.4xlargecache.r5.12xlargecache.r5.24xlarge

      T3 节点类型:cache.t3.microcache.t3.smallcache.t3.medium

在集群运行时,您可以监控发布到的内存使用情况、处理器利用率、缓存命中率和缓存未命中率指标。 CloudWatch您可能会注意到您的集群没有您想要的命中率,或者密钥被移出的频率过于频繁。在这些情况下,您可以选择具有较高 CPU 和内存规格的不同节点大小。

监控 CPU 使用情况时,请记住 Valkey 和 Redis OSS 是单线程的。因此,将报告的 CPU 使用率乘以 CPU 核心数来获得实际使用量。例如,报告的使用率为 20% 的四核 CPU 实际上相当于一个使用率为 80% 的单核 Redis OSS。

节点大小(Memcached)

Memcached 集群包含一个或多个节点,该集群的数据会分区到各个节点中。因此,集群的内存需求和节点的内存相关但不相同。您可以通过拥有几个大型节点或多个小型节点来获得所需的集群内存容量。此外,由于您的需求是变化的,您可以在集群中添加节点或删除节点,从而仅为所需内容付费。

集群的总内存容量的计算方法是,在扣除系统开销后将集群中的节点数乘以每个节点的 RAM 容量。每个节点的容量都基于节点类型。

cluster_capacity = number_of_nodes * (node_capacity - system_overhead)

集群中的节点数是运行 Memcached 的集群可用性的一个关键因素。如果单一节点出现故障,则可能对应用程序的可用性以及后端数据库的负载产生影响。在这种情况下,为故障节点 ElastiCache配置一个替代品,然后重新填充该节点。要减小这种可用性影响,请将内存和计算容量分布于更多节点上(每个节点的容量稍小),而非使用少量大容量节点。

在您希望拥有 35GB 缓存内存的情况下,可以设置以下任意配置:

  • 11 cache.t2.medium 个节点,每个节点具有 3.22 GB 内存和 2 个线程,共 35.42 GB 和 22 个线程。

  • 6 cache.m4.large 个节点,每个节点具有 6.42 GB 内存和 2 个线程,共 38.52 GB 和 12 个线程。

  • 3 cache.r4.large 个节点,每个节点具有 12.3 GB 内存和 2 个线程,共 36.90 GB 和 6 个线程。

  • 3 cache.m4.xlarge 个节点,每个节点具有 14.28 GB 内存和 4 个线程,共 42.84 GB 和 12 个线程。

比较节点选项
节点类型 内存(单位:GiB) 内核 小时成本* 需要的节点 总内存(单位:GiB) 核心总数 月度成本
cache.t2.medium 3.22 2 0.068 美元 11 35.42 22 538.56 美元
cache.m4.large 6.42 2 0.156 美元 6 38.52 12 673.92 美元
cache.m4.xlarge 14.28 4 0.311 美元 3 42.84 12 671.76 美元
cache.m5.xlarge 12.93 4 0.311 美元 3 38.81 12 671.76 美元
cache.m6g.large 6.85 2 0.147 美元 6 41.1 12 635 美元
cache.r4.large 12.3 2 0.228 美元 3 36.9 6 492.48 美元
cache.r5.large 13.07 2 0.216 美元 3 39.22 6 466.56 美元
cache.r6g.large 13.07 2 0.205 美元 3 42.12 6 442 美元
* 自 2020 年 10 月 8 日起的每节点小时成本。
30 天(720 小时)的 100% 使用量的月度成本。

这些选项都提供了类似的内存容量,但提供了不同的计算容量和成本。要比较您的特定选项的成本,请参阅 Amazon ElastiCache 定价

对于运行 Memcached 的集群,每个节点上的部分可用内存都会用于连接开销。有关更多信息,请参阅 Memcached 连接开销

使用多个节点需要跨这些节点分布密钥。每个节点都有自己的终端节点。为了便于终端节点管理,您可以使用自动发现功能,该功能使客户端程序能够自动识别集群中的所有节点。 ElastiCache 有关更多信息,请参阅 自动识别集群(Memcached)中的节点

在某些情况下,您可能无法确定您需要多少容量。如果是这样,对于测试,我们建议从 cache.m5.large 节点开始。然后使用发布到 Amazon 的 ElastiCache 指标监控内存使用率、CPU 利用率和缓存命中率 CloudWatch。有关 CloudWatch 指标的更多信息 ElastiCache,请参阅使用 CloudWatch 指标监控使用情况。对于生产和大型工作负载,R5 节点提供了最佳性能和 RAM 成本价值。

如果您的集群没有所需的命中率,您可以轻松地添加更多的节点,从而增加您的集群的可用内存总量。

如果集群受到 CPU 的约束,但具有足够的命中率,请使用提供更强计算能力的节点类型来设置新集群。