使用 Neptune 指标的最佳实践 - Amazon Neptune
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Neptune 指标的最佳实践

要确定因资源不足和其它常见瓶颈导致的性能问题,您可以监控可用于 Neptune 数据库集群的指标。

定期监控性能指标以收集有关各种时间范围内的平均值、最大值和最小值数据。这可帮助确定性能下降的时间。使用这些数据,您可以为特定的指标阈值设置 Amazon CloudWatch 警报,以便在达到这些阈值时收到提醒。

设置新的数据库集群并让它在典型工作负载下运行时,尝试按一些不同的间隔(例如,一小时、二十四小时、一周、两周)来捕获所有性能指标的平均值、最大值和最小值。这将使您能够了解运行状况。这有助于将操作的峰值时间与非峰值时间进行比较。您随后可以利用这些信息确定性能何时降到标准水平以下,然后相应设置警报。

有关如何查看 Neptune 指标的信息,请参阅 使用亚马逊监控 Neptune CloudWatch

以下是首先要查看的最重要指标:

  • BufferCacheHitRatio— 由缓冲区缓存处理的请求的百分比。缓存未命中会给查询执行带来显著的延迟。如果缓存命中率低于 99.9%,并且您的应用程序存在延迟问题,请考虑升级实例类型以在内存中缓存更多数据。

  • CPU 利用率 – 使用的计算机处理容量的百分比。根据您的查询性能目标,高 CPU 消耗值可能是正常情况。

  • 可释放内存 – 数据库实例上可用的 RAM 量(以 MB 为单位)。Neptune 有自己的内存管理器,因此该指标可能低于您的预期。如果查询经常抛出 out-of-memory异常,则应考虑将实例类升级到具有更多 RAM 的实例类,这是一个好兆头。

对于 CPU 和内存指标,监控选项卡中的红线指标标记为 75%。如果实例内存消耗频繁越过红线,请检查您的工作负载并考虑升级实例以改进查询性能。