使用 Neptune 指标的最佳实践

要确定因资源不足和其它常见瓶颈导致的性能问题，您可以监控可用于 Neptune 数据库集群的指标。

定期监控性能指标以收集有关各种时间范围内的平均值、最大值和最小值数据。这可帮助确定性能下降的时间。使用这些数据，您可以为特定的指标阈值设置 Amazon CloudWatch 警报，以便在达到这些阈值时收到提醒。

设置新的数据库集群并让它在典型工作负载下运行时，尝试按一些不同的间隔（例如，一小时、二十四小时、一周、两周）来捕获所有性能指标的平均值、最大值和最小值。这将使您能够了解运行状况。这有助于将操作的峰值时间与非峰值时间进行比较。您随后可以利用这些信息确定性能何时降到标准水平以下，然后相应设置警报。

有关如何查看 Neptune 指标的信息，请参阅使用亚马逊监控 Neptune CloudWatch。

以下是首先要查看的最重要指标：

BufferCacheHitRatio— 由缓冲区缓存处理的请求的百分比。缓存未命中会给查询执行带来显著的延迟。如果缓存命中率低于 99.9%，并且您的应用程序存在延迟问题，请考虑升级实例类型以在内存中缓存更多数据。
CPU 利用率 – 使用的计算机处理容量的百分比。根据您的查询性能目标，高 CPU 消耗值可能是正常情况。
可释放内存 – 数据库实例上可用的 RAM 量（以 MB 为单位）。Neptune 有自己的内存管理器，因此该指标可能低于您的预期。如果查询经常抛出 out-of-memory异常，则应考虑将实例类升级到具有更多 RAM 的实例类，这是一个好兆头。

对于 CPU 和内存指标，监控选项卡中的红线指标标记为 75%。如果实例内存消耗频繁越过红线，请检查您的工作负载并考虑升级实例以改进查询性能。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

安全性

Gremlin（常规）