故障排除 - Amazon Timestream
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

故障排除

无法识别 “开发” 版本的警告

迁移期间可能会显示警告 “警告:假设支持最新的备份/恢复 APIs ,则无法解析服务器报告的版本 “dev”。可以忽略此警告。

恢复阶段迁移失败

如果在恢复阶段迁移失败,用户可以使用该--retry-restore-dir标志重新尝试恢复。使用带有先前备份目录路径的--retry-restore-dir标志跳过备份阶段并重试恢复阶段。如果在还原期间迁移失败,则会显示创建的用于迁移的备份目录。

恢复失败的可能原因包括:

  • InfluxDB 目标令牌无效 — 目标实例中存在的与源实例同名的存储桶。对于单个存储桶迁移,请使用--dest-bucket选项为迁移的存储桶设置唯一的名称

  • 连接失败,无论是源主机还是目标主机,还是与可选的 S3 存储桶。

适用于 InfluxDB 的亚马逊 Timestream 基本操作指南

以下是每个人在使用适用于 InfluxDB 的 Amazon Timestream 时都应遵循的基本操作指南。请注意,适用于 InfluxDB 的 Amazon Timestream 服务等级协议要求您遵循以下指南:

  • 使用指标来监控您的内存、CPU 和存储使用情况。您可以将 Amazon 设置 CloudWatch 为在使用模式发生变化或接近部署容量时通知您。这样,您就可以保持系统的性能和可用性。

  • 当接近存储容量限制时,可以纵向扩展数据库实例。存储和内存中应含有一些缓冲区,以适应应用程序的意外增大需求。请记住,此时,您需要创建一个新实例并迁移数据才能实现这一目标。

  • 如果您的数据库工作负载需要的 I/O 超过您的配置,那么出现故障转移或数据库故障后,恢复的速度将会变缓。要增加数据库实例的 I/O 容量,请执行以下任一或所有操作:

    • 迁移到具有更高 I/O 容量的其他数据库实例。

    • 如果您已经在使用 Influx 内含 IOPS 的存储存储,请配置包含更高 IOPS 的存储类型。

  • 如果您的客户端应用程序正在缓存数据库实例的域名服务 (DNS) 数据,请将 time-to-live (TTL) 值设置为小于 30 秒。数据库实例的底层 IP 地址在故障转移后可能会发生变化。因此,长时间缓存 DNS 数据可能会导致连接故障。您的应用程序可能会尝试连接到不再使用的 IP 地址。

数据库实例 RAM 建议

适用于 InfluxDB 的 Amazon Timestream 性能最佳实践是分配足够的内存,这样你的工作集几乎完全驻留在内存中。工作集是经常在实例上使用的数据和索引。使用数据库实例的次数越多,工作集的增长量就越大。