本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
问题排查指南
常见问题和解决步骤
指标缺失或不完整
症状
-
控制面板中未显示任何指标。
-
部分指标收集。
-
指标更新延迟。
解决步骤
A. 验证收集器状态
检查 systemd 服务:
sudo systemctl status gamelift-telemetry-collector
审核收集器日志:
sudo journalctl -u gamelift-telemetry-collector
-
确认收集器配置。
B. IAM 权限验证
-
检查实例角色权限。
-
验证所需的策略:
-
aps:RemoteWrite -
cloudwatch:PutMetricData
-
-
验证角色信任关系。
C. 网络连接
-
验证端点访问权限。
-
检查安全组规则:
-
评论网络 ACLs。
身份验证错误
症状
-
SigV4 身份验证失败。
-
“访问被拒绝”消息。
-
凭证刷新问题。
解决步骤
A. SigV4 身份验证
-
验证临时凭证。
-
检查凭证轮换。
-
验证实例配置文件。
B. AMP 访问权限
-
审核工作空间配置。
-
验证远程写入 URL。
-
检查 IAM 角色绑定。
控制面板问题
症状
-
控制面板为空。
-
数据点缺失。
-
身份验证失败。
解决步骤
A. 数据来源配置
-
验证 Prometheus 连接。
-
查看亚马逊 CloudWatch 整合。
-
测试数据来源权限。
B. Grafana 访问权限
-
确认 SSO 配置。
-
如果需要,请验证 2FA 设置。
-
检查用户权限
特定于 Windows 的问题
症状
-
服务启动失败。
-
指标采集缺失。
-
权限错误。
解决步骤
-
验证 Windows 服务状态。
-
检查 Windows 事件日志。
-
审核收集器配置。
-
验证特定于 Windows 的路径。