本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
监控 Amazon GameLift Servers
监控是维护和其他 Amazon 解决方案的可靠性、可用性和性能的重要组成部分。Amazon GameLift ServersAmazon GameLift Servers 指标有三个主要用途:监控系统运行状况和设置警报;跟踪游戏服务器的性能和使用情况;以及使用手动或自动扩展功能管理容量。
Amazon 提供以下监控工具Amazon GameLift Servers,供您监视、报告问题并在适当时自动采取措施:
-
Amazon GameLift Servers 控制台 – 使用图形界面管理您的 Amazon GameLift Servers 资源并跟踪游戏托管活动。
-
服务器遥测指标 – Amazon GameLift Servers 支持您通过 SDK 和插件集成,直接从游戏服务器发送自定义指标。您可以定义并跟踪自己的游戏特定指标以及内置的性能、网络、内存和计时数据。所有指标都可以发布到 Amazon Managed Service for Prometheus,并使用完全可自定义的控制面板在 Amazon Grafana 中进行监控。您也可以发布到 Amazon CloudWatch 以与其他 Amazon 服务集成。遥测系统可完全自定义,除内置指标外,您还可以创建自定义 Prometheus 查询,以获取更多指标。有关特定技术栈的实施指南,请参阅使用服务器遥测指标进行监控。
-
Amazon CloudWatch — 您可以实时监控Amazon GameLift Servers指标,以及您在 Amazon 服务上运行的其他 Amazon 资源和应用程序的指标。Amazon CloudWatch 提供了一套监控功能,包括用于创建自定义控制面板的工具,以及设置警报以在指标达到指定阈值时发出通知或采取行动的功能。
-
Amazon CloudTrail— 捕获由您的账户或代表您的 Amazon 账户为和其他 Amazon 服务进行的所有 API 调用Amazon GameLift Servers和相关事件。数据将作为日志文件传送到您指定的 Amazon S3 存储桶。您可以识别哪些用户和帐户拨打了电话 Amazon、发出呼叫的源 IP 地址以及呼叫发生的时间。
-
游戏会话日志 – 您可以将游戏会话的自定义服务器消息输出到存储在 Amazon S3 中的日志文件中。
跨监控源的指标比较
Amazon GameLift Servers通过三个主要来源提供指标:Amazon GameLift Servers控制台舰队活动指标、服务器遥测指标和 Amazon CloudWatch Amazon GameLift Servers 指标。了解每个来源的重叠情况和独特功能,可以帮助您根据需要选择合适的监控方法。
按来源划分的指标可用性
下表按指标类别显示了不同监控来源可用的指标。
实例指标
实例集容量和运行状况监控的实例级指标:
| 指标 | 控制台 | CloudWatch | 遥测 |
|---|---|---|---|
| 活动实例 | ✓ | ✓ | ✓ |
| 空闲实例 | ✓ | ✓ | ✓* |
| 空闲实例所占百分比 | ✓ | ✓ | ✓* |
| 预期实例数 | ✓ | ✓ | |
| 最大实例数 | ✓ | ✓ | |
| 最小实例数 | ✓ | ✓ | |
| CPU 使用率 | ✓ | ✓ | |
| 网络输入/输出量 | ✓ | ✓ | |
| Disk/Storage read/write | ✓ | ✓ | |
| 实例中断次数 | ✓ | ✓ | |
| 实例回收次数 | ✓ | ✓ | |
| 运行不正常的实例替换次数 | ✓ |
*可通过使用遥测数据的自定义 Prometheus 查询获取。
游戏服务器指标
服务器进程和游戏会话指标:
| 指标 | 控制台 | CloudWatch | 遥测 |
|---|---|---|---|
| 有效游戏会话 | ✓ | ✓ | ✓* |
| 激活游戏会话 | ✓ | ✓ | |
| 可用的游戏会话 | ✓ | ✓ | |
| 可用游戏会话所占百分比 | ✓ | ✓ | |
| 并发可激活游戏会话数 | ✓ | ✓ | |
| 游戏会话中断次数 | ✓ | ✓ | |
| 活动服务器进程数 | ✓ | ||
| 运行状况良好的游戏服务器数 | ✓ | ||
| 崩溃的游戏会话数 | ✓ |
*可通过使用遥测数据的自定义 Prometheus 查询获取。
玩家使用情况指标
玩家会话和并发用户指标:
| 指标 | 控制台 | CloudWatch | 遥测 |
|---|---|---|---|
| 当前玩家会话 | ✓ | ||
| 玩家会话激活次数 | ✓ | ||
| 全局并发用户数(CCU) | ✓ | ||
| 位置并发用户数(CCU) | ✓ | ||
| 位置容量 | ✓ |
容器实例集指标
特定于容器的指标(仅 CloudWatch 适用于集装箱舰队):
| 指标 | 控制台 | CloudWatch | 遥测 |
|---|---|---|---|
| 活动容器组数 | ✓ | ✓ | |
| 空闲容器组数 | ✓ | ✓ | |
| 容器 CPU/Memory 利用率 | ✓ | ✓ | |
| 容器网络流量 | ✓ | ✓ | |
| 容器存储操作次数 | ✓ | ✓ |
选择合适的监控源
根据具体需求选择监控方法:
-
使用服务器遥测指标来监控来自游戏服务器的全面性能数据,并发出特定于游戏的自定义指标。这些指标可以详细了解所有游戏引擎和服务器的服务器性能、网络活动、内存使用情况和计时数据 SDKs。您可针对游戏事件、业务逻辑性能和特定于应用程序的数据点定义自定义指标。所有控制面板均可完全自定义,您可以创建自定义 Prometheus 查询,从收集的数据中获取更多指标。有关更多信息,请参阅 使用服务器遥测指标进行监控。
-
使用 Amazon GameLift Servers 控制台实现实例集管理、容量规划和一般运营监督。该控制台提供实例集运行状况与玩家活动的集成视图。有关更多信息,请参阅 使用 Amazon GameLift Servers 管理游戏托管资源。
-
使用 Amazon CloudWatch 进行自动监控、警报以及与其他 Amazon 服务的集成。 CloudWatch 启用自定义仪表板和基于警报的自动化。有关更多信息,请参阅 Amazon GameLift Servers使用 Amazon 进行监控 CloudWatch。
-
使用 Amazon Managed Service for Prometheus 实现高性能指标收集与存储,并支持 PromQL 查询功能。Prometheus 为服务器遥测指标提供可扩展的时间序列数据存储。
-
使用 Amazon Managed Grafana 实现高级可视化和完全可自定义的控制面板管理。Grafana 提供您可以自定义和扩展的 GameLift 预建仪表板,还支持创建包含多个数据源的完全自定义的仪表板。您可以构建自定义查询和可视化工具,以追踪游戏中任何重要的指标。
-
使用多个来源实现全面监控。将控制台监督、服务器遥测指标和自动化警报结合起来,全面了解游戏托管基础设施。
要获得其他监控功能,还可使用以下方法:
-
使用 Amazon CloudTrail 记录 Amazon GameLift Servers API 调用 – 跟踪 API 调用和相关事件,满足审计与合规性要求。
-
在 Amazon GameLift Servers 中记录服务器消息 – 捕获自定义服务器消息和游戏会话日志。