监控 Amazon GameLift Servers - Amazon GameLift Servers
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控 Amazon GameLift Servers

监控是维护和其他 Amazon 解决方案的可靠性、可用性和性能的重要组成部分。Amazon GameLift ServersAmazon GameLift Servers 指标有三个主要用途:监控系统运行状况和设置警报;跟踪游戏服务器的性能和使用情况;以及使用手动或自动扩展功能管理容量。

Amazon 提供以下监控工具Amazon GameLift Servers,供您监视、报告问题并在适当时自动采取措施:

  • Amazon GameLift Servers 控制台 – 使用图形界面管理您的 Amazon GameLift Servers 资源并跟踪游戏托管活动。

  • 服务器遥测指标 – Amazon GameLift Servers 支持您通过 SDK 和插件集成,直接从游戏服务器发送自定义指标。您可以定义并跟踪自己的游戏特定指标以及内置的性能、网络、内存和计时数据。所有指标都可以发布到 Amazon Managed Service for Prometheus,并使用完全可自定义的控制面板在 Amazon Grafana 中进行监控。您也可以发布到 Amazon CloudWatch 以与其他 Amazon 服务集成。遥测系统可完全自定义,除内置指标外,您还可以创建自定义 Prometheus 查询,以获取更多指标。有关特定技术栈的实施指南,请参阅使用服务器遥测指标进行监控

  • Amazon CloudWatch — 您可以实时监控Amazon GameLift Servers指标,以及您在 Amazon 服务上运行的其他 Amazon 资源和应用程序的指标。Amazon CloudWatch 提供了一套监控功能,包括用于创建自定义控制面板的工具,以及设置警报以在指标达到指定阈值时发出通知或采取行动的功能。

  • Amazon CloudTrail— 捕获由您的账户或代表您的 Amazon 账户为和其他 Amazon 服务进行的所有 API 调用Amazon GameLift Servers和相关事件。数据将作为日志文件传送到您指定的 Amazon S3 存储桶。您可以识别哪些用户和帐户拨打了电话 Amazon、发出呼叫的源 IP 地址以及呼叫发生的时间。

  • 游戏会话日志 – 您可以将游戏会话的自定义服务器消息输出到存储在 Amazon S3 中的日志文件中。

跨监控源的指标比较

Amazon GameLift Servers通过三个主要来源提供指标:Amazon GameLift Servers控制台舰队活动指标、服务器遥测指标和 Amazon CloudWatch Amazon GameLift Servers 指标。了解每个来源的重叠情况和独特功能,可以帮助您根据需要选择合适的监控方法。

按来源划分的指标可用性

下表按指标类别显示了不同监控来源可用的指标。

实例指标

实例集容量和运行状况监控的实例级指标:

实例指标可用性
指标 控制台 CloudWatch 遥测
活动实例
空闲实例 ✓*
空闲实例所占百分比 ✓*
预期实例数
最大实例数
最小实例数
CPU 使用率
网络输入/输出量
Disk/Storage read/write
实例中断次数
实例回收次数
运行不正常的实例替换次数

*可通过使用遥测数据的自定义 Prometheus 查询获取。

游戏服务器指标

服务器进程和游戏会话指标:

游戏服务器指标可用性
指标 控制台 CloudWatch 遥测
有效游戏会话 ✓*
激活游戏会话
可用的游戏会话
可用游戏会话所占百分比
并发可激活游戏会话数
游戏会话中断次数
活动服务器进程数
运行状况良好的游戏服务器数
崩溃的游戏会话数

*可通过使用遥测数据的自定义 Prometheus 查询获取。

玩家使用情况指标

玩家会话和并发用户指标:

玩家使用情况指标可用性
指标 控制台 CloudWatch 遥测
当前玩家会话
玩家会话激活次数
全局并发用户数(CCU)
位置并发用户数(CCU)
位置容量

容器实例集指标

特定于容器的指标(仅 CloudWatch 适用于集装箱舰队):

容器实例集指标可用性
指标 控制台 CloudWatch 遥测
活动容器组数
空闲容器组数
容器 CPU/Memory 利用率
容器网络流量
容器存储操作次数

选择合适的监控源

根据具体需求选择监控方法:

  • 使用服务器遥测指标来监控来自游戏服务器的全面性能数据,并发出特定于游戏的自定义指标。这些指标可以详细了解所有游戏引擎和服务器的服务器性能、网络活动、内存使用情况和计时数据 SDKs。您可针对游戏事件、业务逻辑性能和特定于应用程序的数据点定义自定义指标。所有控制面板均可完全自定义,您可以创建自定义 Prometheus 查询,从收集的数据中获取更多指标。有关更多信息,请参阅 使用服务器遥测指标进行监控

  • 使用 Amazon GameLift Servers 控制台实现实例集管理、容量规划和一般运营监督。该控制台提供实例集运行状况与玩家活动的集成视图。有关更多信息,请参阅 使用 Amazon GameLift Servers 管理游戏托管资源

  • 使用 Amazon CloudWatch 进行自动监控、警报以及与其他 Amazon 服务的集成。 CloudWatch 启用自定义仪表板和基于警报的自动化。有关更多信息,请参阅 Amazon GameLift Servers使用 Amazon 进行监控 CloudWatch

  • 使用 Amazon Managed Service for Prometheus 实现高性能指标收集与存储,并支持 PromQL 查询功能。Prometheus 为服务器遥测指标提供可扩展的时间序列数据存储。

  • 使用 Amazon Managed Grafana 实现高级可视化和完全可自定义的控制面板管理。Grafana 提供您可以自定义和扩展的 GameLift 预建仪表板,还支持创建包含多个数据源的完全自定义的仪表板。您可以构建自定义查询和可视化工具,以追踪游戏中任何重要的指标。

  • 使用多个来源实现全面监控。将控制台监督、服务器遥测指标和自动化警报结合起来,全面了解游戏托管基础设施。

要获得其他监控功能,还可使用以下方法:

主题