本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon GameLift Servers使用 Amazon 进行监控 CloudWatch
您可以Amazon GameLift Servers使用 Amazon 进行监控 CloudWatch,该 Amazon 服务可收集原始数据并将其处理为可读的近乎实时的指标。这些统计数据将保留 15 个月,以便从历史角度了解使用 Amazon GameLift Servers 托管游戏服务器的性能。您可以设置用于监控特定阈值的警报,并在达到相应阈值时发送通知或执行操作。有关更多信息,请参阅 Amazon CloudWatch 用户指南。
为了通过详细的遥测指标增强服务器端的可观测性,Amazon GameLift Servers 还支持通过 Amazon Managed Service for Prometheus 和 Amazon Managed Grafana 进行监控。这些遥测指标提供了详细的服务器性能数据,包括:
-
服务器计时:服务器增量时间(服务器节拍率一致性)、服务器节拍率(每秒更新)、服务器节拍时间(每个节拍的处理时间)和服务器世界节拍时间(游戏世界更新时间)
-
网络指标:连接(网络连接总数)、以字节和数据包为单位的网络 I/O (数据传输统计信息)和数据包丢失(传输失败百分比)
-
内存指标:以单位表示的内存使用量(总内存消耗)和物理内存使用百分比(内存利用率)
-
CPU 使用率:CPU 使用百分比(按游戏服务器进程显示的资源利用率)
有关特定于您的 SDK 或插件的实施指南,请参阅使用服务器遥测指标进行监控。
以下各表列出 Amazon GameLift Servers 的指标和维度。中可用的所有指标 CloudWatch 也可在控制台中找到,Amazon GameLift Servers控制台以一组可自定义的图表形式提供数据。要访问游戏的 CloudWatch 指标,请 Amazon Web Services 管理控制台使用 Amazon CLI、或 CloudWatch API。
如果指标没有位置,则使用起始位置。
Amazon GameLift Servers 指标的维度
Amazon GameLift Servers 支持按以下维度来筛选指标。
| 维度 | 说明 |
|---|---|
|
筛选实例集部署位置的指标。如果指标没有位置,则使用起始位置。 |
|
|
筛选单个实例集的指标。该维度可用于实例、服务器进程、游戏会话和玩家会话的所有实例集指标。 |
|
|
筛选实例集集合的指标。通过将指标组名称添加到队列的属性中,将队列添加到指标组(请参阅 UpdateFleetAttributes())。该维度可用于实例、服务器进程、游戏会话和玩家会话的所有实例集指标。 |
|
|
筛选单个队列的指标。该维度只用于游戏会话队列的指标。 |
|
|
筛选用于单个对战配置的指标。此维度仅与用于对战配置的指标一起使用。 |
|
|
筛选用于对战配置与对战规则的相交处的指标。此维度仅与用于对战规则的指标一起使用。 |
|
|
筛选 EC2 实例类型名称的指标,例如 “c4.large”。此维度与竞价型实例的指标一起使用。 |
|
|
筛选实例的操作系统的指标。此维度与竞价型实例的指标一起使用。 |
|
筛选用于游戏服务器组的 FleetIQ 指标。 |
|
筛选集装箱船队 GameServer ContainerGroup 指标,以区分船队位置 PerInstance ContainerGroup 指标和船队位置指标。此维度包含在某些容器实例集指标(例如 ContainerNetworkIn、ContainerStorageReadBytes)中,可让您区分不同容器组类型的指标。 |
Amazon GameLift Servers 队组指标
Amazon GameLift 命名空间包含以下与整个实例集或实例集组活动相关的指标。队组与托管 Amazon GameLift Servers 解决方案一起使用。该Amazon GameLift Servers服务 CloudWatch 每分钟发送一次指标。
实例
| 指标 | 说明 |
|---|---|
|
具有 ACTIVE 状态的实例 (表示它们正在运行活动服务器进程)。计数包括空闲实例和托管一个或多个游戏会话的实例。该指标用于衡量当前的总计实例容量。该指标可与自动扩展功能配合使用。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
Amazon GameLift Servers 在队组中设法维护的活动实例的目标数量。配合自动扩展使用时,该值基于当前有效的扩展策略确定。不使用自动扩展时,该值需手动设置。查看实例集指标组数据时,该指标不可用。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
当前托管零 (0) 个游戏会话的活动实例。该指标用于衡量可用但未用的容量。该指标可与自动扩展功能配合使用。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
实例集允许的最大实例数。实例集的最大实例数决定了手动或自动扩展期间的容量上限。查看实例集指标组数据时,该指标不可用。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
实例集允许的最小实例数。实例集的最小实例数决定了手动或自动缩减期间的容量下限。查看实例集指标组数据时,该指标不可用。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
处于空闲状态的所有活动实例的百分比 (计算公式为: 单位:百分比 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
已回收和替换的竞价型实例的数量。Amazon GameLift Servers 会回收当前未托管游戏会话且中断概率很高的竞价型实例。此指标仅适用于托管 EC2 车队。 单位:计数 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
|
已回收和替换的竞价型实例的数量。Amazon GameLift Servers 会回收当前未托管游戏会话且中断概率很高的竞价型实例。此指标仅适用于容器实例集。 单位:计数 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
|
已中断的竞价型实例的数量。 单位:计数 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
|
EC2 公制。对于 Amazon GameLift Servers,此指标表示跨实例集位置中所有活跃实例的硬件性能。Amazon EC2 用于运行实例的物理 CPU 时间的百分比,其中包括运行用户代码和 Amazon EC2 代码所花费的时间。 CloudWatch 由于传统设备模拟、非传统设备配置、中断密集型工作负载、实时迁移和实时更新等因素,操作系统中的工具显示的百分比可能有所不同。 单位:百分比 |
|
EC2 公制。对于 Amazon GameLift Servers,此指标表示跨实例集位置中所有活跃实例的硬件性能。实例在所有网络接口上收到的字节数。该指标确认单个实例上向应用程序传入的网络流量。 单位:字节 |
|
EC2 公制。对于 Amazon GameLift Servers,此指标表示跨实例集位置中所有活跃实例的硬件性能。实例在所有网络接口上发送的字节数。该指标确认单个实例上向应用程序传出的网络流量。 单位:字节 |
|
EC2 公制。对于 Amazon GameLift Servers,此指标表示跨实例集位置中所有活跃实例的硬件性能。从可供实例使用的所有实例存储卷读取的字节数。该指标用来确定应用程序从实例的硬盘读取的数据量。它可以用于确定应用程序的速度。 单位:字节 |
|
EC2 公制。对于 Amazon GameLift Servers,此指标表示跨实例集位置中所有活跃实例的硬件性能。向可供实例使用的所有实例存储卷写入的字节数。该指标用来确定应用程序向实例的硬盘写入的数据量。它可以用于确定应用程序的速度。 单位:字节 |
|
EC2 公制。对于 Amazon GameLift Servers,此指标表示跨实例集位置中所有活跃实例的硬件性能。在指定时间段内从可供实例使用的所有实例存储卷完成的读取操作数。要计算该时段内的平均每秒 I/O 操作数 (IOPS),请将该时段内的总操作数除以该时段内的秒数。 单位:计数 |
|
EC2 公制。对于 Amazon GameLift Servers,此指标表示跨实例集位置中所有活跃实例的硬件性能。在指定时间段内向可供实例使用的所有实例存储卷完成的写入操作数。要计算该时段内的平均每秒 I/O 操作数 (IOPS),请将该时段内的总操作数除以该时段内的秒数。 单位:计数 |
服务器进程
| 指标 | 说明 |
|---|---|
|
具有 ACTIVE 状态的服务器进程 (表示它们正在运行并且能够托管游戏会话)。计数包括空闲服务器进程和托管游戏会话的进程。该指标用于衡量当前的总计服务器处理能力。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
报告运行正常的活动服务器进程。该指标有助于跟踪实例集游戏服务器的整体运行状况。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
|
报告运行正常的所有活动服务器进程的百分比 (计算公式为: 单位:百分比 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
自上次报告以来因异常情况而被关闭的服务器进程。该指标包括 Amazon GameLift Servers 服务发起的终止。当服务器进程停止响应、持续报告运行状况检查失败或没有干净地终止(通过调用 ProcessEnding())时,就会发生这种情况。 单位:计数 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
|
自上次报告以来,从 ACTIVATING 成功转换为 ACTIVE 状态的服务器进程。服务器进程必须处于活动状态才能托管游戏会话。 单位:计数 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
|
自上次报告以来关闭的服务器进程。这包括由于任何原因转换到 TERMINATED 状态的所有服务器进程,包括正常和异常进程终止。 单位:计数 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
游戏会话
| 指标 | 说明 |
|---|---|
|
具有 ACTIVATING 状态的游戏会话 (表示它们正在启动)。游戏会话在进入活动状态前无法托管玩家。如果该数字的值在一段时间内一直很高,可能说明游戏会话无法从 ACTIVATING 转换为 ACTIVE 状态。该指标可与自动扩展功能配合使用。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
具有 ACTIVE 状态的游戏会话 (表示它们能够托管玩家,并且正在托管零个或多个玩家)。该指标用于衡量当前被托管的游戏会话的总数。该指标可与自动扩展功能配合使用。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
当前未用于托管游戏会话并且可以毫不延迟地启动新的游戏会话以启动新的服务器进程或实例的主动、运行正常的服务器进程。该指标可与自动扩展功能配合使用。 注意对于限制并发游戏会话激活的实例集,请使用指标 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
当前未用于托管游戏会话且可以立即启动新游戏会话的主动、运行正常的服务器进程。 该指标与 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
所有活动服务器进程 (运行正常或不正常) 上当前未使用的游戏会话槽的百分比 (计算公式为: 单位:百分比 相关 CloudWatch 统计数据:平均 维度:位置 |
|
已中断的竞价型实例上的游戏会话的数量。 单位:计数 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
玩家会话
| 指标 | 说明 |
|---|---|
|
具有 ACTIVE 状态 (玩家已连接到活动游戏会话) 或 RESERVED 状态 (已在游戏会话中为玩家分配槽,但玩家尚未连接) 的玩家会话。该指标可与自动扩展功能配合使用。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 |
|
自上次报告以来,从 RESERVED 状态转换为 ACTIVE 状态的玩家会话。当玩家成功连接到活动的游戏会话时,就会出现这种情况。 单位:计数 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 |
容器实例集指标
容器实例集指标为基于容器的游戏托管提供监控数据,包括容器组状态、资源利用率和性能指标。
注意
使用遥测指标解决方案时,可通过 Amazon Managed Grafana 获得用于监控容器实例集的增强型控制面板。有关设置说明,请参阅使用服务器遥测指标进行监控。
| 指标 | 说明 |
|---|---|
|
当前处于活动状态并已准备好托管游戏会话的容器组。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
处于活动状态但当前未托管游戏会话的容器组。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
正处于启动过程中的容器组。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
正处于关闭过程中的容器组。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
由于运行状况检查失败而被替换的容器组。 单位:计数 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
|
实例上所有容器的平均 CPU 利用率。 单位:百分比 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
容器预留的 CPU 资源的百分比。 单位:百分比 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
容器预留的内存资源的百分比。 单位:百分比 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
容器正在使用的预留内存百分比。 单位:百分比 相关 CloudWatch 统计数据:平均值、最小值、最大值 维度:位置 |
|
容器收到的网络字节数。 单位:字节 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
|
容器发送的网络字节数。 单位:字节 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
|
容器从存储中读取的字节数。 单位:字节 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
|
容器写入存储的字节数。 单位:字节 相关 CloudWatch 统计数据:总和、平均值、最小值、最大值 维度:位置 |
Amazon GameLift Servers 队列指标
Amazon GameLift 命名空间包含以下与整个游戏会话放置队列中的活动有关的指标。队列与托管 Amazon GameLift Servers 解决方案一起使用。该Amazon GameLift Servers服务 CloudWatch 每分钟发送一次指标。
| 指标 | 说明 |
|---|---|
|
队列中具有 PENDING 状态的游戏会话放置请求等待执行的平均时长。 单位:秒 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 维度:位置 |
|
|
成功放入游戏会话,但不是首选实例集,因为该实例集被视为不可行(例如,具有较高中断率的竞价型实例集)。该指标基于成本,而不是延迟。首选实例集是队列中列出的第一个实例集,或者当放置请求包含玩家延迟数据时,FleetIQ 优先级选择的第一个实例集。如果没有可行的竞价型实例集,则可以选择该区域中的任何实例集。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 |
|
|
成功放入游戏会话,但不是首选实例集,因为该实例集没有可用资源。首选实例集是队列中列出的第一个实例集,或者当放置请求包含玩家延迟数据时,您定义的 FleetIQ 优先级选择的第一个实例集。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 |
|
|
游戏会话成功放入为玩家提供队列最低延迟的区域。此指标仅当放置请求中包含玩家延迟数据时发出。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 |
|
|
游戏会话成功放入选定区域的队列价格最低的实例集。此实例集可以是竞价型实例集或按需型实例(如果队列中没有竞价型实例集)。此指标仅当放置请求中包含玩家延迟数据时发出。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 |
|
|
游戏会话成功放入位于指定区域中的实例集。此指标按区域细分 单位:计数 相关 CloudWatch统计数据:总和 |
|
自上次报告以来,在超时前被取消的游戏会话放置请求。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 |
|
|
自上次报告以来,因任何原因失败的游戏会话放置请求。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 |
|
自上次报告以来,添加到队列中的新的游戏会话放置请求。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 |
|
自上次报告以来,产生了新游戏会话的游戏会话放置请求。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 |
|
自上次报告以来,达到队列超时限制而未执行的游戏会话放置请求。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 |
|
队列中状态为 PENDING 的游戏会话放置请求的数量。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 维度:位置 |
用于对战的 Amazon GameLift Servers 指标
Amazon GameLift 命名空间包括用于对战配置和对战规则的 FlexMatch 活动的指标。FlexMatch 对战与托管 Amazon GameLift Servers 解决方案一起使用。该Amazon GameLift Servers服务 CloudWatch 每分钟发送一次指标。
有关对战活动序列的更多信息,请参阅 Amazon GameLift ServersFlexMatch 的工作原理。
对战配置
指标 |
说明 |
|---|---|
|
当前正在处理或等待处理的对战请求。 单位:计数 相关 CloudWatch 统计数据:平均值、最小值、最大值、总和 |
|
对于要求接受的对战配置,潜在对战游戏从上次报告后在接受过程中超时。 单位:计数 相关 CloudWatch 统计数据:总和 |
|
对于要求接受的对战配置,是上次报告后被接受的潜在对战游戏。 单位:计数 相关 CloudWatch 统计数据:总和 |
|
上次报告后创建的潜在对战游戏。 单位:计数 相关 CloudWatch 统计数据:总和 |
|
上次报告后成功放入游戏会话中的对战游戏。 单位:计数 相关 CloudWatch 统计数据:总和 |
|
对于要求接受的对战配置,是上次报告后至少被一位玩家拒绝的潜在对战游戏。 单位:计数 相关 CloudWatch 统计数据:总和 |
|
上次报告后在对战票证中添加的玩家。 单位:计数 相关 CloudWatch 统计数据:总和 |
|
上次报告后未成功完成对战游戏而发出的对战请求。 单位:计数 相关 CloudWatch 统计数据:总和 |
|
上次报告后创建的新对战请求。 单位:计数 相关 CloudWatch 统计数据:总和 |
|
上次报告后达到超时限制的对战请求。 单位:计数 相关 CloudWatch 统计数据:总和 |
|
对于上次报告前放入潜在对战游戏的对战请求,是票证创建和潜在对战游戏创建之间的时间量。 单位:秒 相关 CloudWatch 统计数据:数据样本、平均值、最小值、最大值 |
|
对于上次报告前取消的对战请求,是票证创建和取消之间的时间量。 单位:秒 相关 CloudWatch 统计数据:数据样本、平均值、最小值、最大值 |
|
对于上次报告前成功的对战请求,是票证创建和成功的对战游戏放置之间的时间量。 单位:秒 相关 CloudWatch 统计数据:数据样本、平均值、最小值、最大值 |
对战规则
| 指标 | 说明 |
|---|---|
|
上次报告后在对战时通过的规则评估。此指标仅限前 50 条规则。 单位:计数 相关 CloudWatch统计数据:总和 |
|
上次报告后在对战时未通过的规则评估。此指标仅限前 50 条规则。 单位:计数 相关 CloudWatch 统计数据:总和 |
Amazon GameLift ServersFleetIQ的 指标
Amazon GameLift 命名空间包含用于 FleetIQ 游戏服务器组和游戏服务器活动的指标,作为用于游戏托管的 FleetIQ 独立解决方案的一部分。该Amazon GameLift Servers服务 CloudWatch 每分钟发送一次指标。另请参阅 Amazon A uto Scaling 用户指南 CloudWatch中的使用亚马逊监控您的 A EC2 uto Scaling 组和实例。
| 指标 | 说明 |
|---|---|
|
可用于运行游戏执行但当前未被玩游戏占用的游戏服务器数量。此数字包括已认领但仍处于 AVAILABLE(可用)状态的游戏服务器。 单位:计数 亚马逊的相关 CloudWatch 统计数据:总和 尺寸: GameServerGroup |
|
当前被游戏占用的游戏服务器数量。此数字包括处于 UTILIZED 状态的游戏服务器。 单位:计数 亚马逊的相关 CloudWatch 统计数据:总和 尺寸: GameServerGroup |
|
|
当前不支持玩游戏且计划终止的实例上的游戏服务器数量。这些游戏服务器属于为响应新的认领请求而认领的最低优先级。 单位:计数 亚马逊的相关 CloudWatch 统计数据:总和 尺寸: GameServerGroup |
|
|
当前支持玩游戏且计划终止的实例上的游戏服务器数量。 单位:计数 亚马逊的相关 CloudWatch 统计数据:总和 尺寸: GameServerGroup |
|
|
当前支持游戏执行的游戏服务器所占的部分。此指标表示当前正在使用的游戏服务器容量。它可用于促使制定相应的自动扩缩策略,以便可以动态添加和删除实例来与玩家需求匹配。 单位:百分比 Amazon 的相关 CloudWatch 统计数据:平均值、最小值、最大值 尺寸: GameServerGroup |
|
|
由于竞价型实例可用性有限而中断的竞价型实例上的游戏服务器数量。 单位:计数 亚马逊的相关 CloudWatch 统计数据:总和 尺寸: GameServerGroup, InstanceType |
|
|
由于可用性有限而中断的竞价型实例数量。 单位:计数 亚马逊的相关 CloudWatch 统计数据:总和 尺寸: GameServerGroup, InstanceType |