Amazon IoT 指标和维度 - Amazon IoT Core
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon IoT 指标和维度

当您与交互时 Amazon IoT,该服务 CloudWatch 每分钟都会向其发送以下指标和维度。您可以使用以下流程查看 的指标 Amazon IoT

查看指标(CloudWatch 控制台)

指标的分组首先依据服务命名空间,然后依据每个命名空间内的各种维度组合。

  1. 打开CloudWatch 控制台

  2. 在导航窗格中,选择 Metrics(指标)然后选择 All metrics(所有指标)。

  3. 在 “浏览” 选项卡中,搜索 Amazon IoT 以查看指标列表。

查看指标 (CLI)
  • 在命令提示符处输入下面的命令:

    aws cloudwatch list-metrics --namespace "Amazon/IoT"

Amazon IoT 指标

指标 描述

AddThingToDynamicThingGroupsFailed

与将事物添加到动态事物组相关联的失败事件数。DynamicThingGroupName 维度包含添加事物时失败的动态组的名称。

NumLogBatchesFailedToPublishThrottled

因限制错误而无法发布的日志事件的单个批次。

NumLogEventsFailedToPublishThrottled

批处理中的因限制错误而无法发布的日志事件的数量。

Amazon IoT Core 凭证提供者指标

指标 描述

CredentialExchangeSuccess

向 Amazon IoT Core 凭证提供程序成功提交 AssumeRoleWithCertificate 请求的数量。

服务器证书 OCSP 装订指标

指标 描述
检索 StapleData OCSP .Success OCSP 响应已成功接收并处理。此响应将包含在已配置域的 TLS 握手期间。该DomainConfigurationName维度包含已启用服务器证书 OCSP 装订的已配置域的名称。

规则指标

指标 描述

ParseError

在规则所侦听的主题上发布的消息中出现的 JSON 分析错误的数量。RuleName 维度包含规则的名称。

RuleMessageThrottled

由于恶意行为或由于消息数超过了规则引擎的限制,规则引擎限制的消息数。RuleName 维度包含要触发的规则的名称。

RuleNotFound

找不到要触发的规则。RuleName 维度包含规则的名称。

RulesExecuted

已执行的 Amazon IoT 规则数。

TopicMatch

已在规则所侦听的主题上发布的传入消息的数量。RuleName 维度包含规则的名称。

规则操作指标

指标 描述

Failure

失败的规则操作调用的数量。RuleName 维度包含指定操作的规则的名称。ActionType 维度包含已调用的操作的类型。

Success

成功的规则操作调用的数量。RuleName 维度包含指定操作的规则的名称。ActionType 维度包含已调用的操作的类型。

ErrorActionFailure 失败的错误操作数量。RuleName 维度包含指定操作的规则的名称。ActionType 维度包含已调用的操作的类型。
ErrorActionSuccess 成功的错误操作数量。RuleName 维度包含指定操作的规则的名称。ActionType 维度包含已调用的操作的类型。

HTTP 操作特定指标

指标 描述

HttpCode_Other

如果来自下游 Web 服务/应用程序的响应的状态代码不是 2xx、4xx 或 5xx,则生成此指标。

HttpCode_4XX

如果来自下游 Web 服务/应用程序的响应的状态代码介于 400 和 499 之间,则生成此指标。

HttpCode_5XX

如果来自下游 Web 服务/应用程序的响应的状态代码介于 500 和 599 之间,则生成此指标。

HttpInvalidUrl

如果在替换模板后的终端节点 URL 不以 https:// 开头,则生成此指标。

HttpRequestTimeout

如果下游 Web 服务/应用程序未在请求超时限制内返回响应,则生成此指标。有关更多信息,请参阅 Service Quotas

HttpUnknownHost

如果 URL 有效,但服务不存在或无法访问,则生成此指标。

消息代理指标

注意

消息代理指标显示在 CloudWatch 控制台的协议指标下。

指标 描述

Connect.AuthError

无法由消息代理授权的连接请求的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Connect.ClientError

因 MQTT 消息未能满足Amazon IoT 配额中定义的要求而被拒绝的连接请求的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Connect.ClientIDThrottle

因该客户端超出指定客户端 ID 所允许的连接请求速率而受限的连接请求的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Connect.ServerError

因出现内部错误而导致失败的连接请求的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Connect.Success

与消息代理的成功连接的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Connect.Throttle

因账户超出允许的连接请求速率而受限的连接请求的数量。Protocol 维度包含用于发送 CONNECT 消息的协议。

Ping.Success

消息代理收到的 ping 消息的数量。Protocol 维度包含用于发送 ping 消息的协议。

PublishIn.AuthError

消息代理无法授权的发布请求的数量。Protocol 维度包含用于发布消息的协议。HTTP 发布不支持此指标。

PublishIn.ClientError

因消息未能满足Amazon IoT 配额中定义的要求而被消息代理拒绝的发布请求的数量。Protocol 维度包含用于发布消息的协议。HTTP 发布不支持此指标。

PublishIn.ServerError

因出现内部错误而导致消息代理无法处理的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。HTTP 发布不支持此指标。

PublishIn.Success

消息代理已成功处理的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishIn.Throttle

因客户端超出允许的入站消息速率而受限制的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。HTTP 发布不支持此指标。

PublishOut.AuthError

Amazon IoT 无法授权的由消息代理发出的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishOut.ClientError

因消息未能满足Amazon IoT 配额中定义的要求而被拒绝的由消息代理发出的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishOut.Success

消息代理已成功发出的发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishOut.Throttle

因客户端超出允许的入站消息速率而节流的发布请求数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishRetained.AuthError

消息代理无法授权的 RETAIN 标签集发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishRetained.ServerError

因出现内部错误而导致消息代理无法处理的保留发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishRetained.Success

消息代理已成功处理的 RETAIN 标签集发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

PublishRetained.Throttle

因客户端超出允许的入站消息速率而受限制的 RETAIN 标签集发布请求的数量。Protocol 维度包含用于发送 PUBLISH 消息的协议。

Queued.Success

消息代理为与持久性会话断开连接的客户端成功处理的存储消息的数量。QoS 为 1 的消息是在具有持久性会话的客户端断开连接时存储的。

Queued.Throttle

在具有持久性会话的客户端断开连接时无法存储和受限制的消息的数量。当客户端超过每个账户每秒的排队消息数限制时,就会发生这种情况。QoS 为 1 的消息是在具有持久性会话的客户端断开连接时存储的。

Queued.ServerError

由于内部错误而未为持久性会话存储的消息数量。当具有持久性会话的客户端断开连接时,将存储服务质量(QoS)为 1 的消息。

Subscribe.AuthError

无法授权的由客户端发出的订阅请求的数量。Protocol 维度包含用于发送 SUBSCRIBE 消息的协议。

Subscribe.ClientError

SUBSCRIBE 消息未能满足 Amazon IoT 配额 中定义的要求而被拒绝的订阅请求的数量。Protocol 维度包含用于发送 SUBSCRIBE 消息的协议。

Subscribe.ServerError

因出现内部错误而被拒绝的订阅请求的数量。Protocol 维度包含用于发送 SUBSCRIBE 消息的协议。

Subscribe.Success

消息代理已成功处理的订阅请求的数量。Protocol 维度包含用于发送 SUBSCRIBE 消息的协议。

Subscribe.Throttle

因客户端超出允许的订阅请求速率而受限的订阅请求的数量。Protocol 维度包含用于发送 SUBSCRIBE 消息的协议。

Throttle.Exceeded 此指标将显示在 MQTT 客户端根据每个连接级别限制的每秒数据包数进行限制 CloudWatch 时。此指标不适用于 HTTP 连接。

Unsubscribe.ClientError

UNSUBSCRIBE 消息未能满足 Amazon IoT 配额 中定义的要求而被拒绝的取消订阅请求的数量。Protocol 维度包含用于发送 UNSUBSCRIBE 消息的协议。

Unsubscribe.ServerError

因出现内部错误而被拒绝的取消订阅请求的数量。Protocol 维度包含用于发送 UNSUBSCRIBE 消息的协议。

Unsubscribe.Success

消息代理已成功处理的取消订阅请求的数量。Protocol 维度包含用于发送 UNSUBSCRIBE 消息的协议。

Unsubscribe.Throttle

因客户端超出允许的取消订阅请求速率而被拒绝的取消订阅请求的数量。Protocol 维度包含用于发送 UNSUBSCRIBE 消息的协议。

设备影子指标

注意

设备影子指标显示在 CloudWatch 控制台的 “协议指标” 下方。

指标 描述

DeleteThingShadow.Accepted

已成功处理的 DeleteThingShadow 请求的数量。Protocol 维度包含用于发出请求的协议。

GetThingShadow.Accepted

已成功处理的 GetThingShadow 请求的数量。Protocol 维度包含用于发出请求的协议。

ListThingShadow.Accepted

已成功处理的 ListThingShadow 请求的数量。Protocol 维度包含用于发出请求的协议。

UpdateThingShadow.Accepted

已成功处理的 UpdateThingShadow 请求的数量。Protocol 维度包含用于发出请求的协议。

任务指标

指标 描述

CanceledJobExecutionCount

在由确定的时间段CANCELED内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

CanceledJobExecutionTotalCount

给定任务的状态为 CANCELED 的任务执行总数。JobId 维度包含任务的 ID。

ClientErrorCount

执行任务时生成的客户端错误数。JobId 维度包含任务的 ID。

FailedJobExecutionCount

在由确定的时间段FAILED内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

FailedJobExecutionTotalCount

给定任务的状态为 FAILED 的任务执行总数。JobId 维度包含任务的 ID。

InProgressJobExecutionCount

在由确定的时间段IN_PROGRESS内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

InProgressJobExecutionTotalCount

给定任务的状态为 IN_PROGRESS 的任务执行总数。JobId 维度包含任务的 ID。

RejectedJobExecutionTotalCount

给定任务的状态为 REJECTED 的任务执行总数。JobId 维度包含任务的 ID。

RemovedJobExecutionTotalCount

给定任务的状态为 REMOVED 的任务执行总数。JobId 维度包含任务的 ID。

QueuedJobExecutionCount

在由确定的时间段QUEUED内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

QueuedJobExecutionTotalCount

给定任务的状态为 QUEUED 的任务执行总数。JobId 维度包含任务的 ID。

RejectedJobExecutionCount

在由确定的时间段REJECTED内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

RemovedJobExecutionCount

在由确定的时间段REMOVED内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

ServerErrorCount

执行任务时生成的服务器错误数。JobId 维度包含任务的 ID。

SuccededJobExecutionCount

在由确定的时间段SUCCESS内状态更改为的任务执行次数 CloudWatch。(有关 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 指标。) JobId 维度包含任务的 ID。

SuccededJobExecutionTotalCount

给定任务的状态为 SUCCESS 的任务执行总数。JobId 维度包含任务的 ID。

Device Defender audit 指标

指标 描述

NonCompliantResources

在检查中发现的不合规资源数。系统报告执行的每次审核中,对于每次检查发现的不合规资源数。

ResourcesEvaluated

执行合规性评估的资源数。系统报告执行的每次审核中,对于每次检查所评估的资源数。

MisconfiguredDeviceDefenderNotification

当你的 SNS 配置配置错误时会通知你。 Amazon IoT Device Defender

维度

Device Defender detect 指标

指标 描述

NumOfMetricsExported

云端、设备端或自定义指标导出的指标数量。系统会报告该账户就某项特定指标导出的指标数量。此指标仅对使用指标导出功能的客户提供。

NumOfMetricsSkipped

云端、设备端或自定义指标跳过的指标数量。由于为发布到 mqtt 主题而向 Device Defender Detect 提供的权限不足,系统会报告该账户就某项特定指标跳过的指标数量。此指标仅对使用指标导出功能的客户提供。

NumOfMetricsExceedingSizeLimit

由于大小超过 MQTT 消息大小限制,云端、设备端或自定义指标跳过导出的指标数量。系统会报告该账户因大小超过 MQTT 消息大小限制而跳过导出的指标数量。此指标仅对使用指标导出功能的客户提供。

Violations

自上次执行评估以来,所发现的安全配置文件行为的新违规数。系统针对特定安全配置文件,以及针对某个特定安全配置文件的特定行为,报告账户的新违规数。

ViolationsCleared

自上次执行评估以来,已解决的安全配置文件行为的违规数。系统针对特定安全配置文件,以及针对某个特定安全配置文件的特定行为,报告账户的已解决违规数。

ViolationsInvalidated

自上次执行评估以来,其信息不再可用(由于报告设备已停止报告,或者由于某个原因不再监控)的安全配置文件行为的违规数。系统针对特定安全配置文件,以及针对某个特定安全配置文件的特定行为,报告整个账户的已失效违规数。

MisconfiguredDeviceDefenderNotification

当你的 SNS 配置配置错误时会通知你。 Amazon IoT Device Defender

维度

设备预配置指标

Amazon IoT 舰队配置指标
指标 描述

ApproximateNumberOfThingsRegistered

Fleet Provisioning 注册的事物的计数。

虽然计数通常是准确的,但 Amazon IoT Core 的分布式架构使得很难让已注册事物保持精确计数。

此指标将使用的统计数据是:

  • Max(最大值),用以报告已注册事物的总数。有关在 CloudWatch聚合窗口期间注册的事物的计数,请参阅RegisterThingFailed指标。

维度:ClaimCertificateId

CreateKeysAndCertificateFailed

调用 CreateKeysAndCertificate MQTT API 时故障的次数。

在“成功”(值 = 0)和“故障”(值 = 1)情况下均发出该指标。此指标可用于跟踪在 CloudWatch支持的聚合时段(例如 5 分钟或 1 小时)内创建和注册的证书数量。

此指标的可用统计数据包括:

  • Sum(总计),用以报告失败的调用数。

  • SampleCount报告成功和失败的呼叫总数。

CreateCertificateFromCsrFailed

调用 CreateCertificateFromCsr MQTT API 时故障的次数。

在“成功”(值 = 0)和“故障”(值 = 1)情况下均发出该指标。此指标可用于跟踪在 CloudWatch支持的聚合时段(例如 5 分钟或 1 小时)内注册的事物的数量。

此指标的可用统计数据包括:

  • Sum(总计),用以报告失败的调用数。

  • SampleCount报告成功和失败的呼叫总数。

RegisterThingFailed

调用 RegisterThing MQTT API 时故障的次数。

在“成功”(值 = 0)和“故障”(值 = 1)情况下均发出该指标。此指标可用于跟踪在 CloudWatch支持的聚合时段(例如 5 分钟或 1 小时)内注册的事物的数量。有关注册的事物总数,请参阅 ApproximateNumberOfThingsRegistered 指标。

此指标的可用统计数据包括:

  • Sum(总计),用以报告失败的调用数。

  • SampleCount报告成功和失败的呼叫总数。

维度:TemplateName

J ust-in-time 配置指标
指标 描述

ProvisionThing.ClientError

由于客户端错误无法预置设备的次数。例如,模板中指定的策略不存在。

ProvisionThing.ServerError

由于服务器错误而无法预置设备的次数。客户可以在等待后重新尝试预置设备,如果问题仍然存在,则可以尝试联系 Amazon IoT 。

ProvisionThing.Success

成功预置设备的次数。

机群索引指标

Amazon IoT 舰队索引指标
指标 描述

NamedShadowCountForDynamicGroupQueryLimitExceeded

对于不是动态事物组中特定于数据来源的查询术语,每件事物最多处理 25 个命名影子。由于事件而违反该限制时,将发出 NamedShadowCountForDynamicGroupQueryLimitExceeded 事件类型。

指标的维度

指标使用命名空间并为以下维度提供指标
维度 描述
ActionType

触发请求的规则所指定的操作类型

BehaviorName

正受监控的 Device Defender Detect 安全配置文件行为的名称。

ClaimCertificateId

用于预置设备的申请的 certificateId

CheckName

正在监控其结果的 Device Defender Audit 检查的名称。

JobId

正在监控其进度或消息连接成功/失败的任务的 ID。

Protocol

用于提出请求的协议。有效值为:MQTT 或 HTTP

RuleName

由请求触发的规则的名称。

ScheduledAuditName

正在监控其检查结果的 Device Defender 计划审核的名称。如果报告的结果适用于按需执行的审计,此项具有值 OnDemand

SecurityProfileName

正在监控其行为的 Device Defender Detect 安全配置文件的名称。

TemplateName

预配置模板的名称。

SourceArn 指用于检测的安全配置文件或用于审计的账户 arn。

RoleArn

指设备防御者试图扮演的角色。

TopicArn

请参阅 Device Defender 尝试发布到的 SNS 主题。

Error

简要描述在尝试发布到 SNS 主题时收到的错误。可能的值有:
  • KeyNotFound“KMS”:表示该主题的 KMS 密钥不存在。

  • “InvalidTopicName“: 表示 SNS 主题无效。

  • AccessDenied“KMS”:表示该角色无权访问该主题的 KMS 密钥。

  • “AuthorizationError“: 表示所提供的角色未授权设备防御者向 SNS 主题发布内容。

  • “SNSTopicNotFound”:表示所提供的 SNS 主题不存在。

  • “FailureToAssumeRole“: 表示所提供的角色未授权设备防御者担任该角色。

  • “CrossRegionsnStopic”:表示 SNS 主题存在于不同的区域。