检查状态 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

检查状态

检查您的设备或机群是否已连接并对数据进行采样。通过手动或自动进行定期检查,您可以检查设备或机群是否正常工作。

在以下网址使用 Amazon S3 控制台:https://console.aws.amazon.com/s3/以交互方式选择机队进行状态检查。您也可以使用 Amazon SDK for Python (Boto3)。以下介绍了与 Boto3 的不同 API,您可以用来检查设备或队列的状态。请使用最符合您的使用案例的 API。

  • 检查单个设备。

    要查看单个设备的状态,请使用DescribeDeviceAPI。如果已将模型部署到设备,则会提供包含一个或多个型号的列表。

    sagemaker_client.describe_device( DeviceName="sample-device-1", DeviceFleetName="sample-fleet-name" )

    正在运行DescribeDevice返回:

    { "DeviceName": "sample-device". "Description": "this is a sample device", "DeviceFleetName": "sample-device-fleet", "IoTThingName": "SampleThing", "RegistrationTime": 1600977370, "LatestHeartbeat": 1600977370, "Models":[ { "ModelName": "sample-model", "ModelVersion": "1.1", "LatestSampleTime": 1600977370, "LatestInference": 1600977370 } ] }
  • 检查设备队列。

    要查看队列的状态,请使用GetDeviceFleetReportAPI。提供设备队列的名称以获取队列摘要。

    sagemaker_client.get_device_fleet_report( DeviceFleetName="sample-fleet-name" )
  • 检查心跳。

    队列中的每个设备都会定期生成信号或 “心跳”。心跳可用于检查设备是否正在与边缘管理器进行通信。如果最后一个心跳的时间戳没有更新,则设备可能会出现故障。

    检查设备使用的最后一个心跳DescribeDeviceAPI。指定设备的名称和边缘设备所属的队列。

    sagemaker_client.describe_device( DeviceName="sample-device-1", DeviceFleetName="sample-fleet-name" )