部署模型 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

部署模型

您可以通过以下方法将计算模块部署到资源受限的边缘设备:将已编译的模型从 Amazon S3 下载到设备并使用 DLR,也可以使用 AWS IoT Greengrass

在继续操作之前,请确保您的边缘设备必须受到 SageMaker Neo 的支持。请参阅支持的框架、设备、系统和架构以了解支持的 边缘设备。确保在提交编译作业时指定了目标边缘设备,请参阅使用 Neo 编译模型

部署已编译的模型 (DLR)

DLR 是用于深度学习模型和决策树模型的紧凑的常见运行时。DLR 使用 TVM 运行时、Treelite 运行时和 NVIDIA TensorRTTM,并可以包含其他硬件特定的运行时。DLR 提供了统一的 Python/C++ APIs,用于在各种设备上加载和运行已编译的模型。

您可以使用以下 pip 命令安装 DLR 程序包的最新版本:

pip install dlr

有关在 GPU 目标或非 x86 边缘设备上安装 DLR 的信息,请参阅版本以了解预构建的二进制文件,或参阅安装 DLR 以了解从源构建 DLR。例如,要安装适用于 Raspberry Pi 3 的 DLR,您可以使用:

pip install https://neo-ai-dlr-release.s3-us-west-2.amazonaws.com/v1.3.0/pi-armv7l-raspbian4.14.71-glibc2_24-libstdcpp3_4/dlr-1.3.0-py3-none-any.whl

部署模型 (AWS IoT Greengrass)

AWS IoT Greengrass 将云功能扩展到本地设备。它使得设备可以更靠近信息源来收集和分析数据,自主响应本地事件,同时在本地网络上彼此安全地通信。借助 AWS IoT Greengrass,您可以使用云训练的模型对本地生成的数据在边缘执行机器学习推理。目前,您可以在基于 ARM Cortex-A、Intel Atom 和 Nvidia Jetson 系列处理器的所有 AWS IoT Greengrass 设备上部署模型。有关部署 Lambda 推理应用程序以通过 AWS IoT Greengrass 执行机器学习推理的更多信息,请参阅如何使用 AWS 管理控制台配置优化的机器学习推理