部署模型 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

部署模型

您可以通过以下方式将计算模块部署到资源受限的边缘设备上:将编译后的模型从 Amazon S3 下载到设备并使用 DLR,也可以使用 Amazon IoT Greengrass

在继续操作之前,请确保您的边缘设备一定受 SageMaker Neo 支持。请参阅支持的框架、设备、系统和架构,以了解支持哪些边缘设备。确保您在提交编译作业时指定了目标边缘设备,请参阅使用 Neo 编译模型

部署编译的模型 (DLR)

DLR 是用于深度学习模型和决策树模型的紧凑型通用运行时系统。DLR 使用 TVM 运行时系统、Treelite 运行时系统、NVIDIA TensorRT™,并且可以包括其他特定于硬件的运行时系统。DLR 提供统一的 Python/C++ API,用于在各种设备上加载和运行编译的模型。

您可以使用以下 pip 命令安装最新版本的 DLR 软件包:

pip install dlr

要在 GPU 目标或非 x86 边缘设备上安装 DLR,请参阅版本以获取预构建的二进制文件,或参阅安装 DLR 以根据源代码构建 DLR。例如,要为 Raspberry Pi 3 安装 DLR,可以使用:

pip install https://neo-ai-dlr-release.s3-us-west-2.amazonaws.com/v1.3.0/pi-armv7l-raspbian4.14.71-glibc2_24-libstdcpp3_4/dlr-1.3.0-py3-none-any.whl

部署模型 (Amazon IoT Greengrass)

Amazon IoT Greengrass 将云功能扩展到本地设备。它使得设备可以更靠近信息源来收集和分析数据,自主响应本地事件,同时在本地网络上彼此安全地通信。借助 Amazon IoT Greengrass,您可以使用云训练的模型,在边缘设备上根据本地生成的数据执行机器学习推理。目前,您可以将模型部署到基于 ARM Cortex-A、Intel Atom 和 Nvidia Jetson 系列处理器的所有 Amazon IoT Greengrass 设备上。有关部署 Lambda 推理应用程序以通过 Amazon IoT Greengrass 执行机器学习推理的更多信息,请参阅如何使用 Amazon 管理控制台配置优化的机器学习推理