疑难解答 Neo 推断错误 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

疑难解答 Neo 推断错误

本部分包含有关如何防止和解决部署和/或调用终端节点时可能遇到的一些常见错误的信息。本节适用于PyTorch 1.4.0 或更高版本MXNet 版本 1.7.0 或更高版本.

  • 确保在 model_fn () 中完成了对有效输入数据的第一个推断(预热推理),否则在终端上可能会出现以下错误消息,predict API调用:

    An error occurred (ModelError) when calling the InvokeEndpoint operation: Received server error (0) from <users-sagemaker-endpoint> with message "Your invocation timed out while waiting for a response from container model. Review the latency metrics for each container in Amazon CloudWatch, resolve the issue, and try again."
  • 请确保设置了下表中的环境变量。如果未设置它们,则可能会显示以下错误消息:

    在终端上:

    An error occurred (ModelError) when calling the InvokeEndpoint operation: Received server error (503) from <users-sagemaker-endpoint> with message "{ "code": 503, "type": "InternalServerException", "message": "Prediction failed" } ".

    在 CloudWatch 中:

    W-9001-model-stdout com.amazonaws.ml.mms.wlm.WorkerLifeCycle - AttributeError: 'NoneType' object has no attribute 'transform'
    密钥
    制造者计划 inference.py
    制作者 _ 提交目录 /选项/ml/模型/代码
    集装箱日志级别 20
    制作者区域 <your region>
  • 确保已将MMS_DEFAULT_RESPONSE_TIMEOUT环境变量在创建 Amazon SageMaker 模型时设置为 500 或更高的值;否则,终端上可能会显示以下错误消息:

    An error occurred (ModelError) when calling the InvokeEndpoint operation: Received server error (0) from <users-sagemaker-endpoint> with message "Your invocation timed out while waiting for a response from container model. Review the latency metrics for each container in Amazon CloudWatch, resolve the issue, and try again."