使用 Boto3 部署编译的模型
如果您是使用 Amazon SDK for Python (Boto3)、Amazon CLI 或 Amazon SageMaker 控制台编译模型,则必须满足先决条件部分中的要求。按照以下步骤,使用适用于 Python 的 Amazon Web Services SDK (Boto3)
主题
部署模型
在满足先决条件后,使用 create_model
、create_enpoint_config
和 create_endpoint
API。
以下示例演示如何使用这些 API 来部署使用 Neo 编译的模型:
import boto3 client = boto3.client('sagemaker') # create sagemaker model create_model_api_response = client.create_model( ModelName=
'my-sagemaker-model'
, PrimaryContainer={ 'Image':<insert the ECR Image URI>
, 'ModelDataUrl':'s3://path/to/model/artifact/model.tar.gz'
, 'Environment': {} }, ExecutionRoleArn='ARN for AmazonSageMaker-ExecutionRole'
) print ("create_model API response", create_model_api_response) # create sagemaker endpoint config create_endpoint_config_api_response = client.create_endpoint_config( EndpointConfigName='sagemaker-neomxnet-endpoint-configuration'
, ProductionVariants=[ { 'VariantName':<provide your variant name>
, 'ModelName':'my-sagemaker-model
', 'InitialInstanceCount': 1, 'InstanceType':<provide your instance type here>
}, ] ) print ("create_endpoint_config API response", create_endpoint_config_api_response) # create sagemaker endpoint create_endpoint_api_response = client.create_endpoint( EndpointName='provide your endpoint name'
, EndpointConfigName=<insert your endpoint config name>
, ) print ("create_endpoint API response", create_endpoint_api_response)
注意
AmazonSageMakerFullAccess
和 AmazonS3ReadOnlyAccess
策略必须附加到 AmazonSageMaker-ExecutionRole
IAM 角色。
有关 create_model
、create_endpoint_config
和 create_endpoint
API 的完整语法,请分别参阅 create_model
create_endpoint_config
create_endpoint
如果您没有使用 SageMaker 训练模型,请指定以下环境变量:
如果您使用 SageMaker 训练模型,请指定环境变量 SAGEMAKER_SUBMIT_DIRECTORY
作为包含训练脚本的完整 Amazon S3 存储桶 URI。