推理容器映像 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

推理容器映像

SageMaker Neo 现在为 ml_* 目标提供推理映像 URI 信息。有关更多信息,请参阅 DescribeCompilationJob

根据您的应用场景,将下面提供的推理映像 URI 模板中突出显示的部分替换为相应的值。

aws_account_id.dkr.ecr.aws_region.amazonaws.com/xgboost-neo:latest

根据您使用的 aws_region,按照本页末尾的表格替换 aws_account_id

aws_account_id.dkr.ecr.aws_region.amazonaws.com/sagemaker-neo-keras:fx_version-instance_type-py3

根据您使用的 aws_region,按照本页末尾的表格替换 aws_account_id

fx_version 替换为 2.2.4

instance_type 替换为 cpugpu

CPU or GPU instance types
aws_account_id.dkr.ecr.aws_region.amazonaws.com/sagemaker-inference-mxnet:fx_version-instance_type-py3

根据您使用的 aws_region,按照本页末尾的表格替换 aws_account_id

fx_version 替换为 1.8.0

instance_type 替换为 cpugpu

Inferentia1
aws_account_id.dkr.ecr.aws_region.amazonaws.com/sagemaker-neo-mxnet:fx_version-instance_type-py3

aws_region 替换为 us-east-1us-west-2

根据您使用的 aws_region,按照本页末尾的表格替换 aws_account_id

fx_version 替换为 1.5.1

instance_type 替换为 inf

aws_account_id.dkr.ecr.aws_region.amazonaws.com/sagemaker-neo-onnx:fx_version-instance_type-py3

根据您使用的 aws_region,按照本页末尾的表格替换 aws_account_id

fx_version 替换为 1.5.0

instance_type 替换为 cpugpu

CPU or GPU instance types
aws_account_id.dkr.ecr.aws_region.amazonaws.com/sagemaker-inference-pytorch:fx_version-instance_type-py3

根据您使用的 aws_region,按照本页末尾的表格替换 aws_account_id

fx_version 替换为 1.41.51.61.71.81.121.132.0

instance_type 替换为 cpugpu

Inferentia1
aws_account_id.dkr.ecr.aws_region.amazonaws.com/sagemaker-neo-pytorch:fx_version-instance_type-py3

aws_region 替换为 us-east-1us-west-2

根据您使用的 aws_region,按照本页末尾的表格替换 aws_account_id

fx_version 替换为 1.5.1

instance_type 替换为 inf

Inferentia2 and Trainium1
763104351884.dkr.ecr.aws_region.amazonaws.com/pytorch-inference-neuronx:1.13.1-neuronx-py38-sdk2.10.0-ubuntu20.04

aws_region 替换为 us-east-2(对于 Inferentia2),或替换为 us-east-1(对于 Trainium1)。

CPU or GPU instance types
aws_account_id.dkr.ecr.aws_region.amazonaws.com/sagemaker-inference-tensorflow:fx_version-instance_type-py3

根据您使用的 aws_region,按照本页末尾的表格替换 aws_account_id

fx_version 替换为 1.15.32.9

instance_type 替换为 cpugpu

Inferentia1
aws_account_id.dkr.ecr.aws_region.amazonaws.com/sagemaker-neo-tensorflow:fx_version-instance_type-py3

根据您使用的 aws_region,按照本页末尾的表格替换 aws_account_id。请注意,对于实例类型 inf,仅支持 us-east-1us-west-2

fx_version 替换为 1.15.0

instance_type 替换为 inf

Inferentia2 and Trainium1
763104351884.dkr.ecr.aws_region.amazonaws.com/tensorflow-inference-neuronx:2.10.1-neuronx-py38-sdk2.10.0-ubuntu20.04

aws_region 替换为 us-east-2(对于 Inferentia2),或替换为 us-east-1(对于 Trainium1)。

下表将 aws_account_idaws_region 进行映射。使用此表查找应用程序所需的正确推理映像 URI。

aws_account_id aws_region
785573368785 us-east-1
007439368137 us-east-2
710691900526 us-west-1
301217895009 us-west-2
802834080501 eu-west-1
205493899709 eu-west-2
254080097072 eu-west-3
601324751636 eu-north-1
966458181534 eu-south-1
746233611703 eu-central-1
110948597952 ap-east-1
763008648453 ap-south-1
941853720454 ap-northeast-1
151534178276 ap-northeast-2
925152966179 ap-northeast-3
324986816169 ap-southeast-1
355873309152 ap-southeast-2
474822919863 cn-northwest-1
472730292857 cn-north-1
756306329178 sa-east-1
464438896020 ca-central-1
836785723513 me-south-1
774647643957 af-south-1
275950707576 il-central-1