

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 创建端点配置
<a name="serverless-endpoints-create-config"></a>

创建模型后，创建端点配置。然后，您可以使用端点配置中的规范来部署模型。在配置中，您可以指定需要实时端点还是无服务器端点。要创建无服务器终端节点配置，您可以使用 [Amazon SageMaker AI 控制台](https://console.amazonaws.cn/sagemaker/home)、[CreateEndpointConfig](https://docs.amazonaws.cn/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API 或。 Amazon CLI以下部分概述了 API 和控制台方法。

## 创建端点配置（使用 API）
<a name="serverless-endpoints-create-config-api"></a>

以下示例使用适用于 [Python 的Amazon 软件开发工具包 (Boto3) 来](https://boto3.amazonaws.com/v1/documentation/api/latest/index.html)调用 API。[CreateEndpointConfig](https://docs.amazonaws.cn/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)指定以下值：
+ 对于 `EndpointConfigName`，为端点配置选择一个名称。该名称在您的区域账户中应是唯一的。
+ （可选）对于`KmsKeyId`，使用密钥 ID、密钥 ARN、别名或别名 ARN 作为要使用的 Amazon KMS 密钥。 SageMaker AI 使用此密钥来加密您的 Amazon ECR 镜像。
+ 对于 `ModelName`，使用要部署的模型的名称。该模型应与您在[创建模型](serverless-endpoints-create-model.md)步骤中使用的模型相同。
+ 对于 `ServerlessConfig`：
  + 将 `MemorySizeInMB` 设置为 `2048`。在此示例中，我们将内存大小设置为 2048 MB，但您也可以选择以下任何值作为内存大小：1024 MB、2048 MB、3072 MB、4096 MB、5120 MB 或 6144 MB。
  + 将 `MaxConcurrency` 设置为 `20`。在此示例中，我们将最大并发量设置为 20。可以为无服务器端点设置的最大并发调用数是 200，可以选择的最小值是 1。
  + （可选）要使用预置并发，请将 `ProvisionedConcurrency` 设置为 10。在此示例中，我们将预置并发设置为 10。无服务器端点的 `ProvisionedConcurrency` 数量必须小于或等于 `MaxConcurrency` 数量。如果您想按需使用无服务器推理端点，则可以将此值留空。您可以动态扩展预置并发。有关更多信息，请参阅 [自动扩展无服务器端点的预置并发](serverless-endpoints-autoscale.md)。

```
response = client.create_endpoint_config(
   EndpointConfigName="<your-endpoint-configuration>",
   KmsKeyId="arn:aws:kms:us-east-1:123456789012:key/143ef68f-76fd-45e3-abba-ed28fc8d3d5e",
   ProductionVariants=[
        {
            "ModelName": "<your-model-name>",
            "VariantName": "AllTraffic",
            "ServerlessConfig": {
                "MemorySizeInMB": 2048,
                "MaxConcurrency": 20,
                "ProvisionedConcurrency": 10,
            }
        } 
    ]
)
```

## 创建端点配置（使用控制台）
<a name="serverless-endpoints-create-config-console"></a>

1. 登录 [Amazon A SageMaker I 控制台](https://console.amazonaws.cn/sagemaker/home)。

1. 在导航选项卡中，选择**推理**。

1. 接下来，选择**端点配置**。

1. 选择**创建端点配置**。

1. 对于**端点配置名称**，输入一个在您的区域账户中唯一的名称。

1. 对于**端点类型**，选择**无服务器**。  
![\[控制台中端点类型选项的屏幕截图。\]](http://docs.amazonaws.cn/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config.png)

1. 对于**生产变体**，选择**添加模型**。

1. 在**添加模型**下，从模型列表中选择要使用的模型，然后选择**保存**。

1. 添加模型后，在**操作**下选择**编辑**。

1. 对于**内存大小**，选择所需的内存大小（以 GB 为单位）。  
![\[控制台中的内存大小选项的屏幕截图。\]](http://docs.amazonaws.cn/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config-2.png)

1. 对于**最大并发量**，输入端点所需的最大并发调用数。可输入的最大值为 200，最小值为 1。

1. （可选）要使用预置并发，请在预置并发**设置**字段中输入所需的并发调用数。预置并发调用数必须小于或等于最大并发调用数。

1. 选择**保存**。

1. （可选）对于**标签**，如果要为端点配置创建元数据，请输入键值对。

1. 选择**创建端点配置**。