本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
容器约定输入
Amazon SageMaker 模型监控器平台会根据指定的计划调用您的容器代码。如果您选择编写您自己的容器代码,则可以使用以下环境变量。在此上下文中,可以分析当前数据集或评估约束(如果您选择这样做)并发出指标(如果适用)。
除了 dataset_format
变量之外,实时端点和批量转换作业的可用环境变量相同。如果您使用的是实时端点,则 dataset_format
变量支持以下选项:
{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}
如果您使用的是批量转换作业,则 dataset_format
支持以下选项:
{\"csv\": {\"header\": [\"true\",\"false\"]}}
{\"json\": {\"line\": [\"true\",\"false\"]}}
{\"parquet\": {}}
以下代码示例显示了可用于容器代码的整套环境变量(并对实时端点使用 dataset_format
格式)。
"Environment": { "dataset_format": "{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}", "dataset_source": "/opt/ml/processing/endpointdata", "end_time": "2019-12-01T16: 20: 00Z", "output_path": "/opt/ml/processing/resultdata", "publish_cloudwatch_metrics": "Disabled", "sagemaker_endpoint_name": "endpoint-name", "sagemaker_monitoring_schedule_name": "schedule-name", "start_time": "2019-12-01T15: 20: 00Z" }
参数
参数名称 | 描述 |
---|---|
dataset_format |
对于从由 |
dataset_source |
如果您使用的是实时端点,则提供与由 有时,我们下载的内容超出了开始时间和结束时间所指定的范围。由容器代码根据需要决定解析数据。 |
output_path |
用于写入输出报告和其他文件的本地路径。您必须在 |
publish_cloudwatch_metrics |
对于由 |
sagemaker_endpoint_name |
如果您使用的是实时端点,则是为其启动此计划作业的 |
sagemaker_monitoring_schedule_name |
启动了此作业的 |
*sagemaker_endpoint_datacapture_prefix* |
如果您使用的是实时端点,则是 |
start_time, end_time |
此分析的运行时段。例如,对于计划在 05:00 运行的作业UTC和在 2020 年 2 月 20 日运行的作业, |
baseline_constraints: |
|
baseline_statistics |
|