优化 RCF 模型 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

优化 RCF 模型

自动模型优化(也称作超参数调整或超参数优化)通过运行很多在数据集上测试一系列超参数的作业来查找模型的最佳版本。您可以选择可优化超参数、每个超参数的值范围和一个目标指标。您可以从算法计算的指标中选择目标指标。自动模型优化将搜索所选超参数以找到导致优化目标指标的模型的值组合。

Amazon SageMaker RCF 算法是一种自主型异常检测算法,需要标记的测试数据集进行超参数优化。RCF 计算测试数据点的异常分数,然后当数据分数超出平均分数三个标准偏差时,将数据点标记为异常。这称为三西格玛极限启发式。F1 分数基于计算标签和实际标签之差。超参数优化作业可找出最大化该分数的模型。超参数优化的成功取决于三西格玛极限启发式对测试数据集的适用性。

有关模型优化的更多信息,请参阅执行自动模型优化.

RCF 算法计算的指标

RCF 算法在训练期间计算以下指标。优化模型时,请选择此指标作为目标指标。

指标名称 描述 优化方向
test:f1

测试数据集的 F1 分数基于计算标签和实际标签之差。

最大化

可优化 RCF 超参数

您可以使用以下超参数优化 RCF 模型。

参数名称 参数类型 建议的范围
num_samples_per_tree

IntegerParameterRanges

MinValue:1,MaxValue2048

num_trees

IntegerParameterRanges

MinValue:50,MaxValue:1000