优化 IP 见解模型 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

优化 IP 见解模型

自动模型优化(也称为超参数优化)通过运行很多在数据集上测试一系列超参数的作业来查找模型的最佳版本。您可以选择可优化超参数、每个超参数的值范围和一个目标指标。您可以从算法计算的指标中选择目标指标。自动模型优化将搜索所选超参数以找到导致优化目标指标的模型的值组合。

有关模型优化的更多信息,请参阅执行自动模型优化

IP 见解算法计算的指标

Amazon SageMaker IP 见解算法是一种自主学习算法,能够学习 IP 地址与实体之间的关联。该算法训练识别模型,该模型学习将观察到的数据点(正样本)与随机生成的数据点(负样本)分开。IP Insights 上的自动模型优化可帮助您找到最准确地区分未标记的验证数据和自动生成的负采样的模型。验证数据集上的模型准确率由受试者操作特征曲线下的面积来衡量。此 validation:discriminator_auc 指标可以接受介于 0.0 和 1.0 之间的值,其中 1.0 表示完全准确。

IP 见解算法在验证期间计算 validation:discriminator_auc 指标,其值用作目标函数来优化超参数优化。

指标名称 描述 优化方向
validation:discriminator_auc

验证数据集上受试者操作特征曲线下的面积。不会标记验证数据集。曲线下方的区域 (AUC) 是一个指标,它描述了模型区分验证数据点与随机生成的数据点的能力。

最大化

可优化 IP 见解超参数

您可以针对 SageMaker IP 见解算法优化以下超级参数。

参数名称 参数类型 建议的范围
epochs

IntegerParameterRange

MinValue:1,MaxValue:100

learning_rate

ContinuousParameterRange

MinValue:1e-4,MaxValue:0.1

mini_batch_size

IntegerParameterRanges

MinValue:100,MaxValue:50000

num_entity_vectors

IntegerParameterRanges

MinValue:10000,MaxValue:1000000

num_ip_encoder_layers

IntegerParameterRanges

MinValue:1,MaxValue:10

random_negative_sampling_rate

IntegerParameterRanges

MinValue:0、MaxValue:10

shuffled_negative_sampling_rate

IntegerParameterRanges

MinValue:0、MaxValue:10

vector_dim

IntegerParameterRanges

MinValue:8、MaxValue:256

weight_decay

ContinuousParameterRange

MinValue:0.0、MaxValue:1.0