本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
调整 IP 见解模型
自动调整模型(也称作超参数优化)通过运行很多在数据集上测试一系列超参数的作业来查找模型的最佳版本。您可以选择可优化超参数、每个超参数的值范围和一个目标指标。您可以从算法计算的指标中选择目标指标。自动模型优化将搜索所选超参数以找到导致优化目标指标的模型的值组合。
有关模型优化的更多信息,请参阅使用 SageMaker 执行自动模型优化。
IP 见解算法计算的指标
Amazon SageMaker IP 见解算法是一种自主学习算法,可以学习 IP 地址和实体之间的关联。该算法训练一个鉴别器模型,该模型可以学习分离观察到的数据点(正样本) 来自随机生成的数据点 (阴性示例)。IP Insights 上的自动模型调整可帮助您找到能够最准确地区分未标签验证数据和自动生成的负面样本的模型。验证数据集上的模型准确率由受试者操作特征曲线下的面积来衡量。该validation:discriminator_auc
指标可以采用介于 0.0 和 1.0 之间的值,1.0 表示完美的准确度。
IP 见解算法计算validation:discriminator_auc
验证期间的指标,其值用作优化超参数调整的目标函数。
指标名称 | 描述 | 优化方向 |
---|---|---|
validation:discriminator_auc |
验证数据集上受试者操作特征曲线下的面积。验证数据集没有标记。曲线下方的区域 (AUC) 是一个指标,它描述了模型区分验证数据点与随机生成的数据点的能力。 |
最大化 |
可优化 IP 见解超参数
你可以优化以下内容超参数针对 SageMaker IP 见解算法。
参数名称 | 参数类型 | 建议的范围 |
---|---|---|
epochs |
IntegerParameterRange |
MinValue:1,MaxValue:100 |
learning_rate |
ContinuousParameterRange |
最 MinValue:1e-4,MaxValue:0.1 |
mini_batch_size |
IntegerParameterRanges |
MinValue:100,MaxValue:50000 |
num_entity_vectors |
IntegerParameterRanges |
MinValue:10000,MaxValue:1000000 |
num_ip_encoder_layers |
IntegerParameterRanges |
MinValue:1,MaxValue:10 |
random_negative_sampling_rate |
IntegerParameterRanges |
MinValue:0,MaxValue:10 |
shuffled_negative_sampling_rate |
IntegerParameterRanges |
MinValue:0,MaxValue:10 |
vector_dim |
IntegerParameterRanges |
MinValue:8,MaxValue:256 |
weight_decay |
ContinuousParameterRange |
MinValue:0.0,MaxValue:1.0 |