IP 见解超参数 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

IP 见解超参数

CreateTransformJob 请求中,您可以指定训练算法。您还可以指定算法特定的超参数作为字符串到字符串映射。下表列出了 Amazon SageMaker IP 见解算法的超参数。

参数名称 描述
num_entity_vectors

要训练的图元矢量表示(实体嵌入向量)的数量。训练集中的每个实体都使用散列函数随机分配给其中一个向量。由于散列冲突,可能会将多个实体分配给同一向量。这将导致同一向量表示多个实体。只要碰撞速率不太严重,这对模型性能的影响通常微不足道。要保持低碰撞率,请将此值设置为尽可能高。但是,训练和推理的模型大小以及内存要求都会使用此超参数线性缩放。我们建议您将此值设置为唯一实体标识符数的两倍。

必填

有效值:1 ≤ 正整数 ≤ 250,000,000

vector_dim

用于表示实体和 IP 地址的嵌入向量的大小。该值越大,可以使用这些表示法编码的信息越多。实际上,模型大小会使用此参数线性缩放,并限制尺寸的大小。此外,使用过大的矢量表示可能会导致模型过度拟合,特别是对于小型训练数据集。当模型不了解数据中的任何模式,但有效地记住训练数据,因此无法很好地概化并且在推理过程中性能不佳时,就会发生过度拟合。推荐值为 128。

必填

有效值:4 ≤ 正整数 ≤ 4096

batch_metrics_publish_interval

Apache MXNet Speedometer 函数输出网络训练速度(采样数/秒)的间隔(每 X 个批次)。

可选

有效值:大于等于 1 的正整数

默认值:1000

epochs

训练数据的传递次数。最佳值取决于您的数据大小和学习率。典型值范围为 5 到 100。

可选

有效值:大于等于 1 的正整数

默认值:10

learning_rate

优化程序的学习率。IP 见解使用基于梯度下降的 Adam 优化器。学习速率有效控制步长大小,以便在每次迭代时更新模型参数。学习率过大可能会导致模型发生分歧,因为训练可能超出最小值。另一方面,学习率太小会减慢收敛速度。典型值范围从 1e-4 到 1e-1。

可选

有效值:1e-6 ≤ 浮点值 ≤ 10.0

默认值:0.001

mini_batch_size

每个小批量中的示例数。培训程序以微型批次处理数据。最佳值取决于数据集中唯一帐户标识符的数量。一般来说,越大mini_batch_size,训练速度越快,可能的洗牌负样本组合的数量就越多。然而,随着大mini_batch_size, 训练更有可能收敛到较差的地方最低限度, 而且在推断方面表现相对较差.

可选

有效值:1 ≤ 正整数 ≤ 500000

默认值:10000

num_ip_encoder_layers

用于对 IP 地址嵌入进行编码的完全连接的层数。层数越大,模型在 IP 地址之间捕获模式的能力就越大。但是,使用大量图层会增加过度拟合的几率。

可选

有效值:0 ≤ 正整数 ≤ 100

默认值:1

random_negative_sampling_rate

针对每个输入示例生成的随机负采样的数量 R。训练过程依赖于负采样来防止模型的向量表示折叠到单个点。随机负采样为小批量中的每个输入账户生成 R 个随机 IP 地址。的总和random_negative_sampling_rate(R) 和shuffled_negative_sampling_rate(S) 必须在以下时间间隔内:1 ≤ R + 秒 ≤ 500。

可选

有效值:0 ≤ 正整数 ≤ 500

默认值:1

shuffled_negative_sampling_rate

针对每个输入示例生成的随机负采样的数量 S。在某些情况下,它有助于使用从训练数据本身随机挑选的更真实的负采样。这种负采样是通过在一个小批次中洗牌数据来实现的。随机排列负采样通过在小批量内随机排列 IP 地址和账户对来生成 S 负 IP 地址。的总和random_negative_sampling_rate(R) 和shuffled_negative_sampling_rate(S) 必须在以下时间间隔内:1 ≤ R + 秒 ≤ 500。

可选

有效值:0 ≤ 正整数 ≤ 500

默认值:1

weight_decay

权重衰减系数。此参数添加了一个 L2 正则化因子,这是防止模型过度拟合训练数据所必需的。

可选

有效值:0.0 ≤ 浮点值 ≤ 10.0

默认值:0.00001