k-NN 超参数 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

k-NN 超参数

参数名称 Description
feature_dim

输入数据中的特征数。

必填

有效值:正整数。

k

最近邻点的数量。

必填

有效值:正整数

predictor_type

要在数据标签上使用的推理类型。

必填

有效值:对于分类为 classifier;对于回归为 regressor

sample_size

要从训练数据集中采样的数据点数。

必填

有效值:正整数

dimension_reduction_target

要缩减到的目标维度。

当您指定 dimension_reduction_type 参数时,是必需的

有效值:大于 0 且 feature_dim 小于的正整数。

dimension_reduction_type

维度缩减方法的类型。

可选

有效值:对于随机投影为 sign;对于快速 Johnson-Lindenstrauss 变换为 fjlt

默认值: 无维度缩减

faiss_index_ivf_nlists

index_typefaiss.IVFFlatfaiss.IVFPQ 时,在索引中构建的质心数。

可选

有效值:正整数

默认值:auto,这将解析为 sqrt(sample_size)

faiss_index_pq_m

index_type 设置为 faiss.IVFPQ 时,要在索引中构造的向量子组件的数量。

AI 相似性搜索 (FAISS) 库要求 FaceBook 的值是faiss_index_pq_m数据维度的除数。如果 faiss_index_pq_m 不是数据维度的除数,我们会将数据维度增加到可被 faiss_index_pq_m 整除的最小整数。 如果未应用维度缩减,则算法会添加零填充。如果应用了维度缩减,算法 会增加 dimension_reduction_target 超级参数的值。

可选

有效值:以下正整数之一: 1、2、3、4、8、12、16、20、24、28、32、40、48、56、64、96

index_metric

在查找最近邻点时用于测量点之间距离的指标。当训练 index_type 设置为 faiss.IVFPQ 时,距离和 INNER_PRODUCT 相似性不受支持COSINE

可选

有效值:L2 对于欧几里得距离,INNER_PRODUCT 对于内积距离,COSINE 对于余弦相似性。

默认值:L2

index_type

索引类型。

可选

有效值:faiss.Flatfaiss.IVFFlatfaiss.IVFPQ

默认值:faiss.Flat

mini_batch_size

用于数据迭代器的每个小批量的观察次数。

可选

有效值:正整数

默认值:5000