k-NN 超参数 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

k-NN 超参数

参数名称 描述
feature_dim

输入数据中的特征数。

必填

有效值:正整数。

k

最近邻点的数量。

必填

有效值:正整数

predictor_type

要在数据标签上使用的推理类型。

必填

有效值:对于分类为 classifier;对于回归为 regressor

sample_size

要从训练数据集中采样的数据点数。

必填

有效值:正整数

dimension_reduction_target

要缩减到的目标维度。

必需当你指定dimension_reduction_type参数。

有效值:大于 0 且 feature_dim 小于的正整数。

dimension_reduction_type

维度缩减方法的类型。

可选

有效值:对于随机投影为 sign;对于快速 Johnson-Lindenstrauss 变换为 fjlt

默认值:无维度减少

faiss_index_ivf_nlists

index_typefaiss.IVFFlatfaiss.IVFPQ 时,在索引中构建的质心数。

可选

有效值:正整数

默认值:auto,这将解析为 sqrt(sample_size)

faiss_index_pq_m

index_type 设置为 faiss.IVFPQ 时,要在索引中构造的向量子组件的数量。

FaceBook AI 相似性搜索 (FAISS) 库要求faiss_index_pq_m是的除数数据维度. 如果 faiss_index_pq_m 不是数据维度的除数,我们会将数据维度增加到可被 faiss_index_pq_m 整除的最小整数。如果未应用维度缩减,则算法会添加零填充。如果应用了维度缩减,算法 会增加 dimension_reduction_target 超级参数的值。

可选

有效值:以下正整数之一:1、2、3、4、8、12、16、20、24、28、32、40、48、56、64、96

index_metric

在查找最近邻点时用于测量点之间距离的指标。使用训练时index_type设置为faiss.IVFPQ、这INNER_PRODUCT距离和COSINE不相似性支持。

可选

有效值:L2对于欧几里德-距离来说,INNER_ 产品对于内部产品的距离,余弦对于余弦相似性。

默认值:L2

index_type

索引类型。

可选

有效值:faiss.Flatfaiss.IVFFlatfaiss.IVFPQ

默认值:faiss.Flat

mini_batch_size

用于数据迭代器的每个小批量的观察次数。

可选

有效值:正整数

默认值:5000