本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
CatBoost 的工作方式
CatBoost 实施传统的梯度提升决策树 (GBDT) 算法,并增加了两个关键的算法改进:
实施了有序提升,这是对经典算法的以排列驱动的替代方案
用于处理分类特征的创新算法
这两种技术都是为了对抗由一种特殊目标泄漏所引起的预测偏移,这种偏移存在于梯度提升算法的所有现有实施中。
CatBoost 算法在机器学习竞赛中表现良好,因为它能够可靠地处理各种数据类型、关系和分布,并有大量可以微调的超参数。您可以使用 CatBoost 来处理回归、分类(二元和多元)和排名问题。
有关梯度提升的更多信息,请参阅 SageMaker AI XGBoost 算法的工作原理。有关 CatBoost 方法中使用的其他 GOSS 和 EFB 技术的深入详细信息,请参阅《CatBoost:具有分类特征的无偏移提升