摘要:在百度举办的WSDM Cup用户留存率预测比赛中,比赛的主要任务为根据用户在好看视频App一天当中的交互数据来预测下一天用户是否会继续使用App,该任务为典型的二分类类型。在新用户下载App并使用一段时间过后,一些用户会在下一天继续登录和使用App,这种用户也叫回归用户;而另外一部分用户可能会仅仅在下载的当天探索使用,而在此之后的很长时间不会继续使用。设计一种实用的机器学习方法来解决这一难题,包括特征工程、LightGBM、CatBoost等GBDT梯度提升树、ManyToMany结构的RNN和机器学习模型Stacking方法。希望能找到有效提高用户留存率预测正确率的方法,以及深度挖掘影响用户留存率的关键因素,在该比赛任务中,我们所设计的方案,最终以0.7671的成绩获得第二名。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社