基于RNN和GBDT融合方法的用户活跃度预测

作者:盛爱林; 左劼; 孙频捷

摘要:在百度举办的WSDM Cup用户留存率预测比赛中,比赛的主要任务为根据用户在好看视频App一天当中的交互数据来预测下一天用户是否会继续使用App,该任务为典型的二分类类型。在新用户下载App并使用一段时间过后,一些用户会在下一天继续登录和使用App,这种用户也叫回归用户;而另外一部分用户可能会仅仅在下载的当天探索使用,而在此之后的很长时间不会继续使用。设计一种实用的机器学习方法来解决这一难题,包括特征工程、LightGBM、CatBoost等GBDT梯度提升树、ManyToMany结构的RNN和机器学习模型Stacking方法。希望能找到有效提高用户留存率预测正确率的方法,以及深度挖掘影响用户留存率的关键因素,在该比赛任务中,我们所设计的方案,最终以0.7671的成绩获得第二名。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 计算机软件及计算机应用
收录:
  • 万方收录(中)
  • 维普收录(中)
  • 知网收录(中)
  • 国家图书馆馆藏
  • 上海图书馆馆藏
关键词:
  • 特征工程
  • gbdt
  • rnn
  • swa

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:现代计算机

期刊级别:省级期刊

期刊人气:9527

杂志介绍:
主管单位:中山大学
主办单位:中大控股
出版地方:广东
快捷分类:计算机
国际刊号:1007-1423
国内刊号:44-1415/TP
邮发代号:46-121
创刊时间:1984
发行周期:半月刊
期刊开本:A4
下单时间:1个月内
复合影响因子:0.57
综合影响因子:0.271