基于GBDT算法的地铁IC卡通勤人群识别

作者:翁小雄; 吕攀龙

摘要:随着公交IC卡的应用和普及,从IC卡数据中挖掘通勤用户,为下阶段采取分流措施缓解早晚高峰压力,优化票价制定等具有重要意义。以广州市地铁数据为依托,选取合适的特征属性,提出了一种基于梯度提升树(gradient boosting decision tree,GBDT)机器学习算法为基础的通勤人群识别方法。首先以周工作日的首末次平均刷卡时间、首末次平均刷卡时长、首末次刷卡时长波动程度、刷卡次数总和等5个特征来制定调查问卷的数据格式。然后利用处理过的带标签(通勤/非通勤)的调查问卷数据去训练GBDT分类器模型,测试样本的通勤识别的准确率高达94.16%。最后利用该模型对广州地铁IC卡数据通勤人群进行识别,结果显示广州地铁刷卡数据中通勤人群数量为131万左右,占总地铁刷卡出行人数32%左右。

分类:
  • 期刊
  • >
  • 人文社会科学
  • >
  • 社会科学II
  • >
  • 教育综合
收录:
  • 万方收录(中)
  • 国家图书馆馆藏
  • 知网收录(中)
  • 维普收录(中)
  • 上海图书馆馆藏
  • CSCD 中国科学引文数据库来源期刊(含扩展版)
  • 统计源期刊(中国科技论文优秀期刊)
  • 北大期刊(中国人文社会科学期刊)
  • CA 化学文摘(美)
  • Pж(AJ) 文摘杂志(俄)
  • 文摘杂志
关键词:
  • 交通工程
  • 城市交通
  • 地铁ic卡数据
  • gbdt
  • 通勤识别

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:重庆交通大学学报

期刊级别:北大期刊

期刊人气:1499

杂志介绍:
主管单位:重庆交通大学
主办单位:重庆交通大学
出版地方:重庆
快捷分类:教育
国际刊号:1674-0696
国内刊号:50-1190/U
邮发代号:
创刊时间:1982
发行周期:月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:0.85
综合影响因子:0.685