两分类器融合的中文微博用户性别分类方法

作者:张璞; 陈超; 陈韬; 王永

摘要:针对中文微博用户性别分类研究工作较少,微博特征提取不完善,分类准确率有待提升的问题,提出一种两分类器融合的中文微博用户性别分类方法。从微博文本数据中提取一系列手工特征构建分类器,得到分类结果;利用卷积神经网络模型自动提取特征,对用户的性别进行分类并得到分类结果;将两个分类器的结果利用XGBoost模型进行融合,得到最终的用户性别分类结果。实验结果表明,该方法相比一系列对比方法有更好的分类结果。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 电子信息科学综合
收录:
  • 国家图书馆馆藏
  • 维普收录(中)
  • 上海图书馆馆藏
  • 北大期刊(中国人文社会科学期刊)
  • 知网收录(中)
  • 万方收录(中)
  • 统计源期刊(中国科技论文优秀期刊)
  • JST 日本科学技术振兴机构数据库(日)
  • 哥白尼索引(波兰)
  • SA 科学文摘(英)
  • Pж(AJ) 文摘杂志(俄)
关键词:
  • 中文微博
  • 性别分类
  • 微博文本特征
  • 卷积神经网络
  • 分类器融合

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机工程与设计

期刊级别:北大期刊

期刊人气:3692

杂志介绍:
主管单位:中国航天科工集团
主办单位:中国航天科工集团第二研究院706所
出版地方:北京
快捷分类:计算机
国际刊号:1000-7024
国内刊号:11-1775/TP
邮发代号:82-425
创刊时间:1980
发行周期:月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:0.62
综合影响因子:1.32