基于词向量语义扩展的网络文本特征选择方法研究

作者:吕建新; 郑伟; 马林; 李明; 谷翠梅

摘要:【目的/意义】现有特征选择方法可以计算特征所携带的类别信息量,但却不能计算出与主题相关的语义信息。针对其不足,为了提高分类准确率,提出一种基于词向量语义扩展的特征选择方法。【方法/过程】该方法引入了词向量进行主题语义计算,筛选出具有类别语义信息的词条实现特征候选集的特征扩展,并采用K近邻分类方法进行分类实验。【结果/结论】实验结果显示新方法能够有效提取主题语义特征并提高分类准确率。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 图书情报与数字图书馆
收录:
  • 国家图书馆馆藏
  • 知网收录(中)
  • CSSCI 南大期刊(含扩展版)
  • 维普收录(中)
  • 上海图书馆馆藏
  • JST 日本科学技术振兴机构数据库(日)
  • 万方收录(中)
  • 北大期刊(中国人文社会科学期刊)
  • 统计源期刊(中国科技论文优秀期刊)
关键词:
  • 文本分类
  • 特征选择
  • 词频
  • 词向量

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:情报科学

期刊级别:CSSCI南大期刊

期刊人气:3124

杂志介绍:
主管单位:中华人民共和国教育部
主办单位:吉林大学
出版地方:吉林
快捷分类:科学
国际刊号:1007-7634
国内刊号:22-1264/G2
邮发代号:12-174
创刊时间:1980
发行周期:月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:2.37
综合影响因子:2.94