基于LDA主题模型的微博检索研究与实现

作者:王若成

摘要:随着微博用户的增长,微博文本量也呈现出爆发式的增长趋势。面对如此海量的文本数据,如何有效地检索有用的信息对微博用户是十分重要的。本文采用基于TF-IDF计算,先找到关于词频相似的微博文章;然后利用LDA主题模型的方法,筛选出主题内容相似的微博文章。实验结果证明,采用该综合检索方法,用户能够检索出更加符合用户实际需求微博文章。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 电子信息科学综合
收录:
  • 维普收录(中)
  • 知网收录(中)
  • 上海图书馆馆藏
  • 万方收录(中)
  • 国家图书馆馆藏
关键词:
  • lda主题模型
  • 微博文章
  • 文本相似度

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:信息技术与信息化

期刊级别:省级期刊

期刊人气:5428

杂志介绍:
主管单位:山东省工业和信息化厅
主办单位:山东电子学会
出版地方:山东
快捷分类:电子
国际刊号:1672-9528
国内刊号:37-1423/TN
邮发代号:43031
创刊时间:1976
发行周期:月刊
期刊开本:A4
下单时间:1个月内
复合影响因子:0.53
综合影响因子:0.61