基于LDA挖掘计算机科学文献的研究主题

作者:杨海霞; 高宝俊; 孙含林

摘要:【目的】运用文本挖掘技术自动从海量科技文献中提取研究主题并探测其研究趋势。【方法】以《中文核心期刊要目总览(2014年版))-“TP自动化技术、计算机技术”栏目前10种期刊刊载的计算机科学类(ComputerScience)文献为研究对象,借助LDA主题模型,考虑科技文献的发表时间信息,挖掘出典型话题,并根据主题强度分析主题的演化趋势。【结果】18个研究话题中有7个主题强度上升的主题和6个主题强度下降的主题。【局限】仅分析了国内计算机领域的前10种期刊,期刊范围不够大,也未考虑国外计算机领域的期刊文献。【结论】该方法能够深入挖掘计算机领域期刊文献的话题,帮助从事该领域研究的学者了解主题的演化趋势并寻找新兴研究主题。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 计算机软件及计算机应用
收录:
  • 维普收录(中)
  • 上海图书馆馆藏
  • 万方收录(中)
  • CSSCI 南大期刊(含扩展版)
  • 知网收录(中)
  • 国家图书馆馆藏
  • 北大期刊(中国人文社会科学期刊)
  • 统计源期刊(中国科技论文优秀期刊)
  • CSCD 中国科学引文数据库来源期刊(含扩展版)
关键词:
  • 计算机科学
  • lda
  • 主题提取
  • 主题强度
  • 文档聚类

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:现代图书情报技术

期刊级别:CSSCI南大期刊

期刊人气:1263

杂志介绍:
主管单位:中国科学院
主办单位:中国科学院文献情报中心
出版地方:北京
快捷分类:新闻
国际刊号:1003-3513
国内刊号:11-2856/G2
邮发代号:82-421
创刊时间:1980
发行周期:月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:1.45
综合影响因子:0.672599971294403