基于多元关系融合的科技文本主题识别方法研究

作者:许海云; 武华维; 罗瑞; 董坤; 李婧

摘要:当前文本主题获取方法大多依靠单一关联分析,不能全面分析可获取信息,难以准确获取科技发展主题。科技文献的主题词、作者和引文之间蕴含了以研究主题内容为纽带的语义关联关系,主题词共现关系、引文关系和合著关系分别从不同的角度展现了主题关联关系。因此,本文根据主题词之间语义关系距离的远近,将主题识别中主题词关联分为基础关系、强化关系和新增关系,在此基础上提出面向主题识别的多元关系抽取及关系融合方法;并以基因工程疫苗的研发与制备领域为例进行领域实证分析,利用PathSelClus算法实现基于多元关系融合的主题聚类,通过对比实验证明多元关系融合可以有效提高实证领域的文本主题聚类效果,而未来多关系融合主题识别则是需要重点关注的问题。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 图书情报与数字图书馆
收录:
  • 知网收录(中)
  • 北大期刊(中国人文社会科学期刊)
  • 上海图书馆馆藏
  • 万方收录(中)
  • 维普收录(中)
  • 国家图书馆馆藏
  • CSSCI 南大期刊(含扩展版)
  • JST 日本科学技术振兴机构数据库(日)
  • 统计源期刊(中国科技论文优秀期刊)
关键词:
  • 文本主题识别
  • 多元关系
  • 数据融合
  • 关系融合
  • 主题聚类

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:中国图书馆学报

期刊级别:CSSCI南大期刊

期刊人气:2886

杂志介绍:
主管单位:中华人民共和国文化和旅游部
主办单位:中国图书馆学会;国家图书馆
出版地方:北京
快捷分类:新闻
国际刊号:1001-8867
国内刊号:11-2746/G2
邮发代号:2-408
创刊时间:1957
发行周期:双月刊
期刊开本:B5
下单时间:1-3个月
复合影响因子:6.77
综合影响因子:8.56