基于语义的Web主题提取的研究

作者:张韦

摘要:针对互联网搜索技术中常见的搜索方式,引入语义信息,并对网页集的主题提取方式进行了深入的研究。主要进行了对网页集的网页过滤,删除图片、广告等信息,然后取其文本,再进行分词并统计词频,在词频较高的词语中利用WordNet对词语间语义的关系进行进一步计算,最终利用考虑了类内类间分布差异的TF*IDF方法进行主题词提取。通过实验并对实验结果的分析评估,证明了引入WordNet语义联系的主题提取方法是可行且有意义的。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 电子信息科学综合
收录:
  • 国家图书馆馆藏
  • 知网收录(中)
  • 维普收录(中)
  • 上海图书馆馆藏
  • 万方收录(中)
关键词:
  • 主题提取
  • wordnet

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:中国电子商务

期刊级别:部级期刊

期刊人气:3311

杂志介绍:
主管单位:中华人民共和国工业和信息化部
主办单位:中国电子企业协会;中国电子器材总公司
出版地方:北京
快捷分类:经济
国际刊号:1009-4067
国内刊号:11-4440/F
邮发代号:82-970
创刊时间:2000
发行周期:月刊
期刊开本:A4
下单时间:1个月内
复合影响因子:0.09