基于内容的社交网络用户身份识别方法

作者:张树森; 梁循; 弭宝瞳; 赵吉超; 周小平

摘要:社交网络中识别用户身份具有重要价值,它对社交网络的分析与监管、用户行为的预测以及用户之间交互过程的研究具有重要意义.该文针对社交网络中的用户身份进行研究,将用户身份分为组织用户和个人用户,并对这两种用户身份进行具体定义和识别.该文研究问题属于社交网络用户分析研究中的子研究问题,主要通过用户在社交网络中发表的文本内容、多媒体内容以及用户时间序列内容识别出该用户的组织-个人身份,为社交网络用户身份的识别及进一步研究提供借鉴和帮助.在识别过程中,通过对文本内容中用户的口语化水平、内容(主题)复杂化水平、内容规范化水平的度量以及多媒体内容中用户图片特性和用户时间序列内容的分析,从不同角度提出5种机器可操作的用户组织-个人身份识别方法,进而识别出社交网络中用户是组织用户还是个人用户.最后,为了验证该文所提识别方法的可行性和有效性,该文选择新浪微博数据进行实验,并通过概率模型识别方法进行了对比分析.同时,在验证过程中,使用多种指标对实验结果进行评价.实验结果表明,该文识别方法能够有效识别出用户的组织-个人身份,其中内容复杂特性识别方法、内容规范化识别方法以及时间序列内容识别方法的用户身份识别准确率超过80%.

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 电子信息科学综合
收录:
  • 数学文摘
  • 上海图书馆馆藏
  • 维普收录(中)
  • 知网收录(中)
  • 万方收录(中)
  • 剑桥科学文摘
  • 北大期刊(中国人文社会科学期刊)
  • 国家图书馆馆藏
  • CSCD 中国科学引文数据库来源期刊(含扩展版)
  • 文摘与引文数据库
  • SA 科学文摘(英)
  • JST 日本科学技术振兴机构数据库(日)
  • EI 工程索引(美)
  • 统计源期刊(中国科技论文优秀期刊)
关键词:
  • 社交网络
  • 身份识别
  • 内容复杂化
  • 内容规范化
  • 时间序列

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机学报

期刊级别:北大期刊

期刊人气:11594

杂志介绍:
主管单位:中国科学院
主办单位:中国计算机学会;中国科学院计算技术研究所
出版地方:北京
快捷分类:计算机
国际刊号:0254-4164
国内刊号:11-1826/TP
邮发代号:2-833
创刊时间:1978
发行周期:月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:3.18
综合影响因子:3.08