计算机学报杂志-2018年第07期-学术点评

计算机学报 2018年第07期杂志文档列表

基于主题和大众影响的用户动态行为倾向预测1431-1447

摘要：该文研究用户行为演变的过程.用户行为具有语义信息,借鉴概率潜在语义发现思想,来挖掘用户网络行为背后的倾向主题.行为倾向代表用户的兴趣,它随时间发生改变,这个变化除了受用户自身因素影响外,还受大众因素的影响.该文以搜索广告数据为实验数据,从语义的角度提出一种描述用户兴趣变化过程的因子模型,并预测用户对推荐项目的打分.它的创新之处在于:(1)以用户动态兴趣、项目主题、用户自身历史打分偏好、项目热度作为研究用户对推荐项目打分的因子要素;(2)利用动态主题模型从大众影响、用户自身因素两个方面研究用户兴趣变化的原因及过程;(3)对推荐项目,使用静态LDA得到每条项目的主题.最后大量的实验结果证明所提模型能够较好地预测用户实时兴趣.

社交物联网研究综述1448-1475

摘要：物联网的理论、技术和应用已成为学术界的研究热点,拓展物联网的研究,需要来自各个领域的创新.近年来,基于社交网络与物联网相融合的研究,逐渐形成了物联网领域内一个新的研究主题--社交物联网.社交物联网从物联网的不同层面来应用社交网络的研究成果,进而解决物联网研究中的具体问题,为物联网的发展带来了新的机遇.当前,社交物联网的概念并不统一,研究内容也较为分散.该文通过对社交物联网的系统性梳理,进一步总结归纳了社交物联网的主要研究内容.首先该文给出了社交物联网的一般性定义,并探讨了社交物联网的研究意义和主要研究方法,然后分析了社交物联网的模型,并讨论了社交物联网的实现方法,接下来介绍了社交物联网的应用,最后展望了社交物联网的研究重点.该文总结了社交物联网的理论体系,为物联网的理论、技术和应用提供了新的研究视角.

面向带属性复杂网络的鲁棒、强解释性社团发现方法1476-1489

摘要：语义社团发现包含两重含义,即:提升社团发现质量、精确标注社团语义。传统的社团发现方法通常假设网络拓扑与节点内容共享同一社团结构。然而,在许多真实网络(如社交网络)中,网络拓扑与节点内容所对应的社团结构通常并不一致。例如,在Twitter网络中,社交链接能够直接地反映出哪些用户聚集在一个社团之中,而每位用户却会产生迥异的、杂乱无章的内容信息。针对该问题,我们基于非负矩阵分解框架提出了一个鲁棒、强解释性的新的社团发现模型(Robust and Strong Explanatory Community Detection,RSECD)。该模型创新地采用一个带先验的转移概率矩阵来刻画网络社团与内容类簇之间的内在关联。在实验中,我们首先采用一组人工网络验证RSECD的有效性和鲁棒性;进而,在7个真实网络上、与8种代表性社团发现方法进行量化比较,结果显示RSECD的检测精度高于性能最高的对比算法6%~14%,进一步体现了其优越性;最后,通过一个在线音乐社交网络上的实例分析,我们又验证了RSECD对于所发现社团具有很强的可解释能力。

面向舆情事件的子话题标签生成模型ET-TAG1490-1503

摘要：关于舆情事件的新闻数据是纷繁复杂的.即便是关于同一舆情事件的新闻数据,往往包含有不同的子话题(事件的不同侧面).因此,如何生成能够准确描述事件子话题含义的标签对深入分析舆情事件(包括掌握事件热点、监测发展走向等)具有重要意义.事件子话题标签的生成通常包括两个关键步骤:首先发现子话题,然后依据每个子话题的关键词或文档内容生成描述该子话题的有效标签.传统方法在发现话题时多采用聚类或分类的方法,它们将同一个话题的文档整合到一个簇中.然而,由于隶属同一事件的文档具有很强的相似性,现有方法难以度量他们之间的距离,因此无法应用于发现事件子话题这一任务.此外,在为子话题生成标签时,传统的方法通常通过抽取来实现.此类方法所生成标签的准确性无法保证.为此,该文提出了一种基于PLSA with Background Language并结合关键词聚类发现事件内部子话题,进而基于维基百科等知识库生成事件子话题标签的模型ET-TAG.在多类舆情事件数据集上的实验结果表明,ET-TA G算法相比_K-means和LDA等已有子话题发现方法具有更好的性能"0子话题标签生成角度而言,ET-TAG生成的标签相对于传统方法也具有更好的准确性和概括性.该文最后将ET-TAG算法生成的子话题标签用于事件的对比和追踪,结果表明通过子话题标签可以发现事件共性,并反映事件子话题热度的变化趋势.

微博网络地域Top-k突发事件检测1504-1516

摘要：传统的事件检测不考虑地域特性,面对的是媒体的整个信息流,是一种广域事件检测,会引起局部地域事件检测的失效.随着Web2.0及GPS技术的推广应用,很多社交媒体生成的内容体现了地理信息和时间标记.社交媒体中地域性突发事件的检测是近期新兴的研究热点.针对地域突发事件检测的需求,在合理利用社交媒体及突发事件表现的特性等方面,已有的研究仍有较大的不足.微博网络作为实时性、交互性很强的社交媒体,已经成为人们爆料事件、发表观点的首选媒体.该文面向微博网络,给出了地域Top-々突发事件检测的系统框架,包含地域博文采集、博文预处理、词突发值计算、突发词聚类、突发事件排序及突发事件可视化等部分.根据微博的时空特点,在综合考虑微博博文及社交关系的基础上,利用词出现频率、词关联用户、词分布地域及词社交行为4类指标,提出了新颖的微博网络词突发值计算模型.结合微博网络的特点以及地域T o p i突发事件检测的需求,提出了融合突发词地域、频率、关联博文、关联博文产生的影响力以及关联用户5类指标的突发事件热度计算方法.选取新浪微博作为真实的检测环境,以北京、南京、连云港和日照4个城市为地域范围,使用了5种方法比对了突发事件检测的准确率,这5种方法分别为HBED(2011年)、GeoSED(2013年)、EvenTweet(2013年)、GeoBurst(2016年)和该文提出的方法LocTBED.结果表明,文中所提方法在地域Topi突发事件的检测上有较好的性能.

基于用户相关性的动态网络媒体数据无监督特征选择算法1517-1535

摘要：动互联网、社交媒体的快速发展,极大推动了各个领域对文本、图像、视频等网络媒体数据处理的需求.该类数据具有高维度、动态更新、内容复杂的特性,增加了特征计算以及分类难度.同时,当前网络媒体数据的特征选择方法主要针对静态数据,并且对数据格式规范性要求较高.针对上述问题,为保证对动态网络媒体数据的实时特征提取,该文提出了一种基于用户相关性的动态网络媒体数据无监督特征选择算法(Unsupervised Feature Selection Algorithm for Dynamic Network Media Based on User Correlation,UFSDUC).首先,对社交网络中的交互用户进行关系分析,作为无监督特征选择的约束条件.然后,利用拉普拉斯算子构建用户相关性的特征选择模型,量化相关用户之间的关系强弱,通过拉格朗日乘子法给出特征模型中最优用户关系的数学方法.最后,基于梯度下降法设定动态网络媒体数据的阈值,用以计算非零特征权值来更新最优特征子集,达到对网络媒体数据进行有效分类的目的.该算法可在保证用户在相关性完整的基础上对动态网络媒体数据进行准确、实时的特征选择.该文采用3个标准网络媒体数据集,同时与5种目前较为流行的同类型算法进行对比以验证算法的有效性.

社交媒体中的谣言识别研究综述1536-1558

摘要：近年来,社交媒体蓬勃发展,Facebook、Twitter、新浪微博、微信等逐渐成为人们获取或分享信息的重要渠道.这种人人可以参与信息和传播的方式在给人们的信息共享提供极大便利的同时,也带来一些突出的问题,特别是网络谣言的不断滋生和快速传播,给社交媒体的有效利用和科学管理提出了严峻挑战.因此,如何快速准确地识别谣言是个重要的研究问题,也是抑制谣言传播、降低谣言危害的前提.该文对社交媒体上的谣言识别工作进行综述,首先介绍了谣言研究的发展历程以及分类;然后,介绍了影响谣言识别的关键要素、当前谣言识别的主要方法;最后,对社交媒体中谣言识别存在的问题与发展趋势进行了总结和展望.

融合评分矩阵与评论文本的商品推荐模型1559-1573

摘要：随着电子商务的迅速发展和Web上信息的不断增长,推荐系统成为有效帮助用户做出决策的重要智能软件之一.基于评分数据的矩阵分解推荐模型被广泛研究和应用,但数据稀疏性问题影响了该模型的推荐质量.另一方面推荐系统中用户撰写的评论文本可以反映用户的兴趣偏好,有研究工作提出了相应的文本分析及观点挖掘方法来缓解评分数据的稀疏性.评分矩阵分解模型与评论文本挖掘模型的融合有助于提高推荐质量,因此该文首先提出了一种融合评分数值和评论文本的推荐模型DTMF(Double Topics with Matrix Factorization),将用户评论集和商品评论集各自的潜在主题向量分别与传统矩阵分解的用户潜在因子向量和商品潜在因子向量建立正向映射关系,然后通过添加潜在主题为预测评分引导项进一步优化DTMF模型提出了DTMFX模型.在两组公开数据集上,以推荐结果的均方误差(MSE)为评估指标进行了实验验证.实验结果表明本文提出的DTMF和D TMFX两个模型整体上优于仅融入商品评论集的HFT(Hidden Factors as Topics)(item)模型,在子类数据上预测误差最大分别降低了3.68%和7.31%.该文最后探讨了有用性评论排序问题来增强推荐结果的可解释性.

基于分类的微博新情感词抽取方法和特征分析1574-1597

摘要：情感或情绪分析在舆情分析、商品评论分析、商品推荐等领域应用广泛,而文本中的情感或情绪分析通常以情感词典为基础.人工情感词典虽然准确但构建代价大、难以及时更新,很难适应微博这类新情感词快速更迭的数据.微博平台为新情感词的和传播提供了便捷的途径,是新情感词的重要来源.考虑到已有规模较大的人工情感词典及大量包含新情感词的微博数据,在统计、分析、对比中、英两种语言微博中情感词分布差异的基础上,提出了与特定语言无关的基于分类思想的微博新情感词抽取方法cNSEm.cNSEm根据微博数据集和情感词典自动构建训练数据、训练分类器并判别候选词的情感极性,最后采用投票机制确定候选词的情感极性.通过大量而细致的实验,分析了cNSEm在中、英文两种语言的微博数据上的表现、六类特征的作用和用法以及抽取的新情感词对微博情感分类任务的帮助作用.实验结果表明,cNSEm比经典的基于共现和极性传播的方法要好,特别是当考虑中文微博数据集中的名词类情感词时.对cNSEm抽取的新情感词进行了直接和间接两种方法评测,前者利用人工情感词典作参照,后者考察抽取的新情感词对情感分类的帮助作用,从评测指标上看,cNSEm抽取的新情感词与人工情感词典的质量相当,并且cNSEm能适应有较大差异的中、英两个语种.

线下交互的动态社交网络研究进展:挑战与展望1598-1618

摘要：移动互联网技术的发展和智能可携带设备的普及为感知人类社会行为提供了新的契机.线下交互的动态社交网络研究作为人类动力学和社会计算研究领域的重要组成部分,在推荐系统、传染病免疫、机会网络路由中都有重要的研究意义.该文对动态社交网络中的线下交互研究进行了回顾和梳理,从数据、特性(拓扑、时间、地理)、模型(基于轨迹、基于地点、基于拓扑)、应用四个方面入手,总结了线下交互动态社交网络的研究现状,也提出了目前线下交互研究中尚待解决的开放性问题,为相关的研究者提供借鉴.

基于深度学习的推荐系统研究综述1619-1647

摘要：深度学习是机器学习领域一个重要的研究方向,近年来在图像处理、自然语言理解、语音识别和在线广告等领域取得了突破性进展.将深度学习融入推荐系统中,研究如何整合海量的多源异构数据,构建更加贴合用户偏好需求的用户模型,以提高推荐系统的性能和用户满意度,成为基于深度学习的推荐系统的主要任务.该文对近几年基于深度学习的推荐系统研究进展进行综述,分析其与传统推荐系统的区别以及优势,并对其主要的研究方向、应用进展等进行概括、比较和分析.最后,对基于深度学习的推荐系统的未来发展趋势进行分析和展望.

在线社会网络谣言检测综述1648-1677

摘要：大数据环境下,在线社会网络与人们的生活、娱乐以及工作逐渐融为一体.然而“信息过载”和“信息污染”已成为在线社会网络诸多应用发展面临的主要瓶颈之一,并同时造成了用户的“信息焦虑”和“信息迷航”等一系列问题,因此在线社会网络谣言检测是改善在线社会网络信息生态环境质量、提升用户体验的有效手段.在线社会网络谣言检测隶属于信息可信度检测研究范畴,但谣言的不确定性、较强的时效性、主观性和关联性等特征又使得其与虚假信息检测有着本质区别.基于以上,该文从在线社会网络谣言的基本概念和特征研究出发,分别基于目标、对象和时间三个属性,分析了在线社会网络谣言检测研究基本问题的形式化定义,并介绍了研究中数据采集和标注的不同方法.然后,分别对不同类别和应用场景的在线社会网络谣言检测方法和谣言源检测方法进行了分析和总结.最后,该文讨论了在线社会网络谣言检测技术未来发展面临的若干挑战以及可能的研究方向.

融合形状先验的水平集眼底图像血管分割1678-1692

摘要：网膜血管病变程度可作为与血管相关疾病的诊断依据,因此对视网膜血管的特征提取和分析在疾病的诊断、治疗上具有重要的临床价值.然而视网膜血管图像结构复杂,血管与背景存在灰度值交叉以及病灶和噪声的影响,致使诸多算法在相邻血管处、血管交叉处和微血管处存在分割不足的问题,且易受病灶和噪声的干扰.针对现有血管分割方法的缺陷,同时考虑视网膜图像局部血管结构与背景的可分性以及模型的抗噪性,文中提出了一种融合区域能量拟合信息和形状先验的水平集血管分割方法.在图像预处理过程中,利用DAC水平集模型控制轮廓曲线朝目标真实边界演化来获得视网膜掩模,接着通过形态学算子去除血管中心亮线以及利用高斯卷积估计视网膜背景图像,并与原图像和掩模分别进行减法和点乘运算增强视网膜血管图像;然后分析HesGm矩阵的各向异性特性,它的特征值在血管、背景和病灶上具有不同的几何性质,为最大化这种几何性质在不同结构上的差异,文中利用HesGm矩阵特征值重新构建血管响应函数,从而获得视网膜血管初步图像,作为后面的先验信息、初始化信息等,缓解水平集对初始化敏感和易误分割的问题.在水平集血管模型构建中,考虑到视网膜图像局部血管的可分性、模型的抗噪性等因素,使用RSF模型的局部区域能量拟合性质划分血管与背景,以及利用先验信息和水平集函数的几何性质构建水平集模型的形状约束项,当轮廓曲线远离视网膜血管图像的先验信息位置时就会受到惩罚,距离越远惩罚越大.完整的水平集血管分割模型包含了局部区域能量拟合项、形状约束项、面积约束项等,在能量最小化求解过程中,能够通过局部区域能量拟合性质克服现有血管分割方法在相邻血管处、血管交叉处和微血管处分割不足的问题,以及通过形状约束性�

计算机学报杂志北大期刊 CSCD期刊 统计源期刊

Chinese Journal of Computers

计算机仿真

计算机科学

黑龙江教育学院学报

计算机教育

护理学报

公共管理学报

计算机测量与控制

材料科学与工程学报

太原城市职业技术学院学...

吉林大学学报·信息科学...

期刊咨询

期刊推荐

文秘服务

计算机学报 2018年第07期杂志文档列表

计算机学报杂志 北大期刊 CSCD期刊 统计源期刊

Chinese Journal of Computers

计算机仿真

计算机科学

黑龙江教育学院学报

计算机教育

护理学报

公共管理学报

计算机测量与控制

材料科学与工程学报

太原城市职业技术学院学...

吉林大学学报·信息科学...

期刊咨询

期刊推荐

文秘服务

计算机学报 2018年第07期杂志 文档列表

计算机学报杂志北大期刊 CSCD期刊统计源期刊

计算机学报 2018年第07期杂志文档列表