计算机学报杂志-2014年第04期-学术点评

计算机学报 2014年第04期杂志文档列表

计算机学报杂志在线社会关系网络的挖掘与分析

在线社交网络影响力分析

摘要：社交影响力分析是社交网络分析的关键问题之一。近十几年间，随着在线社交网络的蓬勃发展，研究人员才开始有机会在大量现实数据的基础上对社交影响力进行建模和分析，并取得了丰硕的研究成果和广泛的应用价值。文中回顾了近些年在线社交网络影响力分析的主要成果，阐述了社交影响力的相关概念和它们之间的关系，重点从网络拓扑、用户行为和交互信息等几个方面总结了影响力分析的建模和度量方法，介绍了与影响力传播密切相关的意见领袖发现和影响力最大传播问题的研究现状，并对在线社交网络影响力分析的前景进行了展望。

735-752

基于网络社团结构的节点传播影响力分析

摘要：识别社会关系网络中对传播过程影响力大的关键节点，对于理解并控制网络上的传播具有重要意义。文中提出了一种基于网络社团结构的节点影响力度量方法，基本思想是用与某个节点直接相连的社团的数目（称为该节点Vc值）来衡量该节点的传播能力。通过单源感染的SIR传播模型实验发现，在根据已有节点重要性度量指标进行排序后，用节点的Vc值可进一步挖掘传播能力强的奇异节点。通过单源感染的SI传播模型的实验发现，在具有相同度值或K-壳值（Ks）的节点中，以犞犆较高的节点作为感染源，感染速度更快且可获得更大的传播范围。

753-766

微博网络中用户特征量和增长率分布的研究

摘要：根据新浪微博的实际用户数据，发现粉丝数、关注数和微博数3个特征量的分布，都存在双段幂律分布现象，不同类型用户特征量的分布具有差异性。使用双帕累托对数正态（DPLN）分布对数据进行拟合，相比对数正态分布和幂律分布，可以得到更优的效果。用户活跃时间服从指数分布，不同活跃时间的3个用户特征量都近似服从对数正态分布；用户特征量的增长率服从对数正态分布，且与特征量自身的规模无关，这些特征与双帕累托对数正态分布模型一致，从而使用这一模型可以很好地解释粉丝数、关注数和微博数分布特性的形成机制。

767-778

新浪微博网信息传播分析与预测

摘要：文中以新浪微博为研究对象，以分析新浪微博的信息转发与传播特征为研究目的，并对传播行为进行预测。在获取大量新浪微博在线数据的基础上，对各种可能影响用户转发行为的因素进行统计、分析，挖掘各种影响因素特征并进行建模。提出基于用户属性、社交关系和微博内容三类综合特征，使用机器学习的分类方法，对给定微博的用户转发行为进行预测。基于微博网关注关系拓扑，利用概率级联模型对给定微博的转发路径进行预测，为预测微博的影响范围提供依据。文中通过实验分析了新浪微博符合复杂网络特征、社交类特征对转发行为有重要影响，并验证了传播预测的有效性。

779-790

基于用户行为的微博用户社会影响力分析

摘要：社会影响力分析是当前在线社会网络研究中的热点方向。随着微博成为了一种至关重要的大众媒体，更好的分析和衡量微博用户的社会影响力引起越来越广泛的关注。基于从新浪微博收集的大规模数据集，作者结合社会影响力在微博环境中的传播情况，分析了用户行为因素之间的关系。然后提出了一个通过预测用户传播信息能力大小来分析和度量用户社会影响力的方法。该方法结合了来自社会网络结构和用户行为因素两方面的信息，获得了更好的影响力估计结果。基于大规模数据的实验结果表明，作者提出的方法是较为有效的。

791-800

基于社交圈的在线社交网络朋友推荐算法

摘要：为用户推荐朋友是在线社交网络的重要个性化服务。社交网站通过用户之间是否有相同属性信息或公共邻居判断他们能否成为朋友，但由于用户注册信息不完善和对公共邻居之间关系的忽略，推荐精度不高。事实上用户的朋友可以组成多个社交圈，拥有相似社交圈的用户更易成为朋友。因此，首先提出了社交圈检测算法，进而定义用户间的社交圈相似性，基于社交圈相似程度为用户推荐新朋友。使用YouTube 数据验证了该文假设；使用Facebook自我网络数据，验证了社交圈检测方法的有效性，并与3种典型检测算法比较；使用区域Facebook数据，通过与公共邻居、Jaccard相似性比较，进一步验证了朋友推荐方法的准确性。

801-808

基于犔犜模型的个性化关键传播用户挖掘

摘要：文中针对社交网络中特定用户展开个性化关键传播用户挖掘研究，目标是在线性阈值传播模型的基础上，挖掘出能够最大程度影响网络中特定用户的节点集合。尽管在社交网络影响最大化问题方面已存在相关工作，但该文工作偏重于针对网络中的特定用户展开，该问题的解决将有助于企业有效的进行个性化产品营销。为此，文中提出一种基于LT模型的个性化关键传播用户挖掘问题的解决框架。首先，在线性阈值模型的基本传播机制下，提出一个随机函数来模拟基于LT模型的个性化关键传播用户挖掘问题的目标函数，该随机函数具有较小方差的理论保证；然后，提出一个有效的求解算法从网络中挖掘针对特定用户的关键传播节点集合，理论证明该算法具有（1-1/e）的近似精度保证。实验使用真实的社交网络数据验证了算法的有效性。

809-818

一种基于特征演变的新闻话题演化挖掘方法

摘要：话题演化挖掘研究可以准确完整地获取新闻话题动态演化各个阶段的话题内容，帮助用户理解新闻话题的来龙去脉以及话题内容之间的相关性和差异性，因此在网络新闻检索、网络舆情监控、互联网突发事件检测与应急管理等方面具有十分重要的作用和应用前景。现有工作由于缺乏对话题特征随时间发展而动态演变的深入分析，仅仅采用均值泛化的思想去增量扩充演化中的话题特征，引入大量话题无关信息，影响了话题关联的准确率，从而导致最终话题演化挖掘结果的偏斜。因此，针对以上问题，文中通过引入话题特征演变特性，提出一种针对话题演化的特征计算模型，在此基础上利用已有话题相关文档和最新文档进行话题信息动态增量扩充，通过对话题特征进行正向融合以及逆向过滤完成对特征信息的抗噪处理，提高话题关联的正确率，有效地解决了话题演化的偏斜问题。

819-832

基于超链接多样性分析的新型网页排名算法

摘要：作为搜索引擎的核心部件，网页排名算法决定了搜索到的相关结果以何种顺序呈现给用户，其性能的优劣将会直接影响搜索引擎的服务质量和用户的搜索体验．在计算网页的权威性时，现有的基于链接的网页排名算法和网页作弊检测算法仅关注网页的超链接数量和质量，而忽略了超链接来源的多样性---另一种客观评价网页权威性的重要信息．相比于真正的权威页面（具有大量且来源广泛的入链），通过作弊手段提升排名的网页往往不具有入链来源多样性的特征．基于以上思想，文中分别提出了超链接来源多样性判断方法、超链接权值调整方法，进而提出了基于超链接来源多样性分析的网页排名算法Drank．在多个基准数据集上的实验结果表明：与现有最好的同类算法相比，综合寻找优质页面和抑制网页排名作弊两方面，Drank算法表现出更好的性能．

833-847

一种基于元路径的异质信息网络链路预测模型

摘要：真实世界中不同类型的对象之间相互连接，形成异质信息网络．预测网络中对象之间的连接或交互是网络分析中的一个重要任务．不同于传统的同质性网络的链路预测，异质信息网络中，由于存在多种类型的节点和边，节点之间可以通过不同的关系进行连接．文中使用元路径，即通过一组关系连接了多种节点类型的路径，来描述异质信息网络中不同类型对象之间各种连接的不同语义，从而提出一种异质信息网络链路预测模型，通过组合对象之间在不同元路径上建立连接的概率来进行链路预测．在DBLP和Last．fm两个真实数据集上的实验结果表明：在7种关系的链路预测中，相比最好的基准方法，文中方法的AUC值平均提升了5．93％；另外，在链路预测中，通过元路径区分不同类型的节点和边之后，预测精度得到了明显提升；最后，为了平衡预测精度和模型的可扩展性，实验分析表明链路预测中仅考虑路径长度小于5的元路径就已经足够产生很好的预测结果．

848-858

犚狅狊狋犲狉：一种开发者潜在同行推荐方法

摘要：根据开发者的历史开发信息，推荐潜在合作对象或能够胜任的任务，对于减少开发延时，提高团队开发效率有极大的促进作用．大量已有工作主要研究单个开源项目开发者社区，通过确定开发者的个人技能实施推荐．然而，以整个开源社区为视角，研究使用开发者实践技能做推荐，实现开发者跨项目与组织边界合作的工作相对甚少．为丰富这一工作，文中结合开发者的实践技能相似性与共同开发者数，为Sourceforge．net社区未曾合作的开发者提供一种同行推荐的方法．研究结果表明文中的方法能够有效地实现开发者同行推荐，相比只考虑共同开发者数时成功推荐的开发者数增加了31．1％，且推荐精度提高0．4倍，缓解了社区合作的稀疏性．最后，应用文中提出的方法开发了一个Roster推荐系统，为社区开发者的交流建立了一种新的辅助途径．

859-872

一种基于改进D-S证据理论的信任关系强度评估方法研究

摘要：随着Web2．0技术的迅速发展，社会网络开始在我们的生活中扮演着重要的角色，越来越多的人在网络中发表言论、互相交流、共享信息．然而，在社会网络中，信任关系是用户间进行交互的基础，不同用户之间的信任关系强度不同，相同用户在不同领域内的信任关系强度也存在差异，信任关系的不确定性是信任评估的最大挑战．针对以上问题提出了一种基于改进D-S证据理论的灵活直观的评估方法，该方法综合考虑用户被关注度、用户信誉度、用户活跃度和用户相似度4个方面，将这4个方面作为4个属性证据，同时根据模糊理论中的隶属度原理获取基本信任分配，然后基于以上4个属性证据构建多源属性证据信任关系强度融合模型，在领域内对其信任关系强度进行评估，最后采用Epinions中真实的数据集进行实验．实验结果验证了该方法的可行性和优势，为复杂的社会网络环境中信任关系强度评估的研究提供了有价值的新思路．

873-883

犇犻犳犳犚犪狀犽：一种新型社会网络信息传播检测算法

摘要：信息传播检测是给定一个传播网络，如何选择最有效的节点集合作为观察节点或部署传感器，以尽早尽快检测到网络中传播的信息，这对于社会网络中的意见领袖挖掘、谣言传播检测、舆情监控等应用具有重要意义。文中结合网络结构特点、节点内容属性、历史传播数据等信息，提出了一个基于随机游走模型的传播能力排序算法DiffRank，根据该算法的结果选择传播能力最强的top-犽个节点作为观察节点来检测网络中可能出现的信息传播。基于新浪微博真实数据的实验结果表明，与其他同类算法相比，DiffRank算法在检测覆盖率、检测时间和信息感染人数下降比率3个指标上，都优于同类算法。在算法的可扩展性方面，DiffRank算法更加适用于并行或分布式计算，可扩展性更好。

884-893

面向目标市场的信息最大覆盖算法

摘要：当一个企业或商家需要投放广告时，往往会先通过历史数据、个人兴趣等挖掘出可能购买自己产品的用户，即目标市场（TargetMarket），然后将广告信息通过电视、报纸等公共媒体的形式传递给这些目标用户，希望有更多的目标用户接受信息。然而调查显示，相比于传统大众媒体，人们更倾向于从自己认识的人那里去获取信息，因此文中考虑利用社会影响力的方式去传播广告：在社会网络中说服有限数目的初始用户，并让他们向熟识的人传播信息，期望信息可以通过级联传播覆盖尽可能多的目标用户。由于以往的信息覆盖最大化的工作集中于对全局网络的考虑，因此会忽略目标节点和全局网络之间的联系。通过数据观察可以发现，目标用户往往会由于同质性等原因而聚集在一起，因此文中提出基于聚类的KCC算法，算法通过对用户进行聚类分析，找出每个聚类的代表性用户，使得这些代表性节点可以影响尽可能多的目标用户，同时避免他们之间对信息覆盖的重叠。在不同的真实的数据集的实验显示KCC可以在大多数情况下取得优于其它常用算法的性能，尤其当种子节点数增多时，KCC可以更多地避免节点之间信息覆盖的重叠，从而取得更好的效果；同时，KCC只需要很短的运行时间，具有良好的可扩展性。

894-904

社交网络的结构支撑理论

摘要：社交网络分析是近年来的研究热点之一，常见的分析方法包括度分布分析、个体排名、社区发现、模式发现等。文中，作者认为一个人的社会地位与其所在的网络结构具有紧密的联系，而这种网络结构对成员社会地位的影响程度是可以被表示和量化的。文中通过分析社交网络的链接结构，将社交网络中个体与个体间的依赖关系从一般社会关系中抽取出来，提出了一种基于依赖模型的支持力衡量方法，并基于此给出了一种高效的计算最具支持力的节点计算方法。此外，基于上述模型，设计了一种基于依赖关系的支撑结构模型及其计算方法，用于刻画社交网络中特定节点的影响力来源。作者在大规模的真实数据环境下对模型和算法的正确性、效率和伸缩性进行了验证。

905-914

计算机学报杂志隐私保护

无线传感器网络中隐私保护通用近似查询协议

摘要：无线传感器网络中实现隐私保护通用近似查询是具有挑战性的问题．文中提出一种无线传感器网络中隐私保护通用近似查询协议PGAQ．PGAQ将传感器节点编号和其采集数据隐藏于设计的数据结构中，在基站构造线性方程组解出直方图，根据直方图具有的统计信息，不泄露隐私地完成Top-k查询、范围查询、SUM、MAX/MIN、Median、Histogram等近似查询．PGAQ使用网内求和聚集以减少能量消耗，并且能够通过调节直方图划分粒度来平衡查询精度与能量消耗．PGAQ协议分为H-PGAQ和F-PGAQ两种模式．H-PGAQ模式使用数据扰动技术加强数据安全性，F-PGAQ使用过滤器减少连续查询通信量．通过理论分析和使用真实数据集实验验证了PGAQ的安全性和有效性．

915-926

面向数据和分析的差分隐私保护

摘要：随着数据分析和等应用需求的出现和发展，如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战。基于犽-匿名或者划分的隐私保护方法，只适应特定背景知识下的攻击而存在严重的局限性。差分隐私作为一种新出现的隐私保护框架，能够防止攻击者拥有任意背景知识下的攻击并提供有力的保护。文中对差分隐私保护领域已有的研究成果进行了总结，对该技术的基本原理和特征进行了阐述，重点介绍了当前该领域的研究热点：差分隐私下基于直方图的技术、基于划分的技术以及回归分析技术。在对已有技术深入对比分析的基础上，指出了差分隐私保护技术的未来发展方向。

927-949

计算机学报杂志互联网技术

互联网自治域商业关系推测算法

摘要：随着互联网进入商业化发展阶段，不同管理机构的自治域通过商业合作关系来共同路由互联网中的流量。从工程上来看，获取全面准确的自治域商业关系可以指导有效的流量工程管理和资源部署从而均衡网络负载，提高服务可靠性，减少网络运营成本；从理论上来看，获取全面准确的自治域关系可以分析互联网的演进模型，指导设计新的路由协议和互联网架构。虽然互联网路由注册中心会记录自治域之间的商业关系，但是由于商业敏感以及注册中心缺乏维护更新，公开的自治域商业关系并不全面准确，因而通过推测算法获得更加全面准确的自治域商业关系成为了学术界与产业界关注的热点。文中系统地综述了现有的互联网自治域商业关系推测算法及其存在的问题，并对该领域有待进一步研究的问题和可能的解决方案给出了一些建议。

950-962

计算机学报杂志

期刊咨询

期刊推荐

文秘服务

计算机学报 2014年第04期杂志文档列表

计算机学报杂志

期刊咨询

期刊推荐

文秘服务

计算机学报 2014年第04期杂志 文档列表

计算机学报 2014年第04期杂志文档列表