计算机研究与发展杂志-2015年第04期-学术点评

计算机研究与发展 2015年第04期杂志文档列表

计算机研究与发展杂志大数据驱动的网络科学研究专题

前言

摘要：近年来，随着互联网、移动网、物联网、社会网等网络技术的迅猛发展，“人‐机‐物”网络空间中网络规模不断膨胀、网络结构日益复杂、信息与数据也呈爆炸式增长。在此背景下，传统的技术手段在解决网络控制、资源管理、服务质量和异常检测等网络问题时会存在一定的局限性。而日趋成熟的大数据理论及方法，为解决这些问题提供了新的机遇，也吸引了网络科学研究者们的注意，并衍生出大数据驱动的网络科学研究这一新兴的研究领域。

777-778

基于小数据的在线用户兴趣长程演化研究

摘要：网络大数据中与Web用户行为相关的数据，例如在线点击数据和通讯记录等，为人们深度挖掘和定量分析人类兴趣动力学带来了机遇，这些在线行为数据被称为大数据时代的“小数据”，有助于揭示许多复杂的人类社会与经济现象．Web用户行为建模时常见的前提假设就是人的行为符合M arkov过程，用户下一行为仅依赖于当前行为，与过去的历史行为无关．然而，在线用户行为是一个复杂过程，常常依赖于人的兴趣，对于人类兴趣动力学的本质规律目前知之甚少．利用中国互联网络信息中心提供的30000多名在线用户行为记录数据，基于块熵理论对在线用户行为进行分类研究，通过信息论分析方法，结合熵增曲线的离散导数和积分理论，分析在线用户点击行为的随机性和记忆性特征．研究表明，与常见的假设不同，Web用户的行为并不是一个简单的M arkov过程，而是一个符合幂率的非周期无限长程记忆过程；进一步还发现，用户在线连续点击7个兴趣点，其行为的平均预测增益就可达到95．3％以上，可为大数据时代在线用户兴趣精准预测提供理论指导．

779-788

基于科研合作网络的自动审稿人选择研究

摘要：主要研究科研合作网络（scientific collaboration network ，SCN）中选择审稿人的2个核心问题：网络构建和社区聚类。基于杂志论文的审稿人主要来自本杂志作者及审稿人应尽量评审与自己无关的科研工作这2个事实，通过论文中作者的排名计算所有作者之间的合作关系，构建归一化科研合作网络。考虑到网络中边的稀疏性，设计了合作压缩感知算法来计算不同作者间的社区类型，进行科研合作社区聚类。在模拟数据及2个真实期刊作者库上开展了多个实验。由于没有一个客观标准去评估所选出审稿人的合适性，通过网络中顶点连接矩阵的自动聚类性评估所构建科研网络的性能，通过作者合作团体的检测准确性来评价审稿人挑选的有效性。从实验结果可以看出，提出的网络构建方法具有较好的顶点聚类性；和经典算法相比，合作压缩感知社区检测算法在检测速度和稳定性方面具有很大的优势，审稿人挑选正确率提高了大约60％。

789-797

数据驱动的信息中心网络认知路由协议

摘要：随着网络技术的迅速发展和新型应用的不断涌现，网络中的数据急剧增长给基于 TCP/IP的Internet带来严峻挑战。为了支持用户对海量数据的访问，信息中心网络（information‐centric networking ， ICN ）成为未来互联网的研究热点之一。提出一种数据驱动的ICN认知路由协议。每个路由节点都被赋予感知、询问、学习、推理和反馈等认知行为；通过感知行为，节点获取本地拓扑、路由请求处理信息和流行内容等；通过询问行为，节点构建邻居缓存表等；通过学习行为，节点得到经验路径信息等；通过推理行为，分析节点间关系，构建朋友缓存表等；通过反馈行为，基于指引信息，作出路由决策等。仿真结果表明，提出的协议是可行和有效的，具有较好的性能。

798-805

基于软件定义数据中心网络的节能路由算法

摘要：由于数据中心网络是云计算和下一代网络技术的平台和基础设施，日益增长的网络数据在满足用户需求的同时，也大幅增加了数据中心的能耗。许多针对数据中心网络的节能策略被提出，多数采用硬件与软件相结合的策略来完成节能模型的设计。为了进一步降低能耗，从网络负载均衡和节能路由设计的角度提出了一种新的节能路由算法，其基本思想是首先对负载均衡进行量化分析，然后提出带宽限定的负载均衡与节能相结合的节能路由算法，充分考虑到网络整体的可达性和可靠性。该算法为数据中心节能提供了一种新的视角。通过与传统的节能路由作比较，验证了该算法能够在保证较高网络可靠性的同时能耗较低。通过对实验数据的分析和解释得到了若干有益的结论，为进一步的研究工作奠定了基础。

806-812

骨干网络中RoQ攻击的监测、定位和识别

摘要：降质（reduction of quality ，RoQ）攻击是一种非典型拒绝服务攻击，它利用TCP自适应机制的安全漏洞能够显著降低或抑制TCP服务质量，且具有很强的隐蔽性。现有的研究集中在针对单条网络链路上的攻击和检测。但是，Ro Q攻击的对象并不局限于此，它既可以对单条链路发动攻击，也可以有选择的对多条链路（甚至整个网络）发起攻击，造成更大的危害，所以需要有一种能够从网络全局角度分析和识别的方法。为此，提出了一种基于骨干网络流量分析的异常监测、定位和识别的方法M IL‐Ro Q （monitoring ，identifying and locating the RoQ attack in backbone network ）。主要使用主成分分析（principal component analysis ，PCA ）和频谱分析（spectrum analysis）技术对骨干流量进行流量建模分析，从全局角度监测网络流量变化情况，能够同时分析和判断多条链路的异常情况，并能准确识别出Ro Q攻击。使用了CERNET骨干网络数据进行实验分析，结果表明该方法能够有效地定位和识别RoQ 攻击；同时，攻击识别时只需要使用局部的流量数据，因而能显著降低计算量和复杂度。

813-822

计算机研究与发展杂志并行计算

千万亿次可扩展可容错自由网格数值模拟系统

摘要：在千万亿次计算能力的驱动下，数值软件的发展进入了一个以海量并行为基本特征的历史转折期，可扩展和可容错成为大规模数值模拟的两大关键技术．petaPar模拟程序是以对传统数值技术形成优势互补的无网格类方法为切入点，面向千万亿次级计算而开发的下一代新兴通用数值模拟程序． petaPar在统一架构下实现了光滑粒子动力学（smoothed particle hydrodynamics ，SPH ）和物质点法（material point method ，M PM ）两种最为成熟和有效的无网格/粒子算法，支持多种强度、失效模型和状态方程；其中M PM 支持改进的接触算法，可以处理上百万离散物体的非连续变形和相互作用计算．系统具有以下特点：1）高可扩展．实现单核单Patch极端情形下计算和通信的完全重叠，支持动态负载均衡；2）可容错．支持无人值守变进程重启动，在系统硬件出现局部热故障时可以不中止计算；3）适应硬件体系结构异构架构的变化趋势，同时支持flat M PI和M PI＋Pthreads并行模型．程序在Titan千万亿次超级计算机上进行了全系统规模的可扩展性测试，结果表明该代码可线性扩展到26万个CPU核，SPH和M PM的并行效率分别为100％和96％．

823-832

高阶精度CFD应用在天河2系统上的异构并行模拟与性能优化

摘要：在当前主流的众核异构高性能计算机平台上开展超大规模计算流体力学（computational fluid dynamics ，CFD）应用的高效并行数值模拟仍然面临着一系列挑战性技术问题，也是该领域的热点研究问题之一．面向天河2高性能异构并行计算平台，针对高阶精度C FD流场数值模拟程序的高效并行进行了探索，重点讨论了C FD应用特点与众核异构高性能计算机平台特征相适应的性能优化策略，从任务分解、并行度挖掘、多线程优化、SIMD向量化、CPU与加速器协同优化等方面，提出一系列性能提升技术．通过在天河2高性能异构并行计算平台上进行了多个算例的数值模拟，模拟的最大C FD规模达到1228亿个网格点，共使用约59万C P U＋M IC处理器核，测试结果表明移植优化后的程序性能提高2．6倍左右，且具有良好的可扩展性．

833-842

GPU加速不完全Cholesky分解预条件共轭梯度法

摘要：不完全 Cholesky 分解预条件共轭梯度（incomplete Cholesky factorization preconditioned conjugate gradient ，ICCG）法是求解大规模稀疏对称正定线性方程组的有效方法。然而ICCG法要求在每次迭代中求解2个稀疏三角方程组，稀疏三角方程组求解固有的串行性成为了ICCG法在GPU上并行求解的瓶颈。针对稀疏三角方程组求解，给出了一种利用GPU 加速的有效方法。为了增加稀疏三角方程组求解在GPU上的多线程并行性，提出了对不完全Cholesky分解产生的稀疏三角矩阵进行分层调度（level scheduling ）的方法。为了进一步提高稀疏三角方程组求解的并行性能，提出了在分层调度前通过近似最小度（approximate minimum degree ，AMD）算法对系数矩阵进行重排序、在分层调度后对稀疏三角矩阵进行层排序的方法，降低了分层调度过程中产生的层数，优化了稀疏三角方程组求解的GPU内存访问模式。数值实验表明，与利用NVIDIA CUSPARSE实现的ICCG法相比，采用上述方法性能可以获得平均1倍以上的提升。

843-850

MASNUM海浪模式的性能特点分析与并行优化

摘要：海浪模式MASNUM （marine science and numerical modeling）是我国自主研发的海浪数值模式，该模式已广泛应用于我国海洋防灾减灾、海上交通运输、军事活动保障等方面的海浪预报中．随着提升业务预报精度和气候研究需求的不断增长，高分辨率成为海浪模式发展的必由之路．尽管高性能计算机的快速发展为高分辨率数值模式提供了强大的计算能力支持，但当前很多并行数值模式效率还不高，无法获得更高并行加速比，无法提高模式并行效率并缩短运行墙钟时间．结合现代高性能计算机体系结构特点，深入分析MASNUM 模式的性能瓶颈，继而有针对性地对其开展并行优化，明显地提升了通信性能、I/O性能和二维剖分负载平衡性，进而提升了MASNUM 模式整体并行效率和可扩展规模．这里以串行性能为基准，当扩展规模达到960个C P U核时，改进后版本加速比可达431．5．该研究也为其他数值模式提供了一些可供借鉴的并行优化策略．

851-860

基于HDF5实现多区结构网格CFD程序的并行I/O

摘要：计算流体动力学（computational fluid dynamics ，CFD）是高性能计算重要应用领域之一，其计算涉及大量数据访问．在大规模并行计算情况下，串行I/O的性能与计算能力不匹配，I/O成为性能瓶颈．并行I/O 是解决这一问题的主要途径之一．针对一个真实多区结构网格CFD 并行程序 HOSTA （high‐order simulator for aerodynamics），基于HDF5（hierarchical data format v5）数据存储格式及其并行I/O编程接口，实现了其主要数据的并行I/O．在一套有6个I/O服务器结点的高性能计算机系统上，采用实际C FD算例进行了性能测试．对一个三角翼算例，并行I/O相对于串行I/O的性能加速比达到21．27，最高获得5．81 GBps的I/O吞吐率，并使程序整体性能提高10％以上；对一个网格规模更大的简单翼型算例，并行I/O最高获得了6．72 GBps的I/O吞吐率．

861-868

高度可扩展的3D叠前Kirchhoff时间偏移并行算法

摘要：为适应海量地震数据以及集群并行规模不断增大的趋势，提出了多维度成像空间分解算法。根据大规模集群系统有多个并行层次的特征，首先沿炮检距方向分解成像空间；然后再沿in‐line方向继续切分，直到成像空间小于计算节点物理内存；最后在二维地表上以面元为单位分解成像空间。算法实现上，共炮检距成像空间映射到计算节点组上，计算节点内的CPU 核之间按照round‐robin均分面元。该并行算法在不增加数据通信量的情况下，降低了内存的需求，减少了通信开销和同步时间，提高了数据的局部性。实际资料测试表明，该并行算法比传统的输出并行和输入并行算法具备更好的性能与可扩展性，实验作业调度多达497个节点、7552个线程，仍然具备较好的加速效果。

869-878

计算机研究与发展杂志云计算

云计算环境下隐私需求的描述与检测方法

摘要：云计算已经成为一种计算范型为用户提供服务，但其开放性、虚拟化和服务外包化的特点使得用户的隐私信息难以控制和保护。以描述逻辑为基础，提出了一种云计算环境下面向语义的隐私需求描述与检测方法。首先，对用户隐私需求与服务提供者的隐私策略进行描述；其次，对两者之间是否存在冲突进行检测，发现满足用户隐私需求的服务；最后，利用Prot＆#233;g＆#233;本体建模工具对用户的隐私需求和服务提供者的隐私策略进行建模，并利用Pellet推理机进行了实验，分别对本体模型中的概念进行一致性检测和对概念与逻辑公理之间的可满足性进行检验，从而证明了此检测方法的正确性与可行性。

879-888

基于前馈和反馈控制运行时虚拟资源动态分配

摘要：随着云计算的流行和发展，越来越多的应用系统被部署在云服务器上，以可伸缩的方式按需获取虚拟资源并按使用量付费。因此，如何在保证应用系统优化运行的同时以一种考虑成本效益的方式来分配和使用虚拟资源就成了一个重要的研究问题。传统的手工调整方法不但会增加系统管理员的负担，而且准确性较差并有一定的延迟。现有的虚拟资源动态分配方法大多是在发现系统运行时质量问题后进行资源动态调整的，因此具有一定的延迟性，而且还忽略了虚拟资源的异构性带来的影响。针对这些问题，提出了一种基于控制理论的虚拟资源动态分配方法。该方法使用一个前馈控制器来动态调整虚拟资源的数量，同时使用一个反馈控制器来动态调节各个虚拟资源处理的负载比例，从而实现应用系统的优化运行和虚拟资源的有效利用。与静态虚拟资源分配方法以及仅包括前馈控制方法的对比实验表明，所提出的方法能够在保证应用系统优化运行的同时提高虚拟资源利用的有效性。

889-897

计算机研究与发展杂志软件技术

基于中间语言的 JNI内存泄漏检查

摘要：JNI技术支持Java与本地C/C＋＋的相互调用，在Android等混合语言实现的系统中有着广泛应用，但语言之间的安全特性差异使其成为安全薄弱环节，现有的分析方法难以处理多语言相互调用产生的安全缺陷。以JNI调用中易产生的内存泄漏为例，开展Java/C＋＋JNI跨语言分析的研究。采用扩展的Java Bytecode（Bytecode倡）指令作为C＋＋语义的解释来消除跨语言分析的障碍。围绕JNI调用中内存泄漏的问题，做了以下3方面工作：1）定义兼容Java/C＋＋语言的分块内存模型；2）基于LLVM/LLJVM ，设计实现了C＋＋到Bytecode倡的翻译策略；3）建立方法调用图，提取方法摘要，利用过程间分析方法检测JNI调用中的内存泄漏。针对具有典型内存泄漏特征的JNI实例翻译检测表明，该工作能够准确检测出Java/C＋＋混合语言中的内存泄漏，对于JNI混合语言编程的理解和漏洞分析具有重要价值。

898-906

支持透明集成的数据缓存机制

摘要：数据缓存是提升动态Web应用性能的重要手段，传统数据缓存方案主要进行数据查询缓存，通常需要开发人员对应用程序进行大量修改并负责缓存失效维护，导致缓存方案的部署成本和维护成本过高．提出一种新的基于键值存储结构的数据缓存机制EasyCache ，支持缓存数据的自动加载，兼容常用的标准数据访问接口及SQL语法，并提出一种基于规则的优化模型及数据一致性保障策略，开发人员无需修改应用程序即可完成EasyCache的集成．T PC‐W基准测试结果表明系统性能得到显著提升，在单表数据规模增加以及并发用户规模增加等情况下，系统响应速度可提高10倍，吞吐率提高近1倍．

907-917

Vague区域关系与方向关系的表示及复合推理

摘要：Vague区域关系和Vague方向关系的表示和推理在空间数据库、网络信息安全、数据挖掘和人工智能等领域具有重要的意义。为了处理复杂的Vague区域关系和Vague方向关系表示及其复合推理等问题，基于Vague集对Vague区域关系和方向关系进行了系统研究。给出了Vague区域关系交集矩阵和表示模型；为了处理由参照对象的不确定性所导致的方向关系的不确定性，基于V ag ue集提出了V ag ue方向关系的交集矩阵表示方法；为了对动态V ag ue方向关系进行分析、预测与推理，详细研究了Vague方向关系的动态性和动态邻接关系，给出了Vague方向关系的反向方向关系处理方法；进一步研究了Vague区域关系和Vague方向关系的复合关联推理方法。理论研究和实验分析表明研究成果可较好地处理V ag ue区域关系和V ag ue方向关系及其复合关联推理等问题，增强了数据信息处理系统对复杂不确定空间关系的处理能力。

918-928

一种面向海量存储系统的高效元数据集群管理方案

摘要：高效的、去中心化的元数据管理方案对大型分布式存储系统的可靠性、可扩展性起至关重要的作用．针对基于Hash划分和基于子树划分的元数据管理方案扩展代价巨大、对集群变动敏感等问题，提出一种基于一致性 Hash结构的元数据服务器（metadata server ，MDS）集群化方案———CH‐MMS （consistent Hash based metadata management schema）．CH‐MMS 在一致性 MDS 集群上引入虚拟MDS（Virtual MDS），有效平衡MDS集群负载；将Standby机制与延迟更新策略融合并应用于MDS集群，实现MDS快速失效恢复以及集群变动时零数据迁移量．阐述了CH‐MMS的体系结构，介绍了核心数据结构layout‐table、虚拟MDS结构、延迟更新机制及相关算法，并对CH‐MMS扩展性、容错性作了定性分析．最后通过原型系统和模拟实验说明，CH‐MMS具有元数据平衡分布、快速失效恢复、灵活的扩展性以及零结点变动数据迁移量等特点，能满足数据量不断增加的大规模存储集群元数据灵活、高效管理的需求．

929-942

计算机研究与发展杂志

期刊咨询

期刊推荐

文秘服务

计算机研究与发展 2015年第04期杂志文档列表

计算机研究与发展杂志

期刊咨询

期刊推荐

文秘服务

计算机研究与发展 2015年第04期杂志 文档列表

计算机研究与发展 2015年第04期杂志文档列表