计算机研究与发展杂志社
分享到:

计算机研究与发展杂志

《计算机研究与发展》杂志在全国影响力巨大,创刊于1958年,公开发行的月刊杂志。创刊以来,办刊质量和水平不断提高,主要栏目设置有:综述、计算机技术、计算机网络、人工智能、计算机软件、计算机应用等。
  • 主管单位:中科院出版委员会
  • 主办单位:中国科学院计算技术研究所
  • 国际刊号:1000-1239
  • 国内刊号:11-1777/TP
  • 出版地方:北京
  • 邮发代号:2-654
  • 创刊时间:1958
  • 发行周期:月刊
  • 期刊开本:A4
  • 复合影响因子:2.65
  • 综合影响因子:1.654
相关期刊
服务介绍

计算机研究与发展 2015年第05期杂志 文档列表

计算机研究与发展杂志信息检索

基于指令级并行的倒排索引压缩算法

摘要:文本信息数量的快速增长给传统的信息检索技术带来了新的挑战.搜索引擎通常使用倒排索引来高效地处理查询.为了减少存储开销和加快访问速度,倒排索引通常被压缩存储.因此,如何选择一个高性能的压缩算法对高效查询处理是非常有必要的.在已有倒排链压缩算法PackedBinary和PForDelta的基础上,利用CPU的超标量特性和SIMD向量指令集,将其压缩和解压缩中的关键步骤并行化,提出了2种指令级并行压缩算法SIMD-PB和SIMD-PFD.基于GOV2和ClueWeb09B两个公开数据集的实验表明,SIMD-PB和SIMD-PFD算法在压缩率不变的情况下,压缩和解压缩速度比现有的压缩算法均有非常明显的提升.其中解压缩速度比起目前最好的倒排链压缩算法,最高能提升17%.此外,实验表明算法在较长的倒排链、较大的压缩块单位上有更好的解压缩性能.
995-1004

基于集成学习的中文文本欺骗检测研究

摘要:欺骗信息检测是信息安全领域中的重要研究内容.现有的研究表明,三分之一的人际交往中会涉及到潜在的欺骗,大量的欺骗信息充斥在各种各样的通信媒介中,在海量的网络信息中欺骗性数据的规模通常远小于非欺骗性数据的规模,已有方法还不能很好地适应于准确高效地欺骗检测,迫切期望提出一种能高效地检测欺骗信息的方法.针对具有非平衡性的海量网络信息,提出了一种基于集成学习的欺骗行为检测方法.通过改进的二分k-means划分方法对训练样本集进行分解,分别在每对正负样本集上学习各自独立的分类器,然后利用每个独立分类器分别计算待测样本的类别输出值,并采用结合个体分类器分类正确率的最小最大模块化方法集成每个判别结果.实验结果验证了该方法的有效性.
1005-1013

2015年《计算机研究与发展》网络与信息安全专辑(正刊)征文通知——“网络安全与隐私保护研究进展”

摘要:近年来,随着计算机网络的不断发展,数据量的井喷式增长催生了大量新型网络应用,随之产生的网络安全问题也更加突出.网络安全除了网络密码安全、网络系统安全外,由于云计算、大数据等新型应用模式需求,产生了大量的安全与隐私保护问题,这些问题的研究不仅关乎国家安全、经济发展和社会稳定,也关乎网络安全学科本身的进步.为推动我国学者在这方面的研究、及时报道我国学者的最新研究成果,《计算机研究与发展》将于2015年10月出版网络与信息安全专辑——网络安全与隐私保护研究进展,欢迎相关领域的专家学者和科研人员踊跃投稿.
1013-1013

社区热点微博推荐研究

摘要:分析并总结了影响用户对特定微博兴趣的若干因素,在此基础上基于潜在因素模型提出了1个融合显式特征和潜在特征的社区热点微博推荐算法(community micro-blog recommendation, CMR),并将其用于发现微博兴趣社区热点信息.算法在3个兴趣社区上进行了实验,结果表明:1)融合2种特征信息的微博推荐效果好于使用单一特征信息的推荐;2)CMR的推荐效果好于基于转发次数的对照实验(micro-blog repost rank based recommendation, MRR);3)通过分析各个算法所推荐的微博内容,发现CMR倾向于为用户推荐兴趣社区相关微博,而MRR倾向于为用户推荐公共热点微博.
1014-1021

基于动量模型的微博突发话题检测方法

摘要:针对微博特征空间动态变化、信息噪音大的特点,提出一种基于有意义串动量模型的微博突发话题检测方法.提取时间窗口内微博信息流的有意义串,作为微博信息的动态特征,根据动力学原理对特征进行动量建模,结合特征能量大小、变化趋势以及二阶变化率检测突发特性有意义串,即突发特征,合并突发特征形成突发话题.微博数据实验表明,该方法适用于在线微博突发话题检测,在准确率和召回率上都有明显提升.
1022-1028

无指导的中文开放式实体关系抽取

摘要:传统的实体关系抽取需要预先定义关系类型体系,然而定义一个全面的实体关系类型体系是很困难的.开放式实体关系抽取技术解决了预先定义关系类型体系的问题,但是在中文上的研究还比较少.提出面向大规模网络文本的无指导开放式中文实体关系抽取方法,首先使用实体之间的距离限制和关系指示词的位置限制获取候选关系三元组;然后采用全局排序和类型排序的方法来挖掘关系指示词;最后使用关系指示词和句式规则对关系三元组进行过滤.在获取大量关系三元组的同时,还保证了80%以上的微观平均准确率.
1029-1035

2015年起《计算机研究与发展》双月将固定领域专题

摘要:致广大读者和作者:本刊从2015年起将双数期约1/2版面固定为某个领域,每年将策划该领域的一个热点主题进行集中报道.具体的征文通知将在专题发表前6个月,请关注期刊网站!
1035-1035
计算机研究与发展杂志软件技术

基于Agent的人工社会建模语言研究

摘要:人工社会(artificial societies)、计算实验(computational experiments)与平行执行(parallel execution)简称为ACP方法,是用于帮助突发事件应急管理等复杂社会问题研究的一个经典社会计算方法,人工社会建模是该方法的基础.人工社会作为现实社会系统在计算机世界中的映射,具有多样性、层次性、社会性、演化性等诸多复杂性特点.因此,如何有效地支持人工社会建模成为了一个研究重点.综合考虑了人工社会特点以及突发事件应急管理和ACP方法对人工社会建模的需求,提出了人工社会建模语言(artificial society modeling language, ASML),详细介绍了ASML的元模型、多视点模型以及图形化建模语言.ASML借鉴了已有多Agent系统技术研究成果并借助于社会组织学思想,便于以抽象、自然且易于理解的方式对人工社会进行分析与建模,其严格语义基础使得模型检查与模型转换成为可能.此外,开发的支撑工具集ASMLTools可用于支持基于ASML的建模、模型检查和模型转换等.通过案例分析使ASML的有效性与可用性得以验证.
1036-1049

考虑观点多样性的评论选择问题

摘要:在线用户评论向消费者提供了丰富的商品信息,帮助他们挑选从日常用品到娱乐活动相关的商品.然而,评论的数量之大让用户难以对商品有一个清晰的认识.现有解决电子商务网站中评论信息过载问题的方法包括评估评论质量以及总结评论观点等.但是,基于评论质量排序的方法可能信息冗余,而评论总结方法忽视上下文导致易读性较差.因此,需要实现有效的评论选择方法.设计了基于字典和规则以及基于主题模型LDA的观点获取算法来形式化地表示每条评论;提出一种基于贪心算法的评论选择方法,实现从商品评论集中选择一组高质量的评论,并最大化评论集的商品属性覆盖度和评论观点多样性.最后在真实数据集上对算法进行实验来验证该算法,实验结果表明了该算法的有效性.
1050-1060

基于列存储的大数据分析系统物化策略研究

摘要:大数据具有规模大、深度大、宽度大、处理时间短、硬件系统普通化和软件系统开源化特点.针对当前传统数据库在对大数据进行分析时系统性能严重下降、计算效率提升有限的问题,提出一种基于列存储的大数据分析系统物化策略(materialization strategies in MapReduce based on column-store, MSMC).首先,通过引入MapReduce物化代价估计模型,深入分析影响物化效率的各个因素.在此基础上设计了MapReduce分布式环境下的列存储文件格式(MapReduce column-store file, MCF),并在数据加载过程中采用协同定位策略实现对物化数据的存储优化.其次,分别针对不同的物化时机,构建了MapReduce早期物化策略(MapReduce early materialization strategy, MEMS)、MapReduce延迟物化策略(MapReduce late materialization strategy, MLMS)和MapReduce混合物化策略(MapReduce early-late materialization strategy, MELMS).利用自适应物化调整策略对其做了进一步优化.实验结果在证明算法有效的同时,也显示出算法在存储空间和负载能力上都有很好的表现.
1061-1070
计算机研究与发展杂志人工智能

基于并行约简的概念漂移探测

摘要:数据流挖掘是当前数据挖掘研究的一个热点,概念漂移检测是数据流挖掘的一个重要研究方向.虽然有不少概念漂移的探测方法,但是它们都有一些共同的缺陷:没有整体上删除冗余属性以及利用外部属性去探测概念漂移(比如利用对外部数据的分类准确率)等.利用粗糙集和F-粗糙集的基本原理和基本方法,把数据流中的滑动窗口当成决策子表簇,提出了一种对数据流进行并行约简、整体删除冗余属性的方法,并运用并行约简后数据流决策子表簇中属性重要性的变化探测概念漂移现象.与传统的方法不同,新方法利用数据的内部特性对概念漂移进行探测.实验结果显示,该方法能够有效地整体删除冗余属性、探测概念漂移现象,并且基于互信息的属性重要性在概念漂移探测效果方面比基于正区域的属性重要性要好些.
1071-1079

基于协作度的分布式自动协商联盟形成机制

摘要:现有联盟形成的研究中大都没有考虑到不同Agent的协作资源和协作态度不同的异质性,而是假定所有Agent具有相同的协作资源和协作态度.为此提出一种基于协作度的分布式自动协商联盟形成机制(collaborative degree-based distributed automatic negotiation coalition formation mechanism, CDBDN),通过对处在网络拓扑结构中Agent的协作资源和协作态度的描述建立Agent协作度的概念.以分布式的应用环境为背景,建立分布式协商协议(distributed negotiation protocal, DNP)来实现分布式自动协商方式构建联盟.该机制建立了分布式协商协议和引入了Agent协作度,提出基于Agent协作度的协商策略.实验结果表明,该机制在联盟形成的效率、Agent协商效率和个体效用方面都表现出有较好的性能.
1080-1090

基于实例化次数的约束求解方法研究

摘要:启发式是约束满足问题领域的重要研究课题,有效的启发式方法可以极大地提高问题的求解效率.在求解约束满足问题时,发现变量实例化失败次数与值实例化成功次数反映了变量和值与已实例化集合之间的关系,将实例化次数加以利用可以对问题求解效率有很大的影响.据此,提出了实例化次数的权值统计方法,并将其与现有启发式方法相结合,提出了实例化次数启发式及其相应的约束求解算法MAC_Try,并证明了其在一个分支上的最坏时间复杂度是O(ned3).大量实验结果表明,新的MAC_Try方法在求解效率上明显优于国际上流行的MAC3rm方法.
1091-1097

基于混合编程模型的支持向量机训练并行化

摘要:支持向量机(support vector machine, SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method, IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储空间所带来的双重挑战.针对此问题,提出利用CPU-GPU异构系统进行大规模SVM训练的混合并行机制.首先利用计算统一设备架构(compute unified device architecture, CUDA)对基于内点法的SVM训练算法的计算密集部分并行化,并改进算法使其适合利用cuBLAS线性代数库加以实现,提高训练速度;然后利用消息传递接口(message passing interface, MPI)在集群系统上实现CUDA加速后算法的分布并行化,利用分布存储有效地增加所处理数据集规模并减少训练时间;进而基于Fermi架构支持的页锁定内存技术,打破了GPU设备存储容量不足对数据集规模的限制.结果表明,利用消息传递接口(MPI)和CUDA混合编程模型以及页锁定内存数据存储策略,能够在CPU-GPU异构系统上实现大规模数据集的高效并行SVM训练,提升其在大数据处理领域的计算性能和应用能力.
1098-1108
计算机研究与发展杂志计算机网络

能源互联网信息技术研究综述

摘要:可再生能源将在一定程度上缓解能源供给的紧张局势,但实现与已有能源系统的有机融合存在诸多问题,使得当前的能源体系面临着新一轮变革.借鉴信息领域的互联网理念、方法与技术等成果,能够保证从能源生产、传输到消费全过程的开放对等、便捷接入、智慧用能的能源互联网成为了重要发展方向.本文从基础架构角度讨论能源、信息基础设施发展的一般规律,阐述了能源互联网概念和基本特征;在总结能源互联网体系结构与技术框架、综述国内外相关信息技术研究成果的基础上,详细分析了发展能源互联网过程中信息技术所面临的关键问题和挑战.
1109-1126

MDCent:一种高可扩展、高吞吐量的模块间互连结构

摘要:近年来,提出的以服务器为中心的新型数据中心网络互连结构部分程度地解决了传统树型结构面临的性能瓶颈和可扩展性难题,同时出现了以集装箱为基本模块构建超大规模的数据中心.然而,如何设计模块之间的互连结构,确保数据中心网络具有高可扩展性、模块之间具有高带宽是一个非常具有挑战性的问题.以BCube为代表的新型数据中心网络,能够将数千台服务器互连在一个集装箱内,且对各种典型流量模式提供较高的带宽.提出了一种常量度数的模块之间的互连结构MDCent.MDCent基于BCube结构进行模块内服务器互连,利用模块内大量未被使用的上行端口,在各个模块保持常量度数的情况下,能够保证模块之间具有高可扩展性,同时模块之间具有较高的带宽.
1127-1136

遗传算法优化回声状态网络的网络流量预测

摘要:网络流量预测是网络拥塞控制与网络管理的一个重要问题. 网络流量时间序列具有时变、非线性特征,导致传统时间序列预测方法预测精度比较低,无法建立精确的预测模型.回声状态网络(echo state network, ESN)在非线性混沌系统预测与建模方面有着良好的性能,非常适合网络流量的预测.为了提高网络流量的预测精度,提出一种基于遗传算法(genetic algorithm, GA)优化回声状态网络的网络流量非线性预测方法.首先利用回声状态网络对网络流量进行预测;然后利用遗传算法对回声状态网络预测模型中的储备池参数进行优化,提高预测模型的预测精度.通过中国联合网络通信公司辽宁分公司采集的实际网络流量数据进行了仿真验证.与差分自回归滑动平均模型(auto regressive integrated moving average, ARIMA)、Elman神经网络以及最小二乘支持向量机(least square support vector machine, LSSVM)这3种常见预测模型进行了对比,仿真结果表明提出的方法具有更高的预测精度与更小的预测误差,更能刻画网络流量复杂的变化特点.
1137-1145
计算机研究与发展杂志并行计算

系统噪音影响的量化分析

摘要:尽管系统噪音对单个进程的影响有限,但对于大规模并行程序性能的影响不容忽视.提出一种基于并行程序计算-通信特征的噪音影响定量评估方法FWQ-MPI,并给出噪音影响的4个量化指标.选取求解稀疏线性代数方程组的3种迭代方法作为研究对象,抽取迭代方法的计算、同步通信特征形成微测试程序;在实际系统上的测试数据明确了系统噪音对并行程序性能的影响机理,并得到系统噪音对并行程序性能影响的若干规律:1)BSP并行程序运行过程中,系统噪音量比例不大,约为2%~6%;2)但系统噪音对BSP并行程序的性能有着较大的影响(当并行规模在1024,2048,4096时,噪音影响比例约为30%~70%);3)其影响随着并行程序规模的扩大而增加,随着2次同步通信间隔内计算量的增加而降低;4)系统噪音的影响主要体现在BSP并行程序的“实际计算通信时间比”要远小于“理想计算通信时间比”.
1146-1152