发表咨询:400-808-1731
订阅咨询:400-808-1751
北大期刊
影响因子 0.51
人气 23554
北大期刊
影响因子 0.94
人气 20241
部级期刊
影响因子 1.03
人气 13495
北大期刊
影响因子 3.18
人气 11591
统计源期刊
影响因子 0.55
人气 10972
北大期刊
影响因子 0.79
人气 9677
省级期刊
影响因子 0.41
人气 9473
省级期刊
影响因子 0.57
人气 9301
省级期刊
影响因子 0.15
人气 9100
统计源期刊
影响因子 0.47
人气 8341
摘要:国家自然科学基金委员会自2012年设立优秀青年科学基金(“优青基金”)项目以来,至今已资助6批在基础研究方面崭露头角的青年学者自主选题开展创新研究.为了促进计算机科学技术领域的研究、开发、教育和前沿知识的传播,《计算机研究与发展》自2015年以来刊出了“优青专题”系列,通过集中介绍这些优秀青年学者(及其合作者)的研究成果或学术见解,使读者了解这一层次研究人员的研究状况及相关方向的发展趋势.该系列并未专注于某个特定方向的具体研究细节。
摘要:基于内容的图像检索(content-based image retrieval,CBIR)是一项极具挑战的计算机视觉任务.其目标是从数据库图像中找到和查询图像包含相同实例的图像.一个典型的图像检索流程包括2步:设法从图像中提取一个合适的图像的表示向量和对这些表示向量进行最近邻搜索以找到相似的图像.其中,决定图像检索算法性能的关键在于其提取的图像表示的好坏.图像检索中使用的图像表示经历了基于手工特征和基于深度特征两大时期,每个时期又有全局特征和局部特征2个阶段.由于手工特征的表示能力有限,近年来图像检索的研究主要集中在如何利用深度特征.将以提取图像表示的不同思路为线索,回顾无监督图像检索领域的发展历程,介绍该领域的一些代表性算法,并比较这些算法在常用数据集上的性能表现,最后探讨未来的研究方向.
摘要:时序数据中的异常检测指的是在时序上去检测分析数据中异常的特征、趋势或模式.自动化的异常检测方法常会忽略细微的、模糊的、不确定的异常.可视分析通过对数据的可视表达和可视界面,集成用户和数据挖掘的能力.首先总结异常检测的挑战;然后从异常类型(属性、拓扑和混合)和异常检测方法(直接投影法、聚类方法和机器学习方法)2个角度对面向时序数据异常检测的可视分析工作进行分类和总结;最后阐述了未来的研究方向.
摘要:区块链是一项具有颠覆许多传统行业的潜力的新兴技术.自以比特币为代表的区块链1.0诞生以来,区块链技术获得了广泛的关注,积累了大量的用户交易数据.而以以太坊为代表的区块链2.0的诞生,更加丰富了区块链的数据类型.区块链技术的火热,催生了大量基于区块链的技术创新的同时也带来许多新的问题,如用户隐私泄露,非法金融活动等.而区块链数据公开的特性,为研究人员通过分析区块链数据了解和解决相关问题提供了前所未有的机会.因此,总结目前区块链数据存在的研究问题、取得的分析成果、可能的研究趋势以及面临的挑战具有重要意义.为此,全面回顾和总结了当前的区块链数据分析的成果,在介绍区块链技术架构和关键技术的基础上,分析了目前区块链系统中主要的数据类型,总结了目前区块链数据的分析方法,并就实体识别、隐私泄露风险分析、网络画像、网络可视化、市场效应分析、交易模式识别、非法行为检测与分析等7个问题总结了当前区块链数据分析的研究进展.最后针对目前区块链数据分析研究中存在的不足分析和展望了未来的研究方向以及面临的挑战.
摘要:深度神经网络在人工智能的应用中,包括计算机视觉、语音识别、自然语言处理方面,取得了巨大成功.但这些深度神经网络需要巨大的计算开销和内存存储,阻碍了在资源有限环境下的使用,如移动或嵌入式设备端.为解决此问题,在近年来产生大量关于深度神经网络压缩与加速的研究工作.对现有代表性的深度神经网络压缩与加速方法进行回顾与总结,这些方法包括了参数剪枝、参数共享、低秩分解、紧性滤波设计及知识蒸馏.具体地,将概述一些经典深度神经网络模型,详细描述深度神经网络压缩与加速方法,并强调这些方法的特性及优缺点.此外,总结了深度神经网络压缩与加速的评测方法及广泛使用的数据集,同时讨论分析一些代表性方法的性能表现.最后,根据不同任务的需要,讨论了如何选择不同的压缩与加速方法,并对压缩与加速方法未来发展趋势进行展望.
摘要:时序图作为一种带有时间维度的图结构,在图数据的查询处理与挖掘工作中扮演着越来越重要的角色.与传统的静态图不同,时序图的结构会随时间序列发生改变,即时序图的边由时间激活.而且由于时序图上每条边都有记录时间的标签,所以时序图包含的信息量相较于静态图也更为庞大,这使得现有的数据查询处理方法不能很好地应用于时序图中.因此如何解决时序图上的数据查询处理与挖掘问题得到研究者们的关注.对现有的时序图上的查询处理与挖掘方法进行了综述,详细介绍了时序图的应用背景和基本定义,桄理了现有的时序图模型,并从图查询处理方法、图挖掘方法和时序图管理系统3个方面对时序图上现有的工作进行了详细的介绍和分析.最后对时序图上可能的研究方向进行了展望,为相关研究提供参考.
摘要:开放互联网中的学者画像工作是近年来的研究热点问题.学者画像的目标是提取学者各维度的属性信息进行信息挖掘和分析应用.学者画像技术是大型智库实现专家发现、学术影响力评估等功能的关键.在开放互联网中,学者画像面临数据量大、数据噪音和数据冗余等新挑战.这使得传统的用户画像理论、模型和方法无法直接无缝地移植到开放互联网环境下的用户画像系统中.针对这些挑战,对现有学者画像技术进行了总结和分类,为进一步的研究工作提供参考.首先分析了学者画像问题,对学者画像的基础理论--信息抽取方法--进行了总体概述,详细总结了各种可用模型与方法;对实现学者画像的基本任务包括学者信息标注、研究兴趣挖掘和学术影响力预测进行了详细阐述;介绍了学者画像应用实例AMiner系统;对未来重点的研究内容和发展方向进行了探讨和展望.
摘要:数据中心网络流调度技术对数据中心网络的性能具有重要影响.它是指对数据中心应用产生的网络数据流,通过控制和调度这些网络流在数据中心网络中的传输链路、传输优先级、传输速率等,以优化网络流量的传输(包括减少数据流平均完成时间、降低加权的平均完成时间、降低数据流尾部完成时间、最大化满足有传输时限的数据流、提高网络资源利用率等)。最终实现优化用户体验的目的.首先,对数据中心网络流调度问题及其面临的挑战进行简单介绍.流调度的关键挑战在于设计低开销、高效率的调度算法,以及在终端电脑或者网络交换机上实现调度算法.然后,从独立数据流调度方法和网络流组的调度方法进行综述.这2类流调度技术的区别在于应用的环境(如Web搜索和大数据分析)不同.最后,对未来流调度技术的发展方向进行展望,并且提出多个尚未解决、但仍值得研究的问题.
摘要:为了抵抗差分密码攻击,密码算法设计希望使用低差分函数.完全非线性函数(perfect nonlinear function,PN函数)、几乎完全非线性函数(almost perfect nonlinear function,APN函数)和4差分置换(differentially 4-uniform permutition)是最重要的几类低差分函数(low differential uniformity function).总结了近年来在PN函数、APN函数和4差分置换等低差分函数研究方面的主要进展.1)回顾了PN函数与半域等数学对象的联系,梳理了PN函数的已有构造以及伪平面函数的构造;2)分析了APN函数的性质与判定,总结了APN函数的已有构造以及它们之间等价性分析方面的结果;3)对于4差分置换,总结了其已有构造及其等价性分析结果;4)介绍了低差分函数在实际密码算法设计中的应用%)对低差分函数的下一步研究进行了展望.
摘要:随着深度学习在计算机视觉、自然语言处理领域取得的长足进展,现有方法已经能准确理解视觉对象和自然语言的语义,并在此基础上开展跨媒体数据表达与交互研究.近年来,视觉问答(visual question answering,VQA)是跨媒体表达与交互方向上的研究热点问题.视觉问答旨在让计算机理解图像内容后根据自然语言输入的查询进行自动回答.围绕视觉问答问题,从概念、模型、数据集等方面对近年来的研究进展进行综述,同时探讨现有工作存在的不足;最后从方法论、应用和平台等多方面对视觉问答未来的研究方向进行了展望.
摘要:针对标签传播社区发现算法在节点更新顺序及标签传播过程中存在较大随机性而导致划分结果稳定性差的问题,提出一种基于标签传播的两阶段社区发现算法(a two-stage community detection algorithm based on label propagation,LPA-TS),通过参与系数确定节点更新顺序,并在标签传播过程中依据节点间相似性更新节点标签,得到初始社区划分.将社区看作节点,社区间连边数作为边权重,得到社区关系网络.按照参与系数由低到高的顺序合并社区关系网络中的节点,得到最终社区划分结果.算法LPA-TS减少了传统LPA方法在节点更新和标签传播过程的随机性;在第2阶段,将不符合弱社区定义的初始社区与连边最多的相邻社区合并,再按照社区参与系数由低到高的顺序合并初始社区提升社区发现质量。通过与一些经典算法在8个真实网络及不同参数下LFRbenchmark人工网络数据集上的实验比较表明LPA-TS算法表现了良好的稳定性,在NMI、ARI、模块性等方面表现良好.
摘要:推特和新浪微博等社交网络已成为报道公共事件的重要平台,它们为监控事件及其演化提供了宝贵的数据.然而,这些数据包含的非正式词语和碎片化文本使得从中提取描述性的信息具有一定的挑战.另外,从快速生成的大量微博监控事件演化也有一定难度.提出在社交网络中监控事件并对具有相同主题的事件演化进行分析.这既可以在粗粒度水平获得事件的概述,又可以在细粒度水平获得事件的详细信息.通过3个连续的组件实现该任务.1)用结构化的方法从微博检测事件;2)基于事件的隐式语义信息对事件聚类并将聚类获得的簇定义为故事;3)用基于图的方法为每个故事生成故事脉络,故事脉络用包含摘要的有向无环图表示故事内事件的演化.用户体验评估实验表明:提出的方法比现有方法具有更高的准确性和可理解性,并能够帮助用户监控事件及其演化.
摘要:经过几十年的发展,信息检索技术获得了长足的进步和广泛的应用,但当前主流的搜索引擎系统距离真正智能的信息获取系统仍然有较大差距.智能信息获取系统能够对网络大数据的内容进行获取、阅读和理解,对关键语义信息实现存储和检索,并能够依据用户的信息需求进行推理、决策和信息生成.实现这样的系统,迫切需要在检索架构和检索模型上形成根本性的改变和理论突破.近年来,围绕智能信息获取的需求,利用深度学习检索框架展开了系统性研究,在数据表征、数据索引以及检索算法等方向上形成了一系列原创成果,在探索全新的深度学习检索架构上不断迈进.
摘要:信息技术和系统应用的发展对信息存储技术提出了诸多新的要求.一方面,大数据时代对数据存储的规模和处理能力需求越来越高,亟需新型存储系统和技术以提供更高的性能和更好的可扩展性.而随着固态闪存和非易失性内存等存储介质的发展,一些基于固态闪存和非易失性内存的软件系统被设计和提出,这些为新型存储系统的构建与实现带来了新的机遇.另一方面,随着数据中心、云端数据存储服务及人工智能应用的日益广泛,现有的存储技术和系统难以满足上层应用的需求,人们仍在探索采用传统磁盘介质的存储系统的改进方案,以解决海量数据存储系统的高效可靠的架构及构造方法.
摘要:随着云计算和物联网业务的快速发展,如何存储爆发式增长的数据成为存储系统的一个巨大挑战.为解决这一问题,近似存储作为一种解决存储资源紧张的必要手段越来越受到关注,它通过利用某些应用程序固有的容错特性,在输出结果的精度和应用的性能间进行权衡,以在满足用户需求的同时提升性能和能效.因此,如何针对不同的存储与应用的特点,通过近似存储数据解决访问性能低、空间开销大和能耗高等问题,已成为存储系统的研究热点.首先介绍近似存储技术的定义与近似区域的识别技术;接着分别阐述适用于高速缓存、内存和外存3个存储层次的近似存储技术,并分析其优缺点与应用范围;最后总结近似存储的特点,并探讨存储系统中近似存储技术的进一步研究方向.
摘要:大数据时代对大容量磁盘的需求日益增长,而在对现有的磁盘不进行较大改动的前提下,叠瓦式磁记录技术SMR是提高磁盘存储容量的最佳选择.近年来,兴起了一种新的磁记录技术--交错式磁记录技术IMR,它可以获得比SMR更高的存储密度和随机写性能.首先介绍了SMR磁盘的内部叠瓦式结构以及由此带来的数据写放大问题,并对缓解数据写放大问题的数据管理方式、性能特性评测以及基于SMR的上层应用系统方面的研究进展进行了概述;然后对新兴的IMR磁盘内部结构及其数据写放大问题进行了介绍,并对其将来的研究方向做了一定的分析和展望;最后对SMR磁盘和IMR磁盘在存储密度、数据写性能等方面进行了比较分析.当前有很多基于SMR磁盘的上层应用系统,这表明SMR磁盘可以高效地替代传统磁盘来构建大型的存储系统,而IMR磁盘的优势也将使其未来的发展前景可期.
摘要:近年来,研究者们针对持久性内存良好的性能,设计了轻量级的持久性事务内存系统,它通过日志机制保证了事务的原子性和一致性.然而,相比于传统内存,持久性内存的存储单元往往具有更高的写延迟,并且存在有限的耐久性.发现现有的持久性事务内存系统存在日志机制带来过多的写操作问题:一方面,现有系统没有区分出事务中不同类型的写操作,即无论是对内存中已有数据的更新操作还是向事务中新分配区域添加数据的写操作,现有系统都采用相同的日志机制保证它们的一致性;另一方面,现有系统将更新操作的地址和数据等字段完整地持久化到日志中,即使其中大部分数据都可以通过压缩算法减少写入量.这2方面导致了冗余的日志操作,带来了额外的写延迟和写磨损.为了解决上述问题,设计并实现了一种基于微日志的持久性事务内存系统TLPTM,主要提出2个优化技术:1)分配操作感知的日志优化策略(allocation-aware log optimization,AALO),AALO有效地避免了向事务中新分配区域添加数据的写操作产生的日志开销;2)基于压缩算法的日志优化策略(compression-based log optimization,CBLO),CBLO将日志数据压缩后再写入到日志中,减少了日志操作的写开销.测试结果表明:相比于Mnemosyne,提出的日志优化策略AALO将事务性能提高了15%#24/,基于提出的2种优化技术实现的TLPTM将日志的写入总量降低了70%-81%.
摘要:非易失性内存(non-volatile memory,NVM)技术是非常具有应用前景的计算机内存技术,将会对计算机存储层次结构产生极大的影响.NVM具有可字节寻址、可持久存储、低访问延迟等特点,这为DRAM和NVM在统一的主存储空间中的结合提供了巨大的机会.NVM可通过内存总线以及CPU相关指令进行数据访存,这使得在非易失性内存中设计快速的持久存储系统成为可能.现有的键值存储系统将NVM作为块设备使用,未能充分发挥NVM的性能.当硬件支持出现故障(例如高速缓存刷新)时,一些现有的键值存储系统无法保证数据的一致性.提出了一种基于日志结构的非易失性内存键值存储系统TinyKV,该系统利用键值数据负载的特性提出了一个静态并发、缓存友好的Hash表实现方案.TinyKV为每个工作线程维护单独的数据日志,以实现高并发性.此外,TinyKV采用日志结构技术进行内存管理,设计多层级内存分配器,以保证一致性.此外,系统通过减少对NVM的写入与缓存刷新指令,以降低写入延迟.实验显示:与传统的键值存储系统相比,TinyKV具有良好的呑吐性能与扩展能力.