计算机研究与发展杂志-2014年第09期-学术点评

计算机研究与发展 2014年第09期杂志文档列表

计算机研究与发展杂志专题：深度学习

前言

摘要：深度学习是机器学习研究中的一个新的领域，其核心思想在于模拟人脑的层级抽象结构，通过无监督的方式分析大规模数据，发掘大数据中蕴藏的有价值信息．深度学习应大数据而生，给大数据提供了一个深度思考的大脑．深度学习是一种研究信息的最佳表示及其获取方法的技术，在神经网络或信念网络的情况下是对基于深层结构或网络表示的输入输出间映射进行机器学习的过程．

1889-1890

基于卷积神经网络的正则化方法

摘要：正则化方法是逆问题求解中经常使用的方法.准确的正则化模型在逆问题求解中具有重要作用.对于不同类型的图像和图像的不同区域,正则化方法的能量约束形式应当不同,但传统的L1,L2正则化方法均基于单一先验假设,对所有图像使用同一能量约束形式.针对传统正则化模型中单一先验假设的缺陷,提出了基于卷积神经网络的正则化方法,并将其应用于图像复原问题.该方法的创新之处在于将图像复原看作一个分类问题,利用卷积神经网络对图像子块的特征进行提取和分类,然后针对不同特征区域采用不同的先验形式进行正则化约束,使正则化方法不再局限于单一的先验假设.实验表明基于卷积神经网络的正则化方法的图像复原结果优于传统的单一先验假设模型.

1891-1900

一种具有O（1/T）收敛速率的稀疏随机算法

摘要：随机梯度下降（stochastic gradient descent,SGD）是一种求解大规模优化问题的简单高效方法,近期的研究表明,在求解强凸优化问题时其收敛速率可通过α-suffix平均技巧得到有效的提升.但SGD属于黑箱方法,难以得到正则化优化问题所期望的实际结构效果.另一方面,COMID（composite objective mirror descent）是一种能保证L1正则化结构的稀疏随机算法,但对于强凸优化问题其收敛速率仅为O（logT/T）.主要考虑“L1＋Hinge”优化问题,首先引入L2强凸项将其转化为强凸优化问题,进而将COMID算法和α-suffix平均技巧结合得到L1MD-α算法.证明了L1MD-α具有O（1/T）的收敛速率,并且获得了比COMID更好的稀疏性.大规模数据库上的实验验证了理论分析的正确性和所提算法的有效性.

1901-1910

基于DBN模型的遥感图像分类

摘要：遥感图像分类是地理信息系统（geographic information system,GIS）的关键技术,对城市规划与管理起到十分重要的作用.近年来,深度学习成为机器学习领域的一个新兴研究方向.深度学习采用模拟人脑多层结构的方式,对数据从低层到高层渐进地进行特征提取,从而发掘数据在时间与空间上的规律,进而提高分类的准确性.深度信念网络（deep belief network,DBN）是一种得到广泛研究与应用的深度学习模型,它结合了无监督学习和有监督学习的优点,对高维数据具有较好的分类能力.提出一种基于DBN模型的遥感图像分类方法,并利用RADARSAT-2卫星6d的极化合成孔径雷达（synthetic aperture radar,SAR）图像进行了验证.实验表明,与支持向量机（SVM）及传统的神经网络（NN）方法相比,基于DBN模型的方法可以取得更好的分类效果.

1911-1918

融合显著信息的层次特征学习图像分类

摘要：高效的图像特征表示是计算机视觉的基础.基于图像的视觉显著性机制及深度学习模型的思想,提出一种融合图像显著性的层次稀疏特征表示用于图像分类.这种层次特征学习每一层都由3个部分组成：稀疏编码、显著性最大值汇聚（saliency max pooling）和对比度归一化.通过在图像层次稀疏表示中引入图像显著信息,加强了图像特征的语义信息,得到图像显著特征表示.相比于手工指定特征,该模型采用无监督数据驱动的方式直接从图像中学习到有效的图像特征描述.最后采用支持向量机（support vector machine,SVM）分类器进行监督学习,实现对图像进行分类.在2个常用的标准图像数据集（Caltech 101和Caltech 256）上进行的实验结果表明,结合图像显著性信息的层次特征表示,相比于基于局部特征的单层稀疏表示在分类性能上有了显著提升.

1919-1928

缺陷检测的稀疏表示模型及应用

摘要：基于缺陷检测应用中图像的稀疏特性,提出了缺陷图像的稀疏表示模型以及基于稀疏性的缺陷分解算法.在该模型中,缺陷图像表示为图像背景、缺陷目标和噪声3种成分的叠加,并且图像背景和缺陷目标可以分别由对应的冗余字典稀疏表示;然后借鉴盲源分离原理和块协调松弛方法,实现缺陷目标成分的有效分解;最后,在钢轨表面擦伤检测应用中验证了该算法的性能.

1929-1935

基于RNN-RBM语言模型的语音识别研究

摘要：近年来深度学习兴起,其在语言模型领域有着不错的成效,如受限玻尔兹曼机（restricted Boltzmann machine,RBM）语言模型等.不同于N-gram语言模型,这些根植于神经网络的语言模型可以将词序列映射到连续空间来评估下一词出现的概率,以解决数据稀疏的问题.此外,也有学者使用递归神经网络来建构语言模型,期望由递归的方式充分利用所有上文信息来预测下一词,进而有效处理长距离语言约束.根据递归受限玻尔兹曼机神经网络（recurrent neural network-restricted Boltzmann machine,RNN-RBM）的基础来捕捉长距离信息;另外,也探讨了根据语言中语句的特性来动态地调整语言模型.实验结果显示,使用RNN-RBM语言模型对于大词汇连续语音识别的效能有相当程度的提升.

1936-1944

基于深度学习的作曲家分类问题

摘要：在音乐信息检索领域,作曲家分类是一个十分重要的问题,这一问题的目标是通过音频数据来识别相应的作曲家信息.传统的分类算法都是通过提取复杂的特征来进行分类的,而深层神经网络在特征学习上具有比较强的能力,因此提出用深层神经网络来解决这一问题.为了结合不同深层神经网络模型的优点,设计了一种混合模型,该模型基于深度置信网络（deep belief network,DBN）和级联去噪自编码器（stacked denoising autoencoder,SDA）,可以较好地解决作曲家分类问题.实验表明,该模型取得了76.26%的正确率,这一结果比单纯用某一种模型搭建的深层神经网络以及支持向量机要好.和图像数据类似,人脑在提取音乐特征也是分层的,每一层对信号的处理不一样,因此混合模型在解决作曲家分类问题上具有一定的优势.

1945-1954

计算机研究与发展杂志体系结构

提升稀疏目录缓存一致性系统性能的方法

摘要：稀疏目录技术在缓存一致性非一致存储访问（cache coherent non-uniform memory access,ccNUMA）系统中有广泛应用.但是,稀疏目录技术的一个主要缺陷在于目录项替换在目录热点存在的情况下会严重降低系统的性能.针对此问题,研究如何提升稀疏目录性能.首先,从定性和定量的角度对主流的稀疏目录替换算法进行了分析,并且发现最为原始的最久未使用（least-recent-used,LRU）算法的性能实际上要优于一些近期提出的目录替换算法,如最少共享者（least-sharer-count,LSC）算法.其次,将victim cache的思想应用到稀疏目录上,提出了victim目录（victim directory）,该技术在主稀疏目录模块上加入了一个小的全相联二级目录存储.最后,提出了选择性victim目录（selective victim directory）技术,使得victim目录选择性地仅存储有用的目录项,从而进一步减少了目录替换的数量.选择性victim目录通过向所有节点的cache发出探查消息（probe messages）,从而选择性地存储较为有用的目录项.实验证明,选择性victim目录取得了比简单victim目录更好的性能;而且在仅增加了1KB左右的硬件开销的代价下,选择性victim目录节省了35.7%的程序运行时间.

1955-1970

一种面向通信特征的3D NoC体系结构设计

摘要：三维集成电路（three dimensional integrated circuit,3DIC）和片上网络（network on chip,NoC）是集成电路设计发展的两个趋势.将两者结合的三维片上网络（three dimensional networks on chip,3DNoC）是当前研究的热点之一.针对现有3DNoC的研究没有充分关注硅片内与硅片间的异构通信特征.提出了面向通信特征的硅片间单跳步（single hop inter dies,SHID）体系结构,该结构采用异构拓扑结构和硅片间扩展路由器（express inter dies router,EIDR）.通过实验数据的分析表明,与3DMesh和NoC-Bus这两种已有的3DNoC结构相比,SHID结构有以下特点：1）延迟较低,4层堆叠时比3D-Mesh低15.1%,比NoC-Bus低11.5%;2）功耗与NoC-Bus相当,比3D-Mesh低10%左右;3）吞吐率随堆叠层数增加下降缓慢,16层堆叠时吞吐率比3D-Mesh高66.98%,比NoC-Bus高314.49%.SHID体系结构同时具备性能和可扩展性的优势,是未来3DNoC体系结构良好设计选择.

1971-1979

研发动态

摘要：IBM公司的研究人员了新一代＂神经突触计算机芯片＂.这种芯片基于一种被称为＂认知计算系统＂的全新架构,能够模拟人脑认知和活动能力;并能同时处理大量数据,对来自多个不同渠道的信息作出响应,包括自动驾驶汽车、人工智能以及便携设备在内多个领域都或将因此发生革命性的变革.

1979-1979

基于定制协处理器的基因重测序加速技术研究

摘要：自2008年1月高通量测序技术应用以来,测序的通量和成本都在不断下降.然而基因数据的爆发式增长速度已经超过了摩尔定律,对海量数据的计算处理能力成为制约基因测序应用推广的瓶颈.以基于Hash索引的重测序算法为目标,对计算和访存行为进行分析,从而提出了一个现场可编程门阵列（field programmable gate array,FPGA）作为协处理器的架构,并在Convey公司的HC-1ex平台上进行了设计与实现.其基本处理单元内部采用全流水的设计及FIFO隔离计算模块和访存模块,可以完整执行重测序算法的核心流程.通过将基本处理单元和访存端口的一对一绑定,在4块Xilinx Virtex-6LX760上实现了64路并行处理流程,总平均读内存带宽可达22.59GBps.与8核Intel Xeon处理器相比,可以提升28.5倍的性能.

1980-1992

基于虚通道故障粒度划分的3D NoC容错路由器设计

摘要：深亚微米工艺下,路由器受制于制造缺陷及运行时的脆弱性,易发生虚通道（virtual channel,VC）永久性故障,从而引起通信故障,影响系统功能和性能.为了能够有效地容忍虚通道故障、保证系统性能及充分利用可用资源,将虚通道故障类型细分为粗粒度故障和细粒度故障,提出SVS（single VC sharing）路由器架构,通过将路由器端口两两分组,组内端口间实现单虚通道共享.当发生虚通道粗粒度故障时,使用组内相邻端口共享虚通道容错.当发生细粒度故障时,根据Slot State Table信息配置虚通道读/写指针的值,从而跳过故障Buffer槽实现容错.在无粗粒度故障情况下,共享虚通道还可用于负载平衡及容忍路由计算模块故障.实验结果表明：较其他已有的虚通道路由器,SVS路由器在3种不同的故障情况下均较大地降低了延时,提高了吞吐量.这表明SVS路由器可有效提高系统可靠性,保证了系统性能,充分利用了可用资源.

1993-2002

BTB索引散列算法的研究与设计

摘要：分支误预测是影响高性能处理器性能进一步提升的一个主要因素.现代处理器采用分支目标缓存（branch target buffer,BTB）预测分支指令的目标地址,BTB的预测精度受限于其命中率.由于程序中分支指令的分布并不均匀,传统的BTB索引方式无法充分利用BTB资源,从而造成不必要的冲突缺失,影响分支目标地址的预测精度,采用散列索引方式优化访问映射关系是有效解决方法之一.当前大量文献研究了cache的访问方式,但对BTB的散列索引算法的专门探讨则显不足.为了消除分支指令的分布空洞,离散分支指令和BTB条目的固有映射关系,设计了用于BTB索引的XOR散列算法和优化的bit-select索引算法,使用概率方法对BTB单组最大映射数期望的上界作了估计,并对这两种散列索引算法的效果进行了模拟评估.实验结果表明,散列映射方式能够较好地避免BTB冲突缺失造成的预测失败,XOR散列算法的离散效果更好.

2003-2011

基于连续缓存和二级缓存的DFTL改进算法

摘要：DFTL（demand-based FTL）是一种根据负载访问特点动态加载映射项到缓存中的知名FTL（flash translation layer）算法,但是它没有考虑到请求的空间局部性,而且缓存中的一个映射项剔除就可能会导致翻译页的更新,缓存中映射项的频繁剔除又会导致额外的擦除操作.在DFTL的基础上,提出了SDFTL（sequential/second cache DFTL）算法.SDFTL新设置连续缓存和二级缓存,连续缓存通过预取映射信息,利用请求的空间局部性,提高了FTL对连续负载的处理性能;二级缓存通过暂存从一级缓存中剔除的、发生更新的映射项,并采取批量更新策略回写到闪存,减少了闪存的翻译页写回次数和擦除次数.利用实际负载做的实验结果显示,SDFTL相比DFTL缓存命中率平均提高41.57%,擦除次数平均减少23.08%,响应时间平均减少17.74%.

2012-2021

一种将测试集嵌入到Test-per-Clock位流中的方法

摘要：集成电路测试方案的关键在于测试向量产生器的设计.传统的测试方法在测试向量生成、测试应用的过程中,没有充分利用测试数据位流来构建测试向量,从而造成了测试时间和存储开销的增加.为了减少测试成本,提出了一种基于test-per-clock模式的内建自测试方法.通过对线性移位测试结构的分析,提出了一种递进式的反复测试生成方法：顺序求解输入位流,逆向精简,多次求解以获得更优值,最终将测试集以较小的代价嵌入到test-per-clock位流中.在测试应用时,只需存储求解后的最小输入流,通过控制线性移位的首位从而生成所需的测试集.实验结果表明,在达到故障覆盖率要求的前提下,能显著地减少测试应用时间和存储面积开销.

2022-2029

计算机研究与发展杂志软件技术

一种基于RGPS着色的C-net模型及其应用

摘要：可配置业务流程模型描述面向领域的相似流程模型家簇,这种模型能够通过配置操作获取满足特定用户需求的个性化流程模型.提出一个在角色和目标约束下以流程为中心的可配置业务流程模型,首先对因果网模型（C-net）进行扩展,将该模型中的活动元素增加角色和目标两个约束关系,从而利用RGPS需求元模型框架中对角色（R）、目标（G）、流程（P）、服务（S）之间的约束规则和关联关系去约束业务流程活动之间的执行序列,使得模型有效反映了业务流程活动中的实际行为;然后将活动的输入绑定和输出绑定端口设置配置操作标记,通过对端口配置标记的操作形成个性化流程;最后,给出了模型的形式化定义并分析模型在业务流程配置中的应用,使得能够指导业务流程的配置等管理操作.

2030-2045

自稳定的分布式事务内存模型及算法

摘要：针对具有瞬时故障的分布式系统,综合考虑系统鲁棒性和可扩展性,提出了一种自稳定的分布式事务内存模型（self-stabilizing distributed transactional memory,SSDTM）.首先,利用分层技术和抵押组合理论建立模型框架,并对生成树算法进行了自稳定改进,以克服现有算法只能适应稳定环境的缺点;其次,将数据流技术与自稳定相结合,设计了数据对象操作方法,提高了系统的数据访问局部性;然后,在给出事务服务模型的基础上,提出了基于改进逻辑时钟的SSDTM并发控制算法;最后,结合理论推导,使用4个典型测试用例在SimJava环境下对SSDTM进行了多角度、大规模的分析和性能测试.结果表明,所提算法具有较强的参数鲁棒性和适用性,与其他模型相比,SSDTM具有更高的吞吐量和容错性.

2046-2057

计算机研究与发展杂志

期刊咨询

期刊推荐

文秘服务

计算机研究与发展 2014年第09期杂志文档列表

计算机研究与发展杂志

期刊咨询

期刊推荐

文秘服务

计算机研究与发展 2014年第09期杂志 文档列表

计算机研究与发展 2014年第09期杂志文档列表