发表咨询:400-808-1731
订阅咨询:400-808-1751
北大期刊
影响因子 0.65
人气 24517
省级期刊
影响因子 0.67
人气 24269
北大期刊
影响因子 0.51
人气 23704
北大期刊
影响因子 0.99
人气 23200
北大期刊
影响因子 0.94
人气 20375
部级期刊
影响因子 0.98
人气 18644
北大期刊
影响因子 0.95
人气 18015
部级期刊
影响因子 1.03
人气 13561
部级期刊
影响因子 0.38
人气 12781
省级期刊
影响因子 0.16
人气 12277
摘要:高效能是处理器设计的重要指标。由于指令部件在处理器芯片中开始占据越来越多的芯片面积,消耗了较多的芯片功耗,研究人员提出了零级指令缓存设计。零级指令缓存容量小、访问耗能低,与流水线紧密耦合、取指命中时可以门控流水线部分逻辑。因此,零级指令缓存可以有效提高流水线指令部件的能效比。综述了现有的零级指令缓存的不同结构、各结构的发展与应用情况;展望了零级指令缓存设计的未来研究思路。
摘要:随着基于Hadoop平台的大数据技术的不断发展和实践的深入,Hadoop YARN资源调度策略在异构集群中的不适用性越发明显。一方面,节点资源无法动态分配,导致优势节点的计算资源浪费、系统性能没有充分发挥;另一方面,现有的静态资源分配策略未考虑作业在不同执行阶段的差异,易产生大量资源碎片。基于以上问题,提出了一种负载自适应调度策略。监控集群执行节点和提交作业的性能信息,利用实时监控数据建模、量化节点的综合计算能力,结合节点和作业的性能信息在调度器上启动基于相似度评估的动态资源调度方案。优化后的系统能够有效识别集群节点的执行能力差异,并根据作业任务的实时需求进行细粒度的动态资源调度,在完善YARN现有调度语义的同时,可作为子级资源调度方案架构在上层调度器下。在Hadoop 2.0上实现并测试该策略,实验结果表明,作业的自适应资源调度策略显著提高了资源利用率,集群并发度提高了2到3倍,时间性能提升了近10%。
摘要:图聚类是指把图中相对连接紧密的顶点及其相关的边分组形成一个子图的过程,在包括机器学习、数据挖掘、模式识别、图像分析及生物信息等领域有着广泛应用。但是,随着大数据时代的到来,图数据海量增长。面对广泛的大规模图计算需求,由于图结构本身的不规则性,单机算法运行效率低下,用传统的并行计算方法进行图计算难以获得高性能。使用线性代数的方法在Combinatorial BLAS上实现了同辈压力(Peer Pressure)图聚类的分布式算法,首先将该图聚类的算法转换为对稀疏矩阵的运算,从而结构化表示图的不规则数据结构及接入模式,然后基于MPI编程模型将其并行实现。实验结果表明,在并行处理规模达到43亿的由稀疏矩阵表示的超大规模图时,基于线性代数表示的同辈压力图聚类算法在曙光超级计算机上取得了较高的并行性能及良好的可扩展性,在64个核上获得了40.1的并行加速。
摘要:硅通孔TSV发生开路故障和泄漏故障会降低三维集成电路的可靠性和良率,因此对绑定前的TSV测试尤为重要。现有CAF-WAS测试方法对泄漏故障的测试优于其他方法(环形振荡器等),缺点是该方法不能测试开路故障。伪泄漏路径思想的提出,解决了现有CAF-WAS方法不能对开路故障进行测试的问题。另外,重新设计了等待时间产生电路,降低了测试时间开销。HSPICE仿真结果显示,该方法能准确预测开路和泄漏故障的范围,测试时间开销仅为现有同类方法的25%。
摘要:迭代编译技术是一种编译优化技术,目前学术研究已经证明将迭代编译技术运用于程序优化能够显著提高程序性能。但是,因为迭代编译需要多次编译运行程序,整个迭代过程耗时巨大。为了运用当前普遍存在的多核计算资源,加快迭代编译过程,对当前新提出的迭代编译框架OpenTuner进行修改,将迭代编译过程中的评估阶段改为并行执行。同时,探索迭代编译评估阶段并行化对优化效果的影响,并对此做出分析。
摘要:在现代微处理器中,指令缓存的Tag读取、比较消耗了指令缓存较大比例的能耗。提出一种基于推断的低能耗指令缓存:不对称指令缓存。根据跳转指令比例低的特点,在该结构中区别处理跳转指令和顺序指令,使用和数据不完全对应的简化标记管理位。该结构采用了命中推断和变长指令取指两种创新技术,其中基于命中推断技术解决了指令缓存命中时Tag比较过多的问题;使用变长指令取指技术提高了顺序指令块的命中率。实验结果表明,对于选取的SPEC2006测试程序,不对称指令缓存结构较常规L1指令Cache取指能耗下降了40%~60%,比无标记指令缓存结构TH IC能耗降低了9%;取指ED2P方面,较常规L1指令Cache优化约50%,比TH IC结构优化约17%。
摘要:在ARMv8 64位多核处理器上基于OpenBLAS实现了四精度三角矩阵求解(QTRSM)。基于两种数据格式分别实现了QTRSM,第一种实现利用GCC编译器对long double数据类型的支持来实现QTRSM,第二种实现采用double-double数据格式及其相应的四精度加减法、乘法和除法。以long double数据类型QTRSM为测试基准,就不同矩阵规模下测试结果精度和时间与double-double数据格式QTRSM进行比较。实验结果表明:两者得到近似相同精度的数值结果,但double-double数据格式QTRSM的性能是long double数据类型QTRSM的1.6倍。随着线程数的增加,两种QTRSM实现的加速比接近2.0,具有较好的可扩展性。
摘要:三维芯片(3D-SIC)通过硅通孔TSV技术实现电路的垂直互连,有效提高了系统集成度和整体性能。由于三维芯片测试中,用于测试的引脚数和TSV数目以及测试时功耗的限制都对测试时间有很大的影响,拟提出一种装箱问题思想的测试方案,针对每层只有一个晶片的“单塔”结构和每层有多个晶片的“多塔”结构进行测试调度优化。该优化方案在控制测试引脚数、测试TSV数目与测试功耗的同时,能有效缩短测试时间。实验结果表明,与同类方案相比,在多种限制条件和不同结构中,都有着显著的优化结果。其中“单塔”最高优化45.28%的测试时间,“多塔”最高优化了27.78%的测试时间。
摘要:针对大规模的线性时不变系统,提出了基于重启Lanczos过程的模型降阶方法。首先,通过重启Lanczos过程分别得到原始系统的可控Gram矩阵的近似矩阵及可观Gram矩阵的近似矩阵。然后,根据原始系统的可控Gram矩阵及可观Gram矩阵所满足的Lyapunov方程构造映射Sylvester方程并求解,对解进行双正交化,得到降阶所需的变换矩阵,从而得到降阶系统。运用此方法对大规模线性时不变系统进行降阶,能够得到具有较高近似精度的稳定的降阶系统。最后,数值算例验证了此方法是行之有效的。
摘要:分层卫星网络路由协议在通信时比单层卫星网络有更好的表现,但是同样有着一些缺点。快照的频繁切换导致计算开销大、链路拥塞和节点失效时处理能力较差。针对LEO/MEO卫星网络的特点,提出了一种新的路由协议。计算相邻卫星间的实际通信开销,和预估可选卫星到目的卫星间的通信开销,在保证一定链路利用率和低延时的情况下,选择一条最优路径。当链路切换或节点失效时,缩小路径搜索区域,无需重新计算源卫星节点到目的卫星节点路径,只更新部分失效节点,减少计算开销。通过仿真发现,该算法在路径建立以及链路拥塞等方面具有良好的性能。
摘要:社交网络作为一种交往方式,已经深入人心。其用户数据在这个大数据时代蕴藏着大量的价值。随着Twitter API的开放,社交网络Twitter俨然成为一个深受欢迎的研究对象,而用户影响力更是其中的研究热点。PageRank算法计算用户影响力已经由来已久,但是它太依赖于用户之间的关注关系,排名不具备时效性。引入用户活跃度的改进PageRank算法,具备一定的时效性,但是不具有足够的说服力和准确性。研究了一种新的基于时间分布用户活跃度的ABP算法,并为不同时段的活跃度加以相应的时效权重因子。最后,以Twitter为研究对象,结合社交关系网,通过实例分析说明ABP算法更具时效性和说服力,可以比较准确地提高活跃用户的排名,降低非活跃用户排名。
摘要:在VANET中,为了保证安全数据的准确性和实时性,和安全相关的数据通常需要较高的优先级并且优先传输,现有的VANET数据转发算法不能满足这一点。为了满足VANET中安全数据的优先传输需求,提出了一种数据优先级模型,并基于数据优先级和车辆密度提出了一种安全数据转发算法。数据优先级模型可以给不同状态的数据分配相应的优先级;基于数据优先级和车辆密度的数据转发算法PDT动态分配计数器阈值和碰撞窗口,动态分配碰撞窗口可以确保数据的传输次序,而动态设定计数器阈值既能够保证数据的可靠传输又能有效地抑制广播风暴。仿真结果表明,与传统的counter-based数据转发算法和slotted-p数据转发算法相比,在数据吞吐量、传输时延和抑制广播风暴方面,PDT算法都有显著的性能提升。
摘要:提出了一种Tetrolet变换和奇异值分解(SVD)相结合的图像盲检测稳健数字水印算法。该算法先对二值水印图像进行双因子混沌加密预处理;对原始载体图像进行二级Tetrolet变换,并将二层低频子带系数进行分块SVD分解;最后将加密的水印信息量化嵌入SVD最大系数中。水印检测时,无需原始载体图像和原始水印图像的参与,实现水印信息盲提取,提高数字水印系统的实用性。仿真实验结果表明,在保证水印安全性和不可感知性的基础上,该算法对常规图像处理、几何攻击等均具有较好的稳健性。
摘要:核心-边缘结构是复杂网络中一种重要且常见的簇团结构,相关研究一直较少。为了研究复杂网络核心-边缘结构的相关特性,分析了随机块模型的结构,并在此基础上提出了一种具有无标度特性的核心-边缘结构网络演化模型。通过理论和数值分析,验证了所生成的网络具有较好的无标度特性和核心-边缘结构,且其结构的紧密程度可调,为进一步研究复杂网络核心-边缘结构的相关特性提供了基础。
摘要:为提高无线传感器网络安全评估准确性、灵敏性,将安全态势感知的概念引入无线传感器网络安全研究,采用集对分析理论对无线传感器网络安全态势进行评估,用安全态势值判断无线传感器网络受到安全威胁的强弱。实验中使用KDD Cup 1999数据集模拟无线传感器网络攻击,通过改变网络中受攻击节点数量模拟不同强度的网络攻击,并在11种不同的攻击强度下分析安全态势值变化情况。实验结果表明,该模型可以提高无线传感器网络安全评估的准确性,与传统基于安全熵法的评估模型相比,本文提出的方法对中低强度的攻击灵敏度更高,攻击效果区分更加明显,并可根据安全态势值对网络安全态势进行分级。
摘要:现有的2D图像质量评价方法并不能很好地应用于立体图像质量评价中。为了有效评价不同失真立体图像的质量,提出了一种基于视差图和复数轮廓波变换的无参考图像质量评价方法。首先提取了能够反映3D信息的视差图,然后对左右失真图像和视差图进行复数轮廓波变换,计算能量和能量差特征,最后通过支持向量回归SVR模型训练学习,预测图像质量分数。实验结果表明,此方法优于当前文献报道的立体图像质量评价方法。
摘要:针对高维输入数据维数较大时可能存在奇异值问题,同时为提高算法的运算效率以及算法的鲁棒性,提出了一种基于L1范数的分块二维局部保持投影算法B2DLPP-L1。传统的局部保持投影算法为避免出现奇异值问题,首先运用主成分分析算法将高维数据投影到子空间中,然而这种方式将会造成高维数据中部分有效信息的流失,B2DLPP-L1算法选择将二维数据直接作为输入数据,避免运用向量形式的输入数据时可能造成的数据流失;同时该算法对二维输入数据进行分块处理,将分块后的数据块作为新的输入数据,之后运用基于L1范数的二维局部保持投影算法对其进行降维。理论上,B2DLPP-L1算法能够较好地对数据进行降维,不仅能够保持高维数据中的有效信息,降低计算复杂程度,提高算法的运行效率,同时还能够克服存在外点情况下分类准确率较低问题,提高算法的鲁棒性。通过选择不同的人脸数据库进行实验,实验结果表明,在存在外点的情况下,运用最近邻分类器时能够取得更高的分类准确率,同时所需的分类时间有所减少。
摘要:基于视觉的目标跟踪是模式识别、计算机视觉、机器学习等多个学科的交叉研究课题,在视频监控、视频压缩编码、视频检索、智能交通等领域有着十分广泛的应用。为了使国内外同行对基于外观模型的目标跟踪方法有一个较为全面的了解,对其进行了系统总结。在介绍跟踪算法原理的基础上,重点阐述了两大类基于外观模型的目标跟踪方法:产生式方法和判别式方法,深入讨论了其中的典型算法和研究成果,并对这些算法在公开数据集上的测试结果进行了分析比较,最后展望了该领域未来的发展方向。