发表咨询:400-808-1731
订阅咨询:400-808-1751
北大期刊
影响因子 0.51
人气 23749
北大期刊
影响因子 0.94
人气 20397
部级期刊
影响因子 1.03
人气 13569
北大期刊
影响因子 3.18
人气 11698
统计源期刊
影响因子 0.55
人气 11096
北大期刊
影响因子 0.79
人气 9750
省级期刊
影响因子 0.41
人气 9519
省级期刊
影响因子 0.57
人气 9490
省级期刊
影响因子 0.15
人气 9358
统计源期刊
影响因子 0.35
人气 8472
摘要:介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18gm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W.龙芯2号单精度峰值浮点运算速度为20亿a/秒,双精度浮点运算速度为10亿a/秒,SPECCPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到PentiumⅢ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求.
摘要:功能部件是处理器中进行指令运算的核心单元,它的算法及其实现直接影响到处理器的总体性能.介绍了龙芯2号处理器的功能部件,探讨了从算法到物理设计等不同层次的功能部件设计方法.龙芯2号功能部件分为两个定点ALU和两个浮点ALU实现,除实现完整的MIPS定、浮点指令集外,还实现了龙芯2号类MMX自定义多媒体指令集以及定点操作在浮点部件(FPU)中的数据通路复用.龙芯2号浮点部件遵照IEEE754和MIPS相关标准,浮点加法4拍完成,浮点乘法5拍完成,浮点除法4~17拍完成.物理设计支持0.18μm工艺下主频500MHz的标准单元实现,浮点单精度峰值性能达到2GFLOPS.双精度峰值性能达到1GFLOPS.
摘要:开发龙芯2号这样的高性能通用处理器是一项极其复杂的艰巨任务.龙芯2号处理器的设计规模和复杂度比龙芯1号增加了许多倍,如何保证设计的正确性是一个重大挑战.简单的系统级测试已经不能满足设计的需要,这就要求采用多种有效的、先进的验证方法和工具帮助设计者尽可能早的发现和改正设计错误.主要介绍了在龙芯2号处理器的设计开发过程中采用的功能验证流程和主要验证方法.模拟仿真是主要的验证手段,新的形式化验证方法也应用到了验证流程当中.
摘要:系统软件作为处理器和应用程序之间的接口,对于充分利用处理器的特性来维护处理器与应用程序的稳定性和提高应用程序的性能起着极其重要的作用.描述了在Linux内核中解决龙芯2号处理器的Cache别名问题的方法以及通过增加页的大小、软TLB和FAST_TLB_REFILL的方法减小TLB失效的性能损失,还有Uncache Accelerate对媒体播放软件的加速.实验结果表明,在系统软件中增加这些方法的支持,对系统的稳定性和性能都有较大的好处.
摘要:X处理器是我国自主设计的基于EPIC思想的高性能通用微处理器.介绍了8级流水线和OLSM执行模型,以很少的硬件代价克服了基本EPIC模型的局限性.设计了一种多分支预测结构,支持多条分支指令的并行执行,并通过判定执行减少分支指令的数目;设计了两级cache存储器,提出DTD低功耗设计方法,并通过前瞻执行隐藏访存的延迟.最后,展望了高性能通用微处理器的发展趋势.
摘要:YHFT—DSP/700是2004年研制成功的“银河飞腾”系列超长指令字结构高性能浮点DSP,其主频达238MHz,峰值性能为每秒14亿次浮点运算和19亿条指令,介绍了YHFT—DSP/700的体系结构、设计方法和编译器等关键技术;介绍了同时多线程YHFT—DSP/SMT的体系结构,它可以将DSP的性能提高40%;分析了国际主流高性能DSP的体系结构和发展趋势.
摘要:提出一种采用组合电路实现解压缩电路的压缩方法,只需少量的输入管脚,可以驱动大量的内部扫描链.该方法利用确定性测试向量中存在的大量的不确定位(X位),采用对测试向量进行切片划分和兼容赋值的思想,通过分析扫描切片之间的兼容关系来寻找所需的外部扫描输入管脚的最小个数.实验结果表明,它能有效地降低测试数据量.此外,通过应用所提出的解压缩电路,扫描链的条数不再受到自动测试仪的限制,因此能充分发挥多扫描链设计降低测试应用时间的优点.
摘要:由于现有非结构化P2P网络路由协议均在应用层实现,缺乏缓存机制和对Internet底层通信子网路由资源的利用,存在可扩展性差和效率不高的问题.在基于层域结构的RLP2P网络环境下,将路由空间分为域间和域内两层,结合泛洪和生成树搜索方式的优点,提出并实现了一种Multilayer LightGossip分级搜索算法和域间基于正六边形的蜂窝路由探测策略,把网络中的搜索消息分为域间和城内扩散两类分级扩散,以一定的消息冗余保持网络的稳健性和搜索的有效性,使定位某种服务的工作量和查询范围从网络中的所有结点数降到域内的节点数.运用预测评估方法对级间路由消息进行预分组。使消息能够自适应地沿着一条在时间度量上距离尽量短的路径前进.实验结果表明,MultilayerLightGossip算法大幅提高搜索效率和减少冗余消息,在广域环境下具有良好的搜索性能和扩展性。
摘要:如何保证在覆盖足够的监测区域的同时延长网络的寿命是无线传感器网络所面临的最重要问题之一,广泛采用的策略是选出工作节点以满足应用期望的服务质量(即覆盖率),同时关闭其他冗余节点.分析了随机部署网络在已知监测区域大小和节点感知范围情况下,无需节点位置信息,应用期望的服务质量与所需的工作节点数量之间的数学关系.在此基础上提出了一种高效节能、与位置无关的传感器网络服务质量协议(ELIQoS),协议根据节点能量大小,选取最少的工作节点满足应用期望的服务质量.实验结果表明,ELIQoS协议不仅可以有效地提供满足应用期望的服务质量,而且可以减少能量消耗,实现能耗负载均衡.
摘要:Internet物理特征量短期及长期预测是一个重要课题,为此。首先定义了加权Internet网络.然后形式化定义表征加权Internet的物理参量——加权Internet访问直径,接下来根据海量数据变化特点,提出了基于Logistic模型的、以正余弦函数模拟振荡变化的数学模型,使用浮点型遗传算法分别进行拟舍实验,并通过实验结果对上述模型进行了评价和选优.由于加权访问直径演化极为复杂,传统的一维数学模型在长期预测中已不适用.因此,在长期预测方面,首先计算得到加权Internet访问直径的关联维数,证实其演化过程为混沌现象,存在奇异吸引子.最后根据关联维数及奇异吸引子相近空间混沌轨道运动特性,提出了基于四维微分方程组的加权访问直径长期预测的形式模型.
摘要:高性能核心交换设备多播调度受到越来越多的关注.交叉开关结构下的多播调度方案或者性能较差,或者过于复杂,难于应用在高速交换场合.为此,提出一种面向多播的多输入队列缓冲交叉开关体系结构.将多播调度分解为信元分派、输入调度、输出调度3个可分布式并行执行的子问题,并设计了相应的调度算法,降低了算法复杂性.实验结果表明,交叉点缓冲区容量与输入队列数量对多播性能都具有很大的影响.在突发流量到达下,与单多播输入队列的体系结构相比,无论是采用O(1)复杂度的HA—RR—RR还是复杂度更高的调度算法,均能显著提高系统吞吐性能.
摘要:PageRank是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性.但由于它对每条出链赋予相同的权值,忽略了网页与主题的相关性,容易造成主题漂移现象.在分析了几种PageRank算法基础上,提出了一种新的基于主题分块的PageRank算法.该算法按照网页结构对网页进行分块,依照各块与主题的相关性大小对块中的链接传递不同的PageRank值,并能根据已访问的链接对块进行相关性反馈.实验表明。所提出的算法能较好地改进搜索结果的精确度.
摘要:为提高委托过程的安全性,对现有委托模型进行了扩展,提出了一个更加安全的基于属性的扩展委托模型(ABDMA).ABDMA中的委托约束不但包括委托先决条件(CR),还包含委托属性表达式(DAE).受托者必须同时满足委托先决条件和委托属性表达式才能被委托权限或角色.为保证委托过程的灵活性,ABDMA将委托属性表达式进一步分为永久和临时委托属性表达式,使得委托者可临时而不是永久地将某些高级权限委托给不具备资格的用户.ABDMA提高了委托过程的安全性,减轻了委托者和系统管理员的负担.