发表咨询:400-808-1731
订阅咨询:400-808-1751
北大期刊
影响因子 0.65
人气 24539
省级期刊
影响因子 0.67
人气 24309
北大期刊
影响因子 0.51
人气 23749
北大期刊
影响因子 0.99
人气 23236
北大期刊
影响因子 0.94
人气 20396
部级期刊
影响因子 0.98
人气 18755
北大期刊
影响因子 0.95
人气 18057
部级期刊
影响因子 1.03
人气 13569
部级期刊
影响因子 0.38
人气 12816
省级期刊
影响因子 0.16
人气 12307
摘要:流式计算是大数据的一种重要计算模式,大数据流式计算已成为研究热点。任务管理是大数据流式计算的核心功能之一,负责对流式计算的任务进行资源调度及全生命周期管理。目前对于大数据流式计算的技术调研工作主要集中于流式计算应用需求、体系结构及整体技术,缺乏对大数据流式计算任务管理技术的精细化调研分析。首先给出流式计算任务管理的抽象功能模型,其次基于该模型对任务管理的关键技术进行了分类和综述,最后对既有主流的大数据流式计算系统对上述关键技术的应用、集成和优化进行了调研分析。
摘要:随着大数据时代的到来,大规模多标签数据挖掘方法受到广泛关注。多标签最近邻算法ML-KNN是一种简单高效、应用广泛的多标签分类方法,其分类精度在很多应用中都高于其他常见的多标签学习方法。然而随着需要处理的数据规模越来越大,传统串行ML-KNN算法已经难以满足大数据应用中时间和存储空间上的限制。结合Spark的并行机制和其基于内存的迭代计算特点,提出了一种基于Spark并行框架的MITKNN算法SML-KNN。在Map阶段分别找到待预测样本每个分区的K近邻,随后Reduce阶段根据每个分区的近邻集合确定最终的K近邻,最后并行地对近邻的标签集合进行聚合,通过最大化后验概率准则输出待预测样本的目标标签集合。串行和并行环境下的对比实验结果表明,SML-KNN在保证分类精度的前提下性能与计算资源呈近似线性关系,提高了ML-KNN算法对大规模多标签数据的处理能力。
摘要:异常探测具有广泛的应用,受到了工业界和学术界的共同关注。在众多异常探测方法中,I—solation Forest算法具有执行效率高、探测准确度好的特点,获得了众多应用。但是,传统Isolation Forest算法难以处理大规模数据。为解决此问题,设计了一种基于云计算平台的算法。具体地,使用Ha—doop分布式存储系统和Map Reduce分布式计算框架设计并实现了基于Isolation Forest的并行化异常探测算法PIFH。通过将探测模型构建和数据异常评价的过程并行化,提升了PIFH算法探测异常的执行效率,扩展了其应用范围。利用真实世界数据集验证了所提算法的执行效率和可扩展性。
摘要:随着高性能网络规模的增加,高阶路由器结构设计成为高性能计算研究的重点和热点。使用高阶路由器,网络能实现更低的报文传输延迟、网络功耗和网络构建成本,同时高阶路由器的应用还可以提高网络可靠性。高性能路由器的阶数不断提高,仅靠扩展单级crossbar交换结构的阶数使路由器内部的连线资源急速增长,交叉开关的实现代价将不可接受,这就需要为高阶路由器设计新型的交换结构。近十年来,出现了以YARC为代表的经典结构化设计以及“network within a network”等新型设计方法,未来的研究重点是解决高阶路由器结构设计中遇到的缓存、仲裁和扩展性等各种问题。鉴于此,实现了一种多级无缓存高阶路由器,这种高阶路由器内部是一个多级Clos网络,每一级有相应的仲裁模块对请求进行调度,数据包缓存在输入/输出端口实现,除去这些缓冲区单元,该网络是无缓存的。最后通过BookSim模拟器进行了大量的性能测试,所设计的路由器能够正常工作,性能良好。
摘要:随着微电子工艺的不断进步,SoC芯片设计中SRAM所占面积越来越大,SRAM的缺陷率成为影响芯片成品率的重要因素。提出了一种可扩展的存储器自修复算法(S—MBISR),在对冗余的SRAM进行修复时,可扩展利用存储器访问通路中校验码的纠错能力,在不改变SRAM结构的前提下能够进一步提高存储器的容错能力,进而提高芯片成品率。最后对该算法进行了RTL设计实现。后端设计评估表明,该算法能够工作在1GHz频率,面积开销仅增加1.5%。
摘要:随着网络用户的数量持续增多和对安全需求的增长,以AES加密的方式对用户数据流进行加密保护得到了广泛的应用。对服务器而言,大量用户形成的数据流具有流速高和突发性强的特点,而传统的串行加密却效率低下,会造成服务失效或服务质量差,因此在目前普及的CPU+GPU异构环境的基础上,通过流水线方式组织并行AES加密,以提高加密的性能。并通过滑动窗口进行突发流量控制,以提供高质量的流加密服务。实验结果显示,所提出的异构环境下的流式AES并行加密算法能满足高速率突发性的用户数据流的流式加密的需求,提高了加密的处理速度并有效地控制了流量。
摘要:随着移动终端深入人们的生活,移动社交APP得到了广泛使用。在移动社交APP中往往会使用大量的图片资源,如微信朋友圈、Instagram的图片分享等。在APP中浏览图片会消耗较多的网络流量,影响加载速度,因此大部分APP采用首先显示缩略图,根据用户需求再加载原图的策略。在服务器端也采用缓存技术来加快缩略图产生时间,减少磁盘I/O。但是,当前的缓存机制更多关注的是缓存的访问频率、最近访问时间等因素,并没有过多关注数据生成用户之间的社交关系,也没有考虑移动用户对缩略图和原图的不同访问模式。把缓存划分为两个部分:缩略图缓存区和原图缓存区,提出了基于社交关系的图片缓存替换算法,在传统缓存替换算法的基础上增加用户的社交关系以及缩略图和原图的关联关系,通过计算图片的缓存价值进行缓存替换。实验表明,所提出的基于社交关系的图片缓存替换算法对于缩略图和原图的缓存命中率都有明显提高。
摘要:为了提高片上网络在Torus拓扑结构下的路由通信效率,提出了一种基于直线引导思想的路由算法Tline。该路由算法将Torus拓扑结构的片上网络拓展为类似Mesh结构的坐标平面,以数据包的源节点和目的节点构成的直线为路由转发方向,并根据周围邻近节点的拥塞状况选择传输路径方向实现部分自适应路由。实验结果表明,与XY、OE路由算法相比,在热点流量模式下Tline路由算法具有较好的路由性能,且平均能耗降低约8%。
摘要:针对服务器中存储的大量重复和相似数据造成的空间浪费问题,改进的布隆过滤器(Bloom Filter)算法通过增加位数组并根据位数组的重复命中次数所计算的权重来动态优化重复数据的副本数,然后在Hadoop分布式集群下对改进的算法进行并行实现,以进一步提高作业处理效率。实验结果表明,与传统网页去重算法相比,改进的Bloom Filter算法的并行实现不仅提高了作业的处理效率,而且通过基于位数组下动态重复次数对副本数的优化,在一定程度上节省了服务器的存储空间。
摘要:近年来,随着移动终端的普及,人们希望无线网络能够更加方便、更加高效。如今的无线网络致力于提供高效、公平以及服务质量等特性,而在远距离的无线网络环境中,这些特性却很难得到满足。提出控制终端的上行传输机制,将远距离的终端和近距离的终端同时传输,以提高基站的带宽利用率。主要解决了以下几个问题,首先,如何取得终端的距离;其次,如何调度各个终端的发送,使得带宽利用率提高。
摘要:中继节点的选择决定了车际网中消息传播的效率和可靠性。现有的中继节点选择方法多集中于高速的直道和城市的十字路口场景,对于山区环境的弯道场景研究较少。提出一种基于指数迭代分割,适用于弯道下的中继节点选择方法EPBPC。该方法无需先验车辆信息,借助阻塞信号,通过坐标映射,选择发送节点传输范围内最远且宽度最小的子区间内节点作为中继节点,从而获得稳定的较小传输延时和较高的包到达率。在实际山路环境下的仿真实验结果表明,EPBPC在传输延时和包到达率性能上有所提升,尤其在单跳范围内车辆数较大的情况下,能获得相对于其他方法24.45%的点到点延时增益及高于99.8%的包到达率。
摘要:偏置场变分水平集图像分割模型利用原始图像的局部灰度信息,可以对灰度不均匀图像进行有效的分割,但当灰度图像中存在纹理时,分割效果往往很差。针对这一问题,提出抑制纹理信息的偏置场变分水平集图像分割模型。利用一种基于纹理几何结构的纹理描述符描述图像中不同的纹理区域,使得不同纹理区域对比更加明显,相同纹理区域更加平滑,通过抑制纹理信息使后续的图像分割在纹理部分的错分大大减少。实验结果表明,相比偏置场变分模型,所提模型对自然及人工合成纹理图像均获得更好的分割结果。
摘要:HE染色的乳腺癌组织病理图像是分析诊断乳腺癌常用的方法,病理学家普遍认为癌巢和间质的病理形态学特征对研究乳腺癌的生物学行为有着预示作用,所以准确分割癌巢和间质显得尤为重要。对于HE染色乳腺癌组织病理图像,视癌巢和间质的分割为图像中像素点的分类问题,提取并分析特征,选取最佳特征组合,然后分类为癌巢或间质,并结合间隔采样、归一化与阈值法。实验表明,该方法能较为准确地分割出癌巢和间质,保证较高准确率和精度,在时间效率上能达到较为满意的结果。
摘要:近年来,超像素算法被应用到计算机视觉的各个领域。超像素捕获图像冗余信息,降低图像后续处理的复杂度。超像素分割作为图像的预处理过程需要满足图像处理的实时性和准确性。在SLIC算法的框架下,所提算法的主要目的是提高超像素分割的效率;通过原图像降尺度过程,提取原图像中少量像素,生成降尺度图像.牙口用SLIC算法对降尺度图像进行超像素分割;初次超像素分割之后,根据降尺度图像的分割结果对原图像中像素进行K近邻分类,实现原图像的超像素最终分割结果。实验表明,对于同一处理对象,在准确度相近的状态下,本算法处理速度高于SLIC算法。
摘要:利用数据挖掘方法对医学图像做分析是目前研究的热点之一,常用的挖掘方法首先需要从医学图像中提取特征,然后进行分类分析。目前,应用最多的是提取图像的统计特征,这种方法对所提取的特征有很强的依赖性。采用一种深度学习的新方法——卷积受限玻尔兹曼机模型,并且采用改进的快速持续对比散度算法对模型进行训练。该方法直接从乳腺X光图像中自主学习特征并利用学习到的特征对图像进行分类。实验结果显示,新方法对医学图像的分类精度相对于已有方法有明显的提升。
摘要:针对人体跌倒检测阈值算法在由于阈值设定不当而引起的检测精度下降问题,采用支持向量机方法决定跌倒检测的阈值大小。从加速度传感器中获取人体运动信号,提取合加速度以及倾角作为分类特征,根据人体在跌倒时经过的失重、撞击地面和平稳三个阶段,建立基于阈值的跌倒检测模型。采用所建立的跌倒检测模型,分别用支持向量机方法以及人工方法设定阈值,仿真结果显示采用支持向量机设定阈值的检测效果优于对比算法,结果表明本文方法能有效识别跌倒。
摘要:对一种单图像向导滤波器的高性能FPGA设计结构进行了分析,发现其中的均值滤波器存在设计缺陷,据此提出了一种向导滤波器的整数FPGA设计结构。通过改变均值滤波器的数据累加顺序,减少了存储资源的使用,同时以整数数据处理方式实现了向导滤波器中方差和变换系数的计算,并且通过参数调整,可以方便地实现不同大小图像的不同尺寸窗口的向导滤波。在Altera公司Cyclone系列FPGA芯片上进行了综合,实验结果表明,向导滤波整数FPGA结构的处理结果与浮点计算四舍五入取整后的结果相比,最大误差不超过1,同时新结构大幅度降低了硬件资源的使用量,有效提升了数据处理速度,使用EP3C40F484C8芯片综合时,能以高达162fps的速度处理1024X1024的图像,能很好地满足各种图像实时处理要求。
摘要:对高维数据降维并选取有效特征对分类起着关键作用。针对人脸识别中存在的高维和小样本问题,从特征选取和子空间学习入手,提出了一种L2,1范数正则化的不相关判别分析算法。该算法首先对训练样本矩阵进行奇异值分解;然后通过一系列变换,将原非线性的Fisher鉴别准则函数转化为线性模型;最后加入L2,1范数惩罚项进行求解,得到一组最佳鉴别矢量。将训练样本和测试样本投影到该低维子空间中,利用最近欧氏距离分类器进行分类。由于加入了L2,1范数惩罚项,该算法能使特征选取和子空间学习同时进行,有效改善识别性能。在ORL、YaleB及PIE人脸库上的实验结果表明,算法在有效降维的同时能进一步提高鉴别能力。