发表咨询:400-808-1731
订阅咨询:400-808-1751
北大期刊
影响因子 0.51
人气 23558
北大期刊
影响因子 0.94
人气 20243
部级期刊
影响因子 1.03
人气 13500
北大期刊
影响因子 3.18
人气 11594
统计源期刊
影响因子 0.55
人气 10981
北大期刊
影响因子 0.79
人气 9677
省级期刊
影响因子 0.41
人气 9477
省级期刊
影响因子 0.57
人气 9305
省级期刊
影响因子 0.15
人气 9109
统计源期刊
影响因子 0.47
人气 8349
摘要:蛋白质是由多个氨基酸残基顺序连接而成的长链.在天然状态下,蛋白质并不是无规则的自由状态,而是自发形成特定的空间结构,以执行其特定的生物学功能.驱动蛋白质形成特定空间结构的主要因素是残基间的非共价相互作用,包括疏水作用、静电相互作用、范德华力等.因此,对残基之间远程相互作用的准确预测将有助于对蛋白质空间结构的预测,进而有助于对蛋白质生物学功能的了解.在蛋白质进化过程,有相互作用残基对之间存在一种"共进化"模式,即当一个残基发生变异时,与其有相互作用的残基也要发生相应的变异,以维持相互作用,进而维持整体空间结构以及生物学功能.基于上述生物学观察,研究者开发了多个统计模型和算法以预测残基对之间的相互作用:1)概述残基之间远程相互作用的两大类基本预测算法,包括无监督学习方法和监督学习方法;2)使用蛋白质结构预测CASP比赛结果来客观比较上述各类算法的性能,分析各个算法的特点和优势;3)从生物学观察和统计模型2个角度分析总结了未来的发展趋势.
摘要:为解决TCP/IP面临的可扩展性、动态性和安全可控性等问题,研究人员提出了大量的新型网络体系架构、协议和算法等,而这些研究在部署与应用前需要在一定规模的、逼近于真实网络的试验床上进行长时间的测试、评估和优化.近年来,国内外兴起了网络创新试验床的研究和建设.然而,网络创新试验床在设计与实现中面临一系列挑战.以实验所面临的成本、可行性、可信性和可控性4个问题为出发点,总结了网络创新试验床的需求及特性要求,归纳分析了其在虚拟化、网络可编程性、联邦管控、实验控制、测量与监测等方面存在的技术挑战,并对关键技术、架构和研究进展进行介绍与论述.最后分析了国内外网络创新试验床的建设与发展现状,并讨论了网络试验床未来的发展趋势和需要进一步解决的问题.
摘要:共乘也被称为"合乘"、"拼车"、"顺风车",通过有效整合运力资源减少路上行驶车辆数量,对缓解交通拥堵、降低出行费用、减轻环境污染都有重要意义.大数据背景下实时更新的车辆位置信息数据、城市交通数据、社交网络数据,为智能出行特别是共乘带来了全新的发展机遇.在车辆行驶中对乘客请求进行实时匹配的动态共乘,是大数据背景下智能出行发展趋势的代表.在统一归纳了解决动态共乘实时性的Filter and Refine框架基础上,介绍了动态共乘的各种类型;针对大数据背景下动态共乘问题遇到的问题,对Filter步骤中预先计算可行解、建立动态空间索引、基于请求分组预处理及并行优化方法,Refine步骤中简化计算模型、采用新型数据结构、利用启发式算法等优化方法进行了详细介绍;然后对大数据背景下保证动态共乘系统的价格机制、信用体系和人机接口等相关技术进行了分析;最后,总结展望了大数据背景下动态共乘中亟待解决的关键问题和未来的研究方向,以期为创造低碳生活、绿色出行,解决环境污染有所启示.
摘要:近年来,分类体系匹配由于其在知识库构建和融合等方面的广泛应用,已成为国内外工业界和学术界的研究热点.然而,随着网络大数据的不断发展,分类体系变得越来越庞大和复杂,构造一种通用有效的分类体系匹配器以适应大规模、异构分类体系匹配的扩展性仍然面临很大的挑战.为此,提出了一种基于复合结构的分类体系匹配方法 BiMWM,该方法利用分类体系中分类的复合结构信息:微观结构和宏观结构,将分类体系匹配问题转化为二部图上的优化问题进行求解.首先,创建赋权的二部图建模分类体系之间候选的匹配类对关系;然后,通过计算二部图上的最大权匹配剪枝选择最优的分类体系的匹配类对.BiMWM方法可以在多项式时间内为2个分类体系产生最优匹配.实验结果表明:与当前先进的基准方法相比,该方法能够有效提升大规模、异构分类体系匹配的性能.
摘要:偏标记学习(partial label learning)是人们最近提出的一种弱监督机器学习框架,由于放松了训练数据集的构造条件,只需知道训练样本的真实标记的一个候选集合就可进行学习,可以更方便地处理很多领域的实际问题.在该框架下,训练数据的标记信息不再具有单一性和明确性,这就使得学习算法的构建变得比传统分类问题更加困难,目前只建立了几种面向小规模训练数据的学习算法.先利用ECOC技术将原始偏标记训练集转换为若干标准二分类数据集,然后基于变分高斯过程模型在每个二分类数据集上构建一个具有较低计算复杂度的二分类算法,最终实现了一种面向大规模数据的快速核偏标记学习算法.仿真实验结果表明,所提算法在预测精度几乎相当的情况下,训练时间要远远少于已有的核偏标记学习算法,利用普通的PC机处理样本规模达到百万级的问题只需要40min.
摘要:如何对海量的网络媒体大数据进行准确地目标识别,是当前的一个研究热点和难点.针对此问题提出一种利用媒体流时间相关特性的异构多模态目标识别策略.首先基于媒体流中同时存在音频和视频信息的特征,建立一种异构多模态深度学习结构;结合卷积神经网络(convolutional neural network,CNN)和限制波尔兹曼机(restricted Boltzmann machine,RBM)的算法优点,对音频信息和视频信息分别并行处理,这种异构模式可以充分利用不同深度神经网络的特点;然后生成基于典型关联分析的共享特征表示,并进一步利用时间相关特性进行参数的优化.3种对比实验用来验证所提策略的效果,首先将策略与单一模态算法进行对比;然后再在复合的数据库上建立对比实验;最后在网络视频库上建立对比实验,这些对比实验验证了策略的有效性.
摘要:大规模数据的收集和处理是近年的研究热点,业界已经提出了若干平台级的设计方案,大量使用了开源软件作为数据收集和处理组件.然而,要真正满足企业应用中海量数据存储、多样化业务处理、跨业务分析、跨环境部署等复杂需求,尚需设计具有完整性、通用性、支持整个数据生命周期管理的大数据平台,并且对开源软件进行大量的功能开发、定制和改进.从小米公司的行业应用和实践出发,在深入研究现有平台的基础上,提出了一种新的基于开源生态系统的大数据收集与处理平台,在负载均衡、故障恢复、数据压缩、多维调度等方面进行了大量优化,同时发现并解决了现有开源软件在数据收集、存储、处理以及软件一致性、可用性和效率等方面的缺陷.该平台已经在小米公司成功部署,为小米公司各个业务线的数据收集和处理提供支撑服务.
摘要:首次对界标窗口下数据流最大规范模式挖掘问题进行了研究.为了克服na6ve算法在处理该问题时不具有增量计算的缺点,提出了一种基于边界界标窗口技术的数据流最大规范模式挖掘(data stream maximal regular patterns mining based on boundary landmark window,DSMRM-BLW)算法.该算法将数据流上的第1个待处理窗口定义为边界界标窗口,使用na6ve算法对其进行处理;之后每个窗口上的最大规范模式都可以基于前一个窗口上的最大规范模式集合增量获得,可以克服na6ve算法的缺点.实验结果表明:DSMRM-BLW算法是处理界标窗口下数据流最大规范模式挖掘的有效方法,与na6ve算法相比,具有相同的执行结果,但时间与空间效率得到了很大的提高.
摘要:移动对象的语义行为模式挖掘是当前移动对象研究中关注的热点,有益于诸多应用场景,如朋友推荐系统、轨迹破案领域和个性化服务等.目前语义行为模式挖掘方法没有考虑移动对象在停留点的停留时间,不能准确地分辨出移动对象之间的不同行为模式.为了解决上述问题,提出了一种基于停留时间的语义行为模式挖掘(discovering common behavior using staying duration on semantic trajectory,DSTra)方法,首先挖掘每个移动对象的频繁语义行为模式,然后定义语义行为模式之间的相似性度量方法,最后采用层次聚类的方法对移动对象进行聚类,找出具有相似行为模式的移动对象群体.实验结果表明:该方法不仅具有合理性和有效性,同时还具有较高的准确率和较好的效率.
摘要:指出"没有网络安全就没有国家安全,没有信息化就没有现代化".数字时代信息安全工具的大众化是不可阻挡的历史潮流.大众化的信息安全已经直接影响到我们每个人的利益,信息安全已成为国家、地方区域经济结构优化提升和转型发展的新机遇.在信息安全上升为国家战略、
摘要:随着互联网与云计算的发展,越来越多的应用被从本地迁移到云端,这些应用最终被运行在共享的数据中心.受到数据中心应用复杂并且需求多变特征的影响,传统体系结构中的部分硬件部件(如共享末级缓存、内存控制器、I/O控制器等)固定功能的设计不能很好地满足这些混合多应用的场景需求.为满足这类应用场景的需求,计算机体系结构需要提供一种可编程硬件机制,使得硬件功能能够根据应用需求的变化进行调整.提出了一种可编程数据平面方法:通过在现有硬件部件中增加可编程处理器,使用执行固件代码的方式对硬件的请求进行处理,并通过更新数据平面处理器固件的方式实现硬件功能的扩展.该方法在FPGA原型系统中进行验证,其结果表明,该方法并没有给系统性能带来严重的影响,只使用有限的资源即可为硬件增加更为灵活的可编程能力,使其能够适应应用需求复杂多变的场景.
摘要:IEEE 802.15.3c是高速无线个人局域网(high-rate wireless personal area networks,WPANs)的国际统一标准,该标准要求采样频率为2.592GHz的情况下在222.2ns内完成512点FFT运算,这对FFT处理器提出了极高的标准.为了满足这一要求,部分FFT处理器采用了变形的基2-4 FFT算法以及多运算单元(processing element,PE)并行的方法.在多PE并行的情况下,只有支持其无冲突并行访问操作数以及并行按序输入输出数据的存储系统设计,才能完全发挥出多个PE单元并行的优势.根据4路并行变形的基2-4 FFT运算单元访问操作数的规律,设计了一种支持4路PE并行访问操作数的地址转换方法;并且该方法支持并行按序输入输出数据,这解决了由于数据输入或者输出需要进行位反序操作给并行按序输入输出带来的困难.最后基于同一综合约束条件进行逻辑综合,结果表明:该方法比之前的方法节约面积46%,功耗节约了28%,并且该方法支持连续数据流(continuous-flow)操作以及即位运算(in-place).
摘要:提出一种基于分类策略的聚簇页级闪存转换层算法——CPFTL.1)CPFTL将地址映射缓存分为热映射表缓存、冷映射表缓存和连续映射表缓存,分别用来缓存访问频繁的请求的映射项、访问不频繁的请求的映射项和高空间本地性的连续请求的映射项,有效提升各类请求的处理能力;2)为利用连续请求的空间本地性,CPFTL的连续映射表缓存预取多个连续的映射项,提高它对连续请求的响应性能;3)为减少页级映射算法的转换页读写开销,CPFTL的冷映射表缓存采用聚簇策略,即将属于同一转换页中的映射项进行聚簇,按簇进行LRU管理,当冷映射表缓存满时,根据簇的映射项个数和LRU选取合适的簇剔除到闪存.实验结果显示,相比经典的页级DFTL算法和最新的SDFTL算法,CPFTL的缓存命中率、平均响应时间、地址转换页操作次数和闪存块擦除次数都有显著提升.
摘要:赛道存储器(racetrack memory,RM)作为一种新型的非易失存储器件,对于未来存储结构设计具备很高的竞争力.RM通过将多个位信息存储在一个条带状的磁材料纳米线上,从而达到很高的存储密度.同时,又能够提供很快的读/写访问速度.为了能够访问RM条带上不同位置的位信息,需要引入一种特有的"移动"操作.然而,研究人员观察到移动操作需要较高驱动电流并产生大量热量,从而引起性能和稳定性的下降,甚至由于温度过高引起存储单元的损坏.现在仍缺乏一个关于RM移动的热力模型来估算运行中的温度.更重要的是,RM急需一个体系结构级的管理策略来避免温度过高带来的稳定性问题.针对这些问题,首先提出了一个热力模型来研究RM使用时温度与设计参数的关系.同时,为了提高RM的稳定性,一种基于"配额制度"的移动操作管理策略被讨论,以保证单位时间内的移动强度被限定在特定阈值下.实验结果表明,该方法能够以3.5%的性能代价将温度升高控制在20℃之内.
摘要:集成电路设计和制造的全球化趋势使得木马电路可以在集成电路设计制造的任何阶段被插入,这引发了对硬件安全的广泛关注.从防御者的角度出发,木马电路在宿主电路使用过程中绝大多数时间是静默无害的,但是一旦被激活就会造成如信息泄露、功能异常或系统崩溃等严重危害;从攻击者的角度出发,避免木马电路被"误触发"是其最重要的一个设计目标之一.普遍认为,电路中那些具有较低状态翻转概率的惰性节点最有可能成为木马电路的插入点.因此目前检测的主要手段之一是试图寻找到这些惰性点,以便有针对性地尝试以激活木马电路.然而,目前的方法仅专注于寻找被测电路在测试模式下的惰性点.提出了一种寻找被测电路在工作模式下的惰性点的方法.从攻击者的角度出发,两者的交集将是木马电路的最佳插入点——可以较好地避免其插入的木马电路在宿主电路的测试阶段以及试运行阶段被"误触发".因此从防御者的角度出发,找到测试模式和工作模式下共有的惰性节点并对其进行检测,有助于有效提高检测效率.
摘要:作为云存储安全的重要问题,数据完整性验证技术受到学术界和工业界的广泛关注.为了验证云端数据完整性,研究者提出了多个数据完整性公开审计模型.然而,现有的数据完整性审计模型采用固定参数审计所有文件,浪费了大量计算资源,导致系统审计效率不高.为了提高系统的审计效率,提出了一种自适应数据持有性证明方法(self-adaptive provable data possession,SA-PDP),该方法基于文件属性和用户需求动态调整文件的审计方案,使得文件的审计需求和审计方案的执行强度高度匹配.为了增强审计方案更新的灵活性,依据不同的审计需求发起者,设计了2种审计方案动态更新算法.主动更新算法保证了审计系统的覆盖率,而被动更新算法能够及时满足文件的审计需求.实验结果表明:相较于传统方法,SA-PDP的审计总执行时间至少减少了50%,有效增加了系统审计文件的数量.此外,SAPDP方法生成的审计方案的达标率比传统审计方法提高了30%.
摘要:混合关键级(mixed criticality,MC)系统能够同时保证高效地资源利用与高关键任务的正确执行.当前,对混合关键级系统的研究多认为,从低关键级提升到高关键级的时机是高关键级任务执行超过其低关键级模式下时间预算的时刻.但在实际应用的嵌入式系统中,关键级模式的提升是由诸如所处环境变化、控制切换等系统外部事件触发的,即关键级的提升可能发生在任务执行过程中的任何时刻.在单处理器平台上,针对使用固定优先级调度策略的周期任务集,当外部事件触发关键级提升后,基于响应时间分析得出了可调度高关键级任务的必要条件;并对关键级提升后,高关键级任务可能通过优先级交换满足截止时限的条件进行了分析,得出了相应的优先级交换算法.仿真实验验证了事件触发关键级提升时高关键级任务的可调度性及优先级交换算法的有效性.
摘要:软件定义网络(software-defined networking,SDN)将控制平面与转发平面分离,通过控制器配置交换机流表项来实现网络的灵活控制,极大地提高了网络带宽利用率.随着SDN的蓬勃发展,越来越多的高校和公司开始部署SDN.同时SDN也面临着一些传统IP网络中不存在的问题,如一些原本在IP网络中运行良好的协议在SDN网络中性能却受到了严重的影响,TCP协议就是其中之一.从SDN的工作机制出发,通过3个场景阐明了SDN在proactive工作模式下依然存在Packet-In短时间内高速并发的可能性.总结并实验验证了高速并发的Packet-In以及流表更新时旧表项需重排列的特性都会使数据包在SDN网络中产生较大时延.实验结果表明,当TCAM支持4 000个流表项时,最坏情况下仅由新插入流表项优先级原因导致已有流表项的重排列就能使单次传输时延达到10s,并发的高速Packet-In则会使时延加大.以实验为基础,揭示了由于SDN网络特性造成的伪拥塞现象,即传统TCP在SDN网络中面临两大问题:1)TCP建立连接困难;2)TCP协议传输低效.最后通过对实验现象进行分析,提出了解决SDN网络中TCP低效问题可能的工作方向.