正定矩阵支持向量机正则化路径算法
摘要:正则化路径算法是数值求解支持向量机(supportvectormachine,SVM)分类问题的有效方法,它可在相当于一次SVM求解的时间复杂度内得到所有的正则化参数及对应SVM的解.现有的SVM正则化路径算法或者不能处理具有重复数据、近似数据或线性相关数据,或者计算开销较大.针对这些问题,应用正定矩阵方程组求解方法来求解SVM正则化路径,提出正定矩阵SVM正则化路径算法(positivedefiniteSVMpath,PDSVMP).PDSVMP算法将迭代方程组的系数矩阵转换为正定矩阵,并采用Cholesky分解方法求解路径上各拐点处Lagrange乘子增量向量;与已有算法中直接求解正则化参数不同,该算法根据活动集变化情况确定参数增量,并在此基础上计算正则化参数,这样保证了理论正确性和数值稳定性,并可降低计算复杂性.实例数据集及标准数据集上的实验表明,PDSVMP算法可正确处理包含重复数据、近似数据或线性相关数据的数据集,并具有较高的计算效率.一种基于教学模型的协同训练方法
摘要:在很多实际问题中,很容易得到大量未标记数据而较难获取数据的标记;所以半监督学习在过去的10多年中得到了很大的关注.基于不一致性的半监督学习是其中一种十分重要的风范,协同训练是其代表方法.至今为止,大部分协同训练方法在选择未标记示例进行标记时只考虑预测学习器的置信度,而忽视了学习器的需求.受到真实教学系统的启发,提出了一种针对协同训练的教学模型TaLe,其中预测学习器是“教”者,而另一方则为“学”者.进而基于该模型给出了一种新的协同训练方法CoSnT,同时考虑了“教”的置信度和“学”的需求度.实验结果表明CoSnT在收敛效率和泛化性能上都优于标准的协同训练算法.一种自适应的大间隔近邻分类算法
摘要:kNN分类算法虽然已经广泛地应用于模式识别的各个领域,但是如何对kNN进行改进仍然是一个研究热点.在各种改进方法中,大间隔近邻分类方法取得了较好的改进效果,但是该算法仍然有一些缺点,例如算法对所有测试样本选择的邻域大小(即k值)都是一样的.针对这一缺点,提出了将自适应选择k值引入到目标函数设定中的自适应大间隔近邻分类算法(ALMNN).该算法的主要步骤是:首先为每个测试样本计算一个k值,然后在每一类选取k个目标近邻,计算属于每一类的损失函数值,选择拥有最小函数值的类作为测试样本的类别.给出了ALMNN方法的算法描述,并且通过多个数据集的实验表明,提出的算法与传统的kNN,LMNN比较,可以在一定程度上提高分类的性能,减少了k值的选择对分类性能的影响,训练集的随机抽取对算法的分类性能影响较小.一种基于混合遗传和粒子群的智能优化算法
摘要:粒子群算法(particleswarmoptimization,PS0)原理简单、搜索速度快,但前期容易“早熟”.遗传算法(geneticalgorithm,GA)具有很强的全局搜索能力,但收敛精度不高.综合考虑二者优缺点,把遗传算子引入PSO算法中,并采用交叉搜索的方法,调整惯性权重以及变异方式使粒子得到进化,当粒子种群进化到一定层度后,对部分粒子进行变异处理,这样不仅避免算法陷入局部最优解,而且获得较高收敛精度和执行能力,可解决工程中非线性、多极值的问题.据测试函数以及与其他寻优算法的对比分析表明,此混合策略在求解精度、搜索效率和处理不同复杂度问题等方面都有很好的优越性,具有满足工程需要的能力.独立子空间中的场景特征增量学习方法
摘要:针对特征提取与场景描述在场景分类任务中的重要性,提出了一种独立子空间内的场景特征增量学习方法,采用基于独立子空间分析的无监督学习方法获取结构化的特征基元,基元的优化过程融入增量学习的思想框架中,以解决大样本以及动态样本下的学习难题.通过特征基元的非线性映射获取一种规则网格划分下的图像块状描述子,最后结合空间金字塔匹配模型构建层次化的场景描述,有效提高了场景图像分类的精确度.在OT场景图像集上的实验结果表明,所得特征基元能够用于构建低维高效的场景描述,通过详细讨论相关参数对优化过程以及分类性能的影响,并与多种典型模型下的实验结果进行对比,充分验证了该方法在场景分类任务中的有效性.一种求解截断Hinge损失的软阈值坐标下降算法
摘要:有效地减少支持向量数目能够提高分类器的鲁棒性和精确性,缩短支持向量机(supportvectorITIachine,SVM)的训练和测试时间.在众多稀疏算法中,截断Hinge损失方法可以显著降低支持向量的数目,但却导致了非凸优化问题.一些研究者使用CCCP(concave—convexprocedure)方法将非凸问题转化为多阶段凸问题求解,不仅增加了额外计算量,而且只能得到局部最优解.为了弥补上述不足,提出了一种基于CCCP的软阈值坐标下降算法.用坐标下降方法求解CCCP子阶段凸问题,提高计算效率;对偶SVM中引入软闽值投影技巧,能够减少更多的支持向量数目,同时选择合适的正则化参数可消除局部最优解的不良影响,提高分类器的分类精度.仿真数据库、UCI数据库和大规模真实数据库的实验证实了所提算法正确性和有效性.一种阴影区域的可通行性检测方法
摘要:可通行性检测是自主机器人视觉导航的基本方法之一.在乡村道路和城市环境中经常存在阴影,对基于可视化特征分类的可通行性检测影响很大,目前很少有针对阴影区域的可通行性检测的研究.提出一种阴影区域的可通行性检测方法,利用超像素技术把场景图像分割成同质、同光照条件的超像素,提出一种特征窗口定位方法寻找尽量包含同光照条件的特征提取窗口,运用局部二值模式(10calbinarypattern,LBP)提取方法对特征窗口内的像素进行描述,使用单类支持向量机(One—ClassSVM)进行训练和分类,实现可通行性检测.实验表明,新方法不仅能够准确地对阴影区域内部的地形进行可通行性检测,而且可以实现对阴影区域和无阴影区域交;r-部分的准确检测,在小面积阴影区域与小面积无阴影区域相互交错、交替出现的恶劣条件下仍能准确检测地形的可通行性,降低了可通行性检测在阴影边界的不连通性.基于粒度偏移因子的支持向量机学习方法
摘要:在实际应用中,数据集样本规模、分布密度的不平衡性可能会使传统支持向量机(supportvectormachine,SVM)得到的分类超平面不是最优.在对传统支持向量机最优分类面分析的基础上,结合粒度计算(granularcomputing,GrC)理论,针对数据规模和分布密度不平衡的数据集,提出一种基于粒度偏移因子的粒度支持向量机(granularSVM,GSVM)学习方法,称为S—GSVM方法.该方法将原始样本用Mercer核映射到高维空间,然后在高维空间中对数据进行有效的粒划分,通过对不同的粒计算不同的超平面偏移因子,重新构造支持向量机的凸二次优化问题,以得到一个泛化能力更好的分类超平面.S—GSVM方法充分考虑了数据复杂分布对于泛化能力的影响,对基于最大间隔的分类面进行改进.实验结果表明S-GSVM方法在非平衡数据集上能得到较好的泛化性能.多车辆合乘问题的两阶段聚类启发式优化算法
摘要:车辆合乘问题研究在物流领域和交通领域意义重大.良好的合成策略不仅可以节省物流成本,降低交通拥塞,在减少噪声及提高环境等方面也是很有利的.针对确定性多车辆合乘匹配问题,提出了两阶段聚类的启发式匹配策略:第1阶段聚类过程提出匹配度的概念,用于指导将服务需求分配到某一具体车辆,从而将多车辆问题转化为单车辆问题;第2阶段聚类过程基于“先验聚类”插入思想,可降低单车辆匹配过程的插入试探次数,从而提高算法效率.为提高搭乘成功率并降低运营总成本,通过迁移对第1阶段聚类过程进行调整.实际算例结果表明,算法在可接受时间范围内不仅可提高搭乘成功率,还明显降低车辆的运行成本,表现出较强的实用性.美制造出世界首台碳纳米管计算机
摘要:美国斯坦福大学的工程师在新一代电子设备领域取得突破性进展,首次采用碳纳米管建造出计算机原型,比现在基于硅芯片模式的计算机更小、更快且更节能.晶体管不断缩小,以使一个芯片上可以排列更多.但随着晶体管变得越来越细小,在狭窄的空间里就会浪费更多电力、产生更多热量.而研究表明,碳纳米管能非常有效地指挥和控制电力.碳纳米管一直被认为是硅晶体管潜在的继任者.这项研究将引导研究人员去探索如何在未来10年开发出更小、更高效节能的处理器.英科学家开发出超触觉技术系统
摘要:最近,英国布里斯托尔大学“互动与绘图”(BIG)项目组研究人员开发出一种系统,能让用户在一个交互界面上体验到多部位的触觉感受(多点触觉反馈),而无需碰触或拿着任何设备.研究人员称,这种多点触控表面能让人们在公共场合轻松互动,人们不仅能感觉到显示屏上的内容,而且能在触摸前接受到看不见的信息.利用超声辐射力向用户发射触觉感受还是一门新技术.该研究提出了一种超触觉理论,深度学习新算法完成字里行间的情绪识别
摘要:近日,斯担福大学的研究生RichardSocher和AndrewNg(Google深度学习项目工程师之一),以及一位语言学及人工智能领域的专家ChrisManning,共同研究开发了一种深度学习的新算法,这种算法被称为NeuralAnalysisofSentiment,缩写为NaSent.NaSent算法从人脑中得到灵感,“电喷”打印打出三维超精细结构
摘要:美国伊利诺斯大学厄本纳一香槟分校、芝加哥大学、韩国汉阳大学等的科研小组开发出一种制作纳米结构的新方法,将“从上到下”的喷墨打印和“从下到上”的自组装技术结合在一起,以一种“电喷”打印方式自动形成三维的超精细结构,所造出的纳米材料可用在半导体和磁存储工业中.微博中基于统计特征与双向投票的垃圾用户发现
摘要:传统微博中垃圾用户发现主要依靠用户的显示统计特征.针对微博中关注网络的有向特性,给出了有向网络中局部三角形数量统计算法DirTriangleC,结合用户博文数量和局部三角形比例发现隐式垃圾用户;针对统计特征方法对垃圾用户误报和漏报的缺点,提出了基于统计特征与双向投票算法AttriBiVote,利用用户信任的双向传播与其邻居节点的统计特征共同决定用户类别.真实的Twitter数据集上验证了DirTriangleC和AttriBiVote算法的有效性,结果表明DirTriangleC算法能够发现约83.7%的“完全非活跃”状态的隐式垃圾用户,相对依靠显示统计特征方法增加了约2倍数量的疑似垃圾用户;同时AttriBiVote算法发现垃圾用户的数量和准确性均高于依靠统计特征的垃圾用户发现方法;最后实验分析了AttriBiVote算法的时间开销.一种结合特征选择和链接过滤的主动协作分类方法
摘要:分类是网络数据挖掘中的重要研究课题之一.协作分类利用网络节点之间的依赖关系对相互链接的节点集合进行组合分类,其精度高于传统的分类方法,受到广泛关注,并被应用于文档分类、蛋白质结构预测、图像处理和社会网络分析等众多领域.提出一种结合特征选择和链接过滤的主动协作分类方法,算法首先基于最小冗余一最大相关方法选择重要的属性,并建立隐式链接;之后过滤初始链接得到显式链接,最后集成隐式和显式链接形成新的网络结构,再应用协作分类方法实现分类.在3个公共数据集上将该方法分别与典型的传统分类方法、协作分类方法进行对比,结果表明该方法能获得较高的分类精度,对稀疏标记的网络其优势更加明显.RFID距离约束协议的分析与设计
摘要:中继攻击给无线射频识别(RFID)安全带来了巨大威胁,攻击者通过原封不动地转发RFID读写器和标签的通信消息的方式,增加了读写器和标签通信的距离,破坏了RFID默认为短距离通信的隐含假设.而抵御中继攻击的主要方法是采用基于测量读写器与标签之间通信时间的距离约束协议,Hancke和Kuhn在2005年提出了第1个RFID距离约束协议HK,自此以后,陆续有新的距离约束协议问世.目的就是设计一个距离约束协议来抵御中继攻击,同时该协议适合于RFID标签计算资源有限的特点.首先回顾了已有的各种距离约束协议,分析了这些协议的优点和缺陷,并提出了针对距离约束协议的攻击模型,最后,基于HK协议,提出了一个新的距离约束协议HKM,该协议采用预定义质询和随机质询相结合的方式,并充分利用了HK协议浪费的内存,通过与现有的几个典型的距离约束协议进行对比,该协议在内存消耗和抵御中继攻击两个方面有较好的表现.Flume系统的隐蔽信道搜索问题研究
摘要:Flume系统不仅可以为处于不同安全级别的进程传输信息提供安全保障,还可以通过显式标签机制解决在隐式标签系统中进程间通信连接超时导致的隐蔽信道问题.但是其系统中的部分不合理标签分配机制可能会导致信息在传递过程中同样存在泄露问题.针对这个问题提出一种隐蔽信道搜索模型(covertchanneldetectionmodeI,CCDM),将隐蔽信道的搜索问题抽象为有向图联通问题.最后结合回溯算法的思想提出IniaPathSearch算法和QuickPathSearch算法来对隐蔽信道进行自动搜索.实验结果表明,IniaPathSearch算法和QuickPathSearch算法可以正确有效地对Flume系统中隐蔽信道进行检测,并能为信息传递提供合法最短路径,其结果可以用于指导提高系统的安全性.一种基于半监督GHSOM的入侵检测方法
摘要:基于神经网络的入侵检测方法是入侵检测技术的一个重要发展方向.在已有无监督生长型分层自组织映射(growinghierarchicalself_organizingmaps,GHSOM)神经网络算法的基础上,提出了一种半监督GHSOM算法.该算法利用少量有标签的数据指导大规模无标签数据的聚类过程.一方面借鉴cop—kmeans半监督机制,解决了原始算法中返回空划分的问题,并将其应用到GHSOM算法中.另一方面提出了神经元信息熵的概念作为子网生长的判断条件,提高了GHSOM网络子网划分的精度.此外还利用有标签的数据自动确定聚类结果的入侵类型.对KDDCup1999数据集和LAN环境下模拟产生的数据集进行的入侵检测实验表明:相比于无监督的GHSOM算法,半监督的GHSoM算法对各种类型的攻击具有较高的检测率.