发表咨询:400-808-1731
订阅咨询:400-808-1751
北大期刊
影响因子 0.51
人气 23754
北大期刊
影响因子 0.94
人气 20397
省级期刊
影响因子 0.3
人气 18161
部级期刊
影响因子 1.03
人气 13572
统计源期刊
影响因子 1.71
人气 12632
CSSCI南大期刊
影响因子 5.52
人气 12352
统计源期刊
影响因子 0.55
人气 11104
北大期刊
影响因子 0.62
人气 10769
省级期刊
影响因子 0.42
人气 10523
统计源期刊
影响因子 1.29
人气 9981
摘要:评分预测问题是推荐系统研究的一个分支.在上下文感知推荐(Context-Aware Recommendation,CAR)中,常常需要考虑上下文因子(或称属性)对评分预测效果的影响.现有模型大多是捕捉单个属性的特征并加上多个属性间的相互作用(简称属性交互)实现评分预测.然而,有些算法在捕捉属性间的相互作用时没有针对性,使一些属性交互对预测结果没有帮助,甚至降低模型性能;而且,在实现属性交互时,很多算法只是单纯地使用固定的属性值,没有从某个方面挖掘出它们的潜在特征.为了解决这些问题,文中提出了属性提升(Attribute Boosting,AB)框架,从用户、物品与属性类型3个方面分别与属性进行交互.这种更精细的建模方式使属性能够自动地适应用户偏好、物品关联与类型特征,并能在评分预测中充分地发挥作用.在此基础上,文中结合概率图模型的低秩近似能力和随机梯度下降(Stochastic Gradient Descent,SGD)的快速训练优势,在算法性能和训练效率上进行权衡,设计了局部采样(Partial Sampling,PS)方法学习属性提升框架的参数,最终构成完整的属性提升与局部采样(Attribute Boosting with Partial Sampling,ABPS)模型.实验证明,ABPS模型通过有针对性的属性交互,能有效地挖掘出属性有用的隐含特征,从而减少盲目交互带来的消极影响;利用局部采样,该模型能使用更低的特征维度描述个性化信息,取得比其他模型更好的效果.
摘要:对称IB(Symmetric Information Bottleneck)通过行、列压缩变量之间的相互协作来挖掘数据中的双向压缩模式.由于行、列压缩变量不能完全承载行、列基层变量中所蕴含的特征信息,从而导致对称IB所得的数据双向压缩模式与基层变量所蕴含的内在模式之间存在一定的偏离.针对该问题,通过最大化地保存压缩变量与基层变量交叉之间的互信息,将基层变量引入到数据的双向压缩中,使它们协助压缩变量共同来学习联合分布中的双向压缩模式,提出交叉对称IB:ICSIB(Inter-Correlated Symmetric Information Bottleneck).ICSIB算法采用交错的顺序"抽取-合并"迭代过程来优化压缩变量与基层变量交叉之间的互信息,可保证得到目标函数的一个局部优解.实验结果表明,在基层特征变量的协助下,ICSIB算法得到的数据双向压缩模式更接近于数据中真实的内在模式,并可有效地应用于数据的联合聚类中.
摘要:随着社交网络服务的快速发展及增长,理解网络用户之间潜在的影响力的传播过程,能够帮助用户更好地理解网络结构的动态演化,以及不同的信息对于人与人之间社会关系的影响作用.现有的影响力传播相关的研究工作主要集中在给定静态社交网络结构,分析用户之间的影响力传播,找出最具有影响力的用户子集.然而大部分已有工作都忽略了社交网络中的内容信息,即用户之间的影响力作用是与用户产生内容紧密相关的.该文提出了一种融合内容信息和社交网络动态时间特性的潜在影响力传播模型InfoIBP(Influence propagation on Indian Buffet Process).网络中有影响力的用户被看作是一种潜在的特征,可通过不同采样算法和数值逼近求解出来.而对于网络动态时间特性,借助于隐马尔可夫模型来建模不同时间步上的影响力传播过程.在数据集DBLP和Digg上的一系列链接预测、偏好预测和运行时间评测等实验,证明了所提InfoIBP模型能够更准确地建模潜在的影响力传播过程,更有效地挖掘出社交网络中的有影响力用户及更全面地描述网络的动态时间特性,并能对未来的观测数据做出相对精准的预测.
摘要:数据流中可能包含大量的无用信息或者噪声,频繁模式挖掘可以去除这些无用信息,且频繁模式比单个属性包含了更多的信息.因此,挖掘频繁的、有区分力的模式,可以用于有效的分类.该文提出一个两步骤算法PatHT(Pattern-based Hoeffding Tree)生成决策树用于可变数据流分类.第一步,设计增量更新算法CCFPM(Constraintsbased and Closed Frequent Pattern Mining),用于生成闭合约束频繁模式集合CFPSet(Closed Frequent Pattern Set).CCFPM中采用滑动窗口模型和时间衰减模型处理实例,设计一种均值衰减因子设置方法得到高完整性和准确性的模式集合.第二步,增量更新方法 HTreeGrow(Hoeffding Tree Growing)生成基于CFPSet的概念漂移决策树.该方法使用概念漂移检测器监督概念改变,自动调整分类模型.针对高密度和低密度的数据流,设计了不同使用模式集合的方法.在真实和模拟数据流上的实验分析表明,与其他同类算法相比,提出的方法对稳态数据流处理时可以明显提高正确率或可以明显降低训练时间,在处理不同概念漂移特性的可变数据流时也具有很好的分类效果.
摘要:内部用户行为分析是系统安全领域中一个重要的研究问题.近期的工作主要集中在用户单域行为的单一模式分析技术,同时依赖于领域知识和用户背景,不适用于多检测域场景.文中提出一种新的用户跨域行为模式分析方法.该方法能够分析用户行为的多元模式.此外,该方法是完全数据驱动的方法,不需要依赖相关领域知识和用户背景属性.最后作者基于文中的用户行为模式分析方法设计了一种面向内部攻击的检测方法.在实验中,作者使用文中方法分析了真实场景中的5种用户审计日志,实验结果验证了文中分析方法在多检测域场景中分析用户行为多元模式的有效性,同时文中检测方法优于两种已有方法:单域检测方法和基于单一行为模式的检测方法.
摘要:该文研究了从不确定图上挖掘top-k稠密子图的问题.由于图数据具有内生不确定性,确定图上稠密子图的定义和挖掘算法在不确定图上均不适用.因此,该文提出了不确定图上期望稠密度的概念,并给出了其在多项式时间内的计算方法.基于此,该文定义了不确定图中导出子图之间的一种偏序关系.利用该偏序关系,将不确定图中的导出子图有效地组织成一棵搜索树.该文严格证明了此搜索树中可以完整无重复地覆盖不确定图上的所有导出子图.据此,该文提出了针对此搜索树的一种分支界限搜索算法DS,用于精确挖掘top-k稠密子图.该文还提出了不相交top-k稠密子图的概念,并给出了一种基于束搜索的启发式近似搜索算法LS.在多组数据集上的实验结果表明,文中提出的DS算法具有很高的效率和很好的扩展性,可用于处理大规模图数据.启发式近似搜索算法LS可以快速发现不相交top-k稠密子图.
摘要:该文将深度学习用于遥感图像融合,在训练深度网络时加入了结构风险最小化的损失函数,提出了一种基于深度支撑值学习网络的融合方法.为了避免图像融合过程中的信息损失,在传统卷积神经网络的基础上,取消了特征映射层的下采样过程,构建了深度支撑值学习网络(Deep Support Value Learning Networks,DSVL Nets),DSVL Nets网络模型包含5个隐藏层,每一层的基本结构由卷积层和线性层构成,该基本单元提供了一种多尺度、多方向、各向异性、非下采样的冗余变换,该模型在网络训练完毕之后,取出各卷积层和第5个隐藏层的线性层作为网络模型的输出层.输出层的各卷积层图像融合采用绝对值取大法,得到融合后的各卷积层图像;另外,将线性层图像分别在过完备字典上进行稀疏表示,并对稀疏系数采用绝对值取大法进行融合,得到融合后的线性层图像;最后将融合后的各卷积层和线性层图像重构得到结果图像.文中使用QuickBird和Geoeye卫星数据验证本文所提方法的有效性,实验结果表明,与PCA、AWLP、PN-TSSC和SVT算法相比较,该文所提方法的融合结果无论在主观视觉还是客观评价指标上均优于对比算法,较好地保持了图像的光谱信息和空间信息.
摘要:利用稀疏化学习得到的概率图模型结构简单却保留了原始概率图模型中重要的结构信息,且能同时实现结构和参数学习,因此近几年来概率图模型的稀疏化学习一直是研究的热点,其中概率图模型的第一种稀疏化学习方法是图套索.文中总结了概率图模型的稀疏化学习方法,包括概率图模型的L1范数罚稀疏化学习、概率图模型的无偏稀疏化学习、概率图模型的结构稀疏化学习和概率图模型的多任务稀疏化学习.最后,文中还指出了概率图模型的稀疏化学习未来有意义的研究方向.
摘要:具有连续属性的分类问题普遍存在,目前主要采用两种方法来处理连续属性:一种是将连续属性进行离散化;另一种是基于高斯函数或高斯核函数来估计属性密度.连续属性的离散化可能导致信息丢失、引入噪声和类对属性的变化不够敏感等问题,而高斯函数和高斯核函数在属性密度估计中各有优势与不足,但它们具有很强的互补性.该文依据Copula和贝叶斯网络理论,结合高斯Copula密度函数、引入平滑参数的高斯核函数和以分类准确性为标准的属性父结点贪婪选择,建立连续属性约束贝叶斯网络分类器,既可以避免连续属性离散化所带来的问题,又能够实现高斯函数和高斯核函数在属性密度估计方面的优势互补.分别采用真实数据和模拟数据进行实验,结果显示,使用结合边缘高斯核函数的高斯Copula估计属性密度的约束贝叶斯网络分类器具有良好的分类准确性.
摘要:该文针对移动互联网在线视频服务个性化视频推荐问题,提出了一种基于深度学习(Deep learning)模型的内容推荐策略.深度学习在图像、语音和自然语言处理等领域获得的突破性进展,为在线视频服务的推荐策略研究提供了基础.该文工作通过在传统基于内容推荐的基础上,引入深度神经网络(Deep Neural Network,DNN)词向量方法,根据视频的媒资信息和用户的历史行为,将视频特征和用户特征映射在高维向量空间.在构建用户正负行为与视频向量的余弦距离模型基础上,筛选过滤对所推荐视频感兴趣的用户群,并通过移动互联网应用的消息推送功能提示移动终端用户观看所推荐的内容.基于在大规模移动视频服务系统中的离线和在线实验,该文所提出的基于DNN算法的推荐策略,相比随机方法、ContentKNN以及ItemCF等算法,在点击率方面平均分别获得106%、41%和57%的相对提升,在覆盖率方面一定程度上避免了推送活跃用户的偏颇问题,从整体上得到了较好的推荐效果.
摘要:行人再识别是一个有着非常重要现实意义的研究问题,它可以应用于刑事侦查、在公共场所中寻找丢失的小孩、个人相册管理以及电子商务等领域.同时由于光照、视角、人的姿态以及背景的变化,同一个人的表观在不同的监控视频中往往变化很大,解决行人再识别问题也非常有挑战性.在设计行人再识别算法时,给定行人图像的特征,考虑到不同的特征分量具有不同的区分能力,学习合适的相似度度量非常重要.度量学习是一类学习相似度度量的主流算法,这些算法通过学习一个马氏距离相似度函数(Mahalanobis Similarity Function,MSF)来估计一对行人图像的相似度.然而MSF只与特征差分空间有关,忽略了一对图像中每个个体的表观特征,对于同一个人在不同场景中很大的表观变化的捕捉能力有限.为了加强相似度函数与每个个体的表观特征的联系,该文提出通过学习一个二次相似度函数(Quadratic Similarity Function,QSF),来估计一对行人图像的相似度.QSF是MSF的泛化形式,不但描述了一对行人图像的互相关关系,而且关联了一对行人图像的自相关关系,可以更好地捕捉同一个人在不同监控视频中很大的表观变化.为了学习QSF,该文分别从分类和排序的角度出发,设计两种不同的优化目标,提出了两种不同的学习QSF的算法.由行人再识别的公共数据集VIPeR和CUHK的实验表明,这两种不同的算法都可以学习到有效的QSF,识别性能优于已有的行人再识别算法.
摘要:语义记忆是人类理解自然语言的基础.人类理解语言的过程可以看作是对词义进行编码、对语义记忆进行检索,进而对词义进行解码的过程.因此,对词义进行合理地表示是计算机理解语言的关键步骤.该文总结分析了已有的词义表示方法与人脑词义表征的关系,针对汉语词汇的歧义现象,重点阐述了如何从歧义词所处的上下文中最大限度地自动获取关于歧义词的词义信息,并将这些信息整合,通过一系列的特征集合表示歧义词的词义.具体地说,该文将出现在歧义词上下文语境中有明确含义的实词作为模型的输入,同时在上下文中获取可以表示歧义词词义的其他特征,最终将这两种信息通过贝叶斯概率模型整合在一起,共同实现歧义词的词义表示和归纳.实验表明,该文提出的方法可以得到更好的词义表示和归纳效果.
摘要:作为一种图的相似性度量,图核已经被提出用于计算脑网络的相似性,并用于分类一些脑疾病,如阿尔茨海默病(Alzheimer’s Disease,AD)以及它的早期阶段,即轻度认知功能障碍(Mild Cognitive Impairment,MCI).然而,已有图核主要面向一般图而构建,从而忽略了脑网络自身特有的特性,如节点的唯一性(即每个节点对应着唯一的脑区),这可能影响到脑网络分析(分类)性能.为了解决这个问题,构建一种面向脑网络的图核,用于测量一对脑网络的相似性.具体而言就是:首先,以网络中每一个节点为中心,构建一组子网络来反映网络的局部多层次拓扑特性.而后,利用节点的唯一性,构建测量每对子网组之间相似性函数,从而获得用于测量一对脑网络的相似性的图核.不同于已有的图核,提出的图核充分考虑到脑网络自身特有的特性,以及保留了脑网络局部连接特性.在两个真实的MCI数据集上,实验结果表明,相对于现阶段的图核,文中提出的图核能够显著提高分类的性能.
摘要:超扩展规则是对扩展规则的扩充,基于超扩展规则能够求得任意两个非互补且不相互蕴含的子句所能扩展出极大项集的交集与差集,并将所得结果以EPCCL理论的形式保存.该文首次提出了扩展反驳方法,是一种新型推理方法,并在该推理方法与知识编译之间建立了联系.基于超扩展规则的性质,该文还提出了两种知识编译算法:求并知识编译算法UKCHER和求差知识编译算法DKCHER,是两种新的知识编译算法.算法UKCHER是目前为止唯一一个可并行的EPCCL理论编译算法,算法DKCHER对于相变点附近的难解问题具有较高的编译效率和编译质量.实验结果表明:UKCHER算法的编译效率和编译质量均优于Lin等人提出的KCER算法;当子句数和变量数的比值较大时,DKCHER算法的编译效率和编译质量是最优的,相比于现有EPCCL理论编译算法,该算法具有较强的竞争力.
摘要:作为联接主义智能实现的典范,神经网络采用广泛互联的结构与有效的学习机制来模拟人脑信息处理的过程,是人工智能发展中的重要方法,也是当前类脑智能研究中的有效工具.在七十年的发展历程中,神经网络曾历经质疑、批判与冷落,同时也几度繁荣并取得了许多瞩目的成就.从20世纪40年代的M-P神经元和Hebb学习规则,到50年代的Hodykin-Huxley方程、感知器模型与自适应滤波器,再到60年代的自组织映射网络、神经认知机、自适应共振网络,许多神经计算模型都发展成为信号处理、计算机视觉、自然语言处理与优化计算等领域的经典方法,为该领域带来了里程碑式的影响.目前,模拟人脑复杂的层次化认知特点的深度学习已经成为类脑智能中的一个重要研究方向.通过增加网络层数所构造的"深层神经网络"使机器能够获得"抽象概念"能力,在诸多领域都取得了巨大的成功,又掀起了神经网络研究的一个新高潮.文中回顾了神经网络的发展历程,综述了其当前研究进展以及存在的问题,展望了未来神经网络的发展方向.