计算机研究与发展杂志-2013年第09期-学术点评

计算机研究与发展 2013年第09期杂志文档列表

计算机研究与发展杂志专辑：人工智能进展

前言

摘要：近年来，人工智能的发展日新月异，已经逐渐渗透到人们的日常生活之中，例如人工智能技术以搜索引擎为载体，使人们搜寻信息的效率大为提高；以推荐系统为载体，使信息从等待被动搜索的状态转入主动为人所用的过程；以机器翻译系统为载体，提高了人类信息交流的便利和广度；以无人驾驶装置为载体，有望改变人类未来交通的模式……．特别是随着人类进入大数据时代，人工智能技术尤其是其重要分支机器学习，逐渐成为计算机科学技术中的一个基础支撑领域，并成为大数据分析与利用不可缺少的关键技术之一．另一方面，人工智能应用范围的扩大和普及也推动了人工智能的研究，目前国内外对于人工智能的研究进入了一个活跃期．为此，《计算机研究与发展》推出了人工智能进展专辑，希望借此反映我国人工智能学者关心的相关学术问题和进展．

1797-1798

计算机研究与发展杂志大数据分析

深度学习的昨天、今天和明天

摘要：机器学习是人工智能领域的一个重要学科．自从20世纪80年代以来，机器学习在算法、理论和应用等方面都获得巨大成功．2006年以来，机器学习领域中一个叫“深度学习”的课题开始受到学术界广泛关注，’到今天已经成为互联网大数据和人工智能的一个热潮．深度学习通过建立类似于人脑的分层模型结构，对输入数据逐级提取从底层到高层的特征，从而能很好地建立从底层信号到高层语义的映射关系．近年来，谷歌、微软、IBM、百度等拥有大数据的高科技公司相继投入大量资源进行深度学习技术研发，在语音、图像、自然语言、在线广告等领域取得显著进展．从对实际应用的贡献来说，深度学习可能是机器学习领域最近这十年来最成功的研究方向．将对深度学习发展的过去和现在做一个全景式的介绍，并讨论深度学习所面临的挑战，以及将来的可能方向．

1799-1804

一种信任关系强度敏感的社会化推荐算法

摘要：为了进一步提高推荐算法的准确率，更好地对用户间的信任关系进行建模，首先提出了一种信任关系强度敏感的社会化推荐算法（StrengthMF）．与以往的算法相比，该算法假设建立信任关系的两个用户之间并不一定存在着相似的兴趣爱好．在推荐过程中，StrengthMF算法通过共享的潜在用户特征空间来对信任关系强度和用户兴趣进行建模，通过进一步识别出那些与目标用户有着共同爱好的朋友来对求解的过程进行优化．为了验证算法所估计出的信任关系强度的准确性，接着又在SocialMF算法的基础上，提出了一种使用所估计的信任关系对其重新训练和学习的InfluenceMF算法．实验结果表明，与目前较为流行的方法相比，新方法能在RMSE和MAE上取得更好的推荐结果，其所推导出的信任关系强度能进一步提高已有推荐算法的性能．

1805-1813

一种由长尾分布约束的推荐方法

摘要：由于在线商品销售的长尾效应，冷门商品的总销量非常巨大，因而对冷门商品的推荐十分重要，然而由于对冷门商品的评价数量少，导致现存的推荐算法对其推荐权重接均推荐权重，所以很难使用户关注冷门商品，影响了冷门商品的销售，因此合理地提高冷门商品的推荐权重十分重要．提出一种由长尾分布约束的推荐方法（long tail distribution constrained recommendation method，I。TDCR），由用户行为的相似度确定用户间相似关系，并应用不信任关系约束用户相似关系的传播，通过长尾分布约束由用户间相似关系计算的推荐权重，并给出一种精确描述长尾分布的方法．在包含大量冷门商品的数据集的实验结果表明，LTDCR在训练集较小的情况下，有效地提高了对冷门商品的推荐效果．

1814-1824

基于弱监督学习的海量网络数据关系抽取

摘要：在大数据时代，对于海量网络数据的信息抽取与应用已成为自然语言处理和信息检索技术发展的重要主题．其中，基于弱监督的关系抽取方法，因为具有不需要过多人工参与、适应性强的特点，受到了广泛的关注．目前针对它的研究主要集中在英语资源上，主要使用传统的词法和句法特征．然而，词法特征有严重的稀疏性问题，句法特征则对一些语言分析工具的性能有较强的依赖性．提出利用n—gram特征来缓解传统词法特征稀疏性的问题．特别地，这种特征还可以弥补传统句法特征在其他语言上不可靠的情况，对于关系抽取的跨语言应用有重要作用．在此基础上，针对弱监督学中标注数据不完全可靠的情况，提出基于bootstrapping思想的协同训练方法来对弱监督关系抽取模型进行强化，并且对预测关系时的协同策略进行了详细分析．在大规模的中文和英文数据上进行实验的结果显示，把传统特征与n-gram特征相结合并进行协同训练，在中文和英文数据集上均可以提升弱监督关系抽取的效果，可以适应多语言的关系抽取需求．

1825-1835

球向量机的快速在线学习

摘要：在大数据分析处理中，有效学习样本逐渐增加，据此如何高效渐进地学习分类器是一个非常有价值的问题．相比于支撑向量机和核向量机，球向量机自身在批量样本学习中具有速度快、准确率高的特点，但该方法不适合快速的在线学习．针对该问题提出了在线球向量机．首先将二分类问题转为两个单分类问题，利用球向量机（ball vector machine，BVM）对超球球心的更新算法对每一个训练向量仅迭代一次，求得两个高维超球的球心，随后直接利用两个高维超球球心的垂直平分面进行分类．理论分析证明了新方法的有效性，与现有在线增量学习方法的实验比较结果表明，在线球向量机（online ball vector machine，OBVM）在时间计算复杂度和综合性能方面有显著优势．

1836-1842

基于多Web信息源的主题概念网络获取

摘要：Wikipedia一方面能够提供关于特定百科条目的概念性描述；另一方面，也通过分类系统将这些百科条目组织成一个概念网络．它对信息的广泛覆盖和有效组织使其成为了自动化知识获取的常用信源．然而，仅仅依靠Wikipedia自身的信息，还不足以准确地刻画其内部概念间的关联性知识，而这是符号化知识表述的一个重要组成部分．因此，提出了一种基于多web信息源的主题概念网络获取方法。它以Wikipedia的分类系统为基础，同时利用搜索引擎收集相关的web信息作为关联性知识验证和发现的参照系，并通过集成信息检索和自然语言处理等领域的方法，实现了以给定的主题词为核心，在Wikipedia分类系统对应的概念网络中获取面向该主题的概念网络，同时网络内的概念间关系得到识别和标注．我们基于不同领域的主题词进行了实验，对实验结果的经验性评估展示了所获取的主题概念网络既能满足面向主题的要求，其内部的概念关联性知识又具备了一定的精度要求．

1843-1854

计算机研究与发展杂志机器学习及应用

正则化路径上三步式SVM贝叶斯组合

摘要：模型组合旨在整合并利用假设空间中多个模型提高学习系统的稳定性和泛化性．针对支持向量机（support vector machine，SVM）模型组合多采用基于样本采样方法构造候选模型集的现状，研究基于正则化路径的SVM模型纽合．首先证明SVM模型组合Lh-风险一致性，给出SVM模型组合基于样本的合理性解释．然后提出正则化路径上的三步式SVM贝叶斯组合方法．利用SVM正则化路径分段线性性质构建初始模型集，并应用平均广义近似交叉验证（generalized approximate cross—validation，GACV）模型集修剪策略获得候选模型集．测试或预测阶段，应用最小近邻法确定输入敏感的最终组合模型集，并实现贝叶斯组合预测．与基于样本采样方法不同，三步式SVM贝叶斯组合方法基于正则化路径在整个样本集上构造模型集，训练过程易于实现，计算效率较高．模型集修剪策略可减小模型集规模，提高计算效率和预测性能．实验结果验证了正则化路径上三步式SVM模型组合的有效性．

1855-1864

基于IB方法的无冗余多视角聚类

摘要：针对数据中多视角模式挖掘的问题，提出一个基于IB方法的无冗余多视角聚类算法：NrMIB．该算法一方面采用IB思想来最大化地保存聚类结果中的信息量，以确保高质量的聚类结果；另一方面通过最小化聚类结果与已知数据划分模式间的互信息来确保新的聚类结果相对于已知划分模式是无冗余的．NrMIB算法既适宜于分析共现数据，又适宜于分析欧氏空间非共现数据，可挖掘出数据中线性及非线性可分模式，无需额外参数来估算欧氏空间的信息量．在人工构造数据模式识别、人脸识别和文档聚类上的实验结果表明，NrMIB算法可有效地挖掘出数据中所蕴含的多个合理划分模式，性能优于传统单视角聚类算法及3个现有的无冗余多视角聚类算法．

1865-1875

加权的自适应相似度度量

摘要：聚类分析是数据挖掘中一种非常重要的技术．聚类算法中的关键问题是相异度或相似度的度量，聚类结果直接依赖于相异度或相似度度量，尤其对于谱聚类方法更是如此．谱聚类算法是近期兴起的一种基于相似度矩阵的聚类算法．相比于传统的划分型聚类算法，谱聚类算法不受限于球状聚类簇，能够发现不规则形状的聚类簇．在已有的谱聚类算法中，高斯核相似度是最常用的相似度度量准则．基于高斯核相似度度量及其扩展形式，提出了一种加权的自适应的相似度度量，此相似度可以用于谱聚类以及其他基于相似度矩阵的聚类算法．新的相似度度量不仅能够描述多密度聚类簇中数据点间的相似度，而且可以降低离群点（噪声点）与其他数据点间的相似度．实验结果显示新的相似度度量可以更好地描述不同类型的数据集中数据点间的相似度，进而得到更好的聚类结果．

1876-1882

基于特征比的平面目标识别

摘要：模式识别是人工智能研究领域的一项重要课题，对于目标物在射影变换、仿射变换下的识别，尤其是严重变形情况下的识别和匹配更是该领域的研究热点和难点．针对仿射变换下的平面目标识别问题，提出了一种新的几何特征不变量——特征比，并以此为基础构造了一种新的仿射不变图像特征描述符．该描述符通过构造一系列与目标图像相交的直线，将图像用一系列共线点的位置关系进行表示．进而，将点的位置关系转化为特征比并表示成一系列的特征比谱；最后，通过动态时间规整（dynamic time warping，DTW）算法比较特征比谱间的距离得出图像间的相关性，从而进行目标识别．实验表明，该算法不仅对严重的仿射变形有较高的识别率，对相似度较高的图像也有很好的区分效果．

1883-1892

基于无参数形状检测子和DT—CWT的交通标志识别

摘要：针对车辆行驶环境中难以检测的交通标志，提出了一种检测和识别方法．首先分割交通标志的特征颜色区域，并扩展感兴趣区域，提取区域边缘．然后用直线分割和杂点去除粗略划分边缘，根据直线间顶点处的曲率关系，计算转向角并分类顶点的类型，用无参数形状检测子来检测图像中的圆形、三角形和矩形等．将检测到的候选区域送入形状分类器中，分类形状并排除杂质的干扰，最后通过二元树复小波变换和二维独立分量分析相结合来识别交通标志类型．实验结果表明提出的方法对交通标志被遮挡、光照不均匀、颜色部分失真的情况下，检测率和识别率均较高，并且可以达到实时处理的效果．

1893-1901

一种面向目标检测的部件学习方法

摘要：基于部件的目标检测模型主要研究如何利用部件获得目标的局部判别特征，而极少关注部件形式及选取策略对检测性能的影响．首先从特征学习的角度分析了部件选取策略对学习弱部件模型的影响，提出了一种自适应的部件学习方法．该方法无须部件层标注，在搜索判别部件的同时利用样本自身的图像分布特点自动定位到语义相关的部件，从而保证特征学习的判别性和有效性．其次，针对训练集的标注样本经常存在不完整或部分遮挡等事实，提出了一种简单有效的部件剪技策略以降低噪声部件的比例．实验面向PASCAI。VOC2007]2010数据集评估了4种形式的部件模型．实验结果验证了自适应部件学习算法在模型检测上的有效性，同时表明了弱部件模型经过剪技策略优化后具有更快的学习收敛性．

1902-1913

基于手指静脉和手指轮廓的个性化融合方法

摘要：近年来手指静脉识别成为一种有前途的身份验证技术．采集图像时，手指的姿势或光照的变化会严重影响算法的性能．多生物特征识别可以在一定程度上克服这些限制，提高识别性能．相比其他的生物特征融合，手指静脉和手指轮廓融合的优点是采集图像比较方便，只需要手指静脉采集设备即可获得这两种生物特征的图像．基于此，提出了一种基于手指静脉和手指轮廓的个性化加权融合识别方法．首先根据原始得分对样本进行分类，然后依据分类结果求得样本的分类置信度得分．相比原始得分，分类置信度得分加入了分类信息，能够为后面的融合提供更多的有效信息．最后，为了体现个体之间的差异，使用个性化权重将分类置信度得分进行融合．在自建数据库上的实验结果验证了该方法的有效性．

1914-1923

基于零空间核判别分析的人脸识别

摘要：提取有效特征对高维数据的模式分类起着关键作用．零空间线性判别分析（null—space linear discriminant analysis，NLDA）在数据降维和特征提取上表现出较好的性能，但是该方法本质上仍是一种线性方法．为有效提取数据的非线性特征，提出了零空间核判别分析算法（nuli—space kernel discriminant analysis，NKDA）并将其应用于人脸识别．利用核函数将原始样本隐式地映射到高维特征空间后，采用一次瘦QR分解求核类内散布矩阵的零空间鉴别矢量集，最后再进行一次Cholesky分解求得具正交性的核空间鉴别矢量集．与NLDA相比，NKDA具有更好的识别性能且在大样本情况下也能应用．另外，基于NKDA，提出了增量NKDA算法，当增加新的训练样本时能正确地更新NKDA鉴别矢量集．在ORI．库、Yale库和PIE子库上的实验结果表明了算法的有效性和效率，在有效降维的同时能进一步提高鉴别能力．

1924-1932

基于高阶马尔可夫随机场的图像分割

摘要：图像分割是个病态问题，精确化的图像分割需要用户提供足够多的约束信息才能实现．近年来随着马尔可夫随机场吉布斯能量函数最小化图割求解技术的突破，许多国外研究人员开展基于图割方法的交互式图像分割技术的研究．在众多交互式图像分割技术中，由于用户友好性和潜在应用价值，采用矩形框约束的交互式图像分割方法非常吸引人．从超像素马尔可夫随机场模型和网格马尔可夫随机场模型出发，在吉布斯能量函数中引入高阶势能项，高阶势能项的引入使得新的模型既能捕捉细粒度的单个像素信息又能捕捉单像素一定范围内的关联信息，从而提高了矩形框限制条件下的图像分割性能．实验表明：与GrabCut算法相比，所提算法准确性上有一定提高．最后，将所提算法应用在视频对象分割上也取得了不错的效果．

1933-1942

一种面向多文本集的部分比较性LDA模型

摘要：跨时空、跨文化文本挖掘等比较性文本挖掘（comparative text mining，CTM）旨在从多个可比的文本集中发现各文本集隐含语义结构的异同．针对当前主要的CTM模型只能分析公共话题的缺陷，提出一种部分比较性跨文本集I。DA模型（partial comparative cross collections LDA modeI，PCCLDA）来实现跨文本集的话题分析，该模型通过层次狄利克雷过程（hierarchical Dirichlet processes，HDP）把话题划分为公共话题和文本集特有话题，使模型能更加精确地对文本进行建模．模型采用Gibbs抽样方法进行参数推导，一系列包括Held一0ut数据对数似然和模型困惑度指标在内的定量与定性的实验表明，模型不仅能够发现公共话题在不同文本集中的差异，而且能分析各文本集特有的话题；在Held—Out对数似然测度和模型困惑度指标上，PcCLDA相对当前两个主要的CTM模型具有较大的优势．

1943-1953

计算机研究与发展杂志知识表示和推理

智能世界的建模与诊断

摘要：统一的抽象建模框架以及形式化表示可以帮助实现自动推理．随着物联网技术的发展，物理世界中嵌入了各种智能对象，改变了物理世界的部分特征，增加了建模和推理的复杂性．根据物联网带来的智能世界的特征，在知识重构与抽象模型（KRA模型）的统一建模框架基础上，提出了可区分的知识重构与抽象模型（dKRA模型）．该模型通过3个相互关联的子模型及其之间的关系来表示智能世界，并给出相关定义和定理说明在所提出的模型框架内，可以将基于模型的诊断过程限制在一个（或多个）子模型中．研究内容侧重于系统设计阶段的模型验证，分别从理论和实验角度分析了基于智能世界dKRA模型的诊断过程时间效率的提高（与基于智能世界KRA模型的诊断过程相比）．

1954-1962

计算机研究与发展杂志

期刊咨询

期刊推荐

文秘服务

计算机研究与发展 2013年第09期杂志文档列表

计算机研究与发展杂志

期刊咨询

期刊推荐

文秘服务

计算机研究与发展 2013年第09期杂志 文档列表

计算机研究与发展 2013年第09期杂志文档列表