计算机学报杂志社
分享到:
《计算机学报》杂志在全国影响力巨大,创刊于1978年,公开发行的月刊杂志。创刊以来,办刊质量和水平不断提高,主要栏目设置有:研究论文与技术报告、短文、学术通信、学术活动、中国计算机学会学术动态等。
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会;中国科学院计算技术研究所
  • 国际刊号:0254-4164
  • 国内刊号:11-1826/TP
  • 出版地方:北京
  • 邮发代号:2-833
  • 创刊时间:1978
  • 发行周期:月刊
  • 期刊开本:A4
  • 复合影响因子:3.18
  • 综合影响因子:2.580
相关期刊
服务介绍

计算机学报 2014年第06期杂志 文档列表

计算机学报杂志图形图像与虚拟现实

图像物体分类与检测算法综述

摘要:图像物体分类与检测是计算机视觉研究中的两个重要的基本问题,也是图像分割、物体跟踪、行为分析等其他高层视觉任务的基础.该文从物体分类与检测问题的基本定义出发,首先从实例、类别、语义三个层次对物体分类与检测研究中存在的困难与挑战进行了阐述.接下来,该文以物体检测和分类方面的典型数据库和国际视觉算法竞赛PASCAL VOC竞赛为主线对近年来物体分类与检测的发展脉络进行了梳理与总结,指出表达学习和结构学习在于物体分类与检测中占有重要的地位.最后文中对物体分类与检测的发展方向进行了思考和讨论,探讨了图像物体识别中下一步研究可能的方向.
1225-1240

基于加权相似性度量的脑MR图像特定组织分割

摘要:基于多图谱的分割方法能有效解决脑MR图像中特定对象如海马体、杏仁核等组织的自动精确分割问题.为加快处理速度,该方法需要从大型图谱数据集中挑选与目标分割图像比较近似的若干图谱作为分割参考.传统的多图谱分割方法在选择图谱时通常只依据图谱图像与目标图像在灰度上的相似性,没有考虑到两者在分割对象局部形态上的相似性,使得所选择的图谱对分割的参考价值难以保证.针对这一问题,文中提出一种图谱图像与目标图像的以分割对象为中心的加权相似性度量方法,首先通过将图谱图像向目标图像作全局配准得到分割对象在目标图像中的估计位置,然后根据分割对象在两幅图像间的局部扭曲形变来度量它们的相似性.文中将这种加权相似度应用到多图谱分割方法中,在图谱选择时只挑选与目标图像具有较高加权相似度的部分图谱,在融合分割标记时将加权相似度作为权重.对IBSR脑MR图像中豆状核壳核组织的分割实验结果表明,基于该加权相似性度量的多图谱分割方法可以得到较高的分割精度.
1241-1250

基于稀疏编码多尺度空间潜在语义分析的图像分类

摘要:传统潜在语义分析方法无法利用图像中区域语义构成的上下文信息来获得图像目标空间分布信息,因此它丢掉了局部特征之间的空间关系信息.而基于最近邻矢量量化来构造共生矩阵具有较大的量化误差,使得特征描述缺乏鲁棒性,影响后续潜在语义分析获得特征的精确性.为了弥补这些不足,文中提出了一种基于稀疏编码的多尺度空间潜在语义分析的图像分类方法.首先通过空间金字塔方法对图像进行空间多尺度划分,然后利用稀疏编码对每个局部块特征进行软量化以形成共生矩阵,之后结合概率潜在语义分析(PLSA)获得每个局部块的潜在语义信息,再利用权值串接每个特定局部块中的语义信息得到图像多尺度空间潜在语义信息,最后用支持向量机(SVM)分类器完成图像的场景分类.在常见图像库上的实验表明,本文提出的基于稀疏编码的多尺度空间潜在语义分析方法平均分类精度比现有诸多方法均有明显提高,验证了其有效性和鲁棒性.实验还表明,空间金字塔匹配、稀疏编码共生矩阵以及PLSA降维这3个模块在该文方法中缺一不可,共同提升图像表征和分类性能.
1251-1260

一种基于Google的OCR结果校对新方法

摘要:为了提高OCR识别率,许多校对算法被提出用作后处理.这些方法利用自然语言规律统计大量的语料库进行语法判断.由于语料库规模有限且无法及时更新,导致一些网络新词、专用名词等常被错误处理.为此,文中将传统的语料库和Google知识库相结合,利用Google知识库获得网络新词等出现的频率,建立N Gram模型,利用词语间的接续关系进行查错,再借助Google的拼写校对功能和词语之间的可信度进行改错.相比传统的方法,该方法的语料库源于互联网,对一些新词有更好的校对效果,更适合图像中嵌入的文字信息识别结果的校正.
1261-1267

利用回放场景和情感激励检测足球视频精彩镜头

摘要:足球视频精彩镜头的检测和语义识别是实现基于内容的足球视频检索的关键技术之一,具有很高的学术价值和广泛的应用前景.文中改进了现有的回放场景和球门检测方法,通过回放因子特征的构造改进了情感激励模型的事件检测性能.针对不同用户的观看需求,给出3种不同粒度的精彩镜头边界.对足球视频中进球、射门和犯规事件的特点进行了分析,基于事件规则实现了这3类事件的语义识别.实验结果表明,加入了回放场景特征的情感激励曲线可以更精确地反应足球比赛的激烈情况.对于语义事件的识别,特别是对进球事件的识别具有较高的准确率和查全率.
1268-1280

基于特征点轨迹的动作识别

摘要:文中提出一种基于时空特征点轨迹的动作识别方法.首先为了克服局部时空特征时间信息缺失的问题,该方法采用KLT跟踪器对时空局部特征进行跟踪,将得到的时空特征跟踪轨迹作为基本的处理、描述单元.与局部时空特征相比,它能在更长的时间尺度上对运动进行描述,进而更好地捕获运动的动态变化与转变过程.其次在时空特征轨迹基础上,该方法提出了轨迹相对位置、相对速度关系元来对轨迹之间的关系进行建模.对轨迹之间的关系进行建模有助于捕获不同动作在特征分布上存在的一些比较稳定的模式.最后利用多核学习方法融合多种特征来训练动作分类器.在交互动作数据库上对提出的方法进行了实验,实验结果证明了方法的有效性.
1281-1288

主动式三维立体全景视觉传感技术

摘要:为了使全方位视觉传感器(Omni Directional Vision Sensor,ODVS)获取的全景图像上各像素本身具有成像物点的深度信息,文中设计了一种具有单发射中心点(Single Emission Point,SEP)的全景彩色体结构光发生器(Panoramic Color Structured Light Generator,PCSLG)以配合具有单视点(Single View Point,SVP)成像特点的ODVS;然后将ODVS和PCSLG垂直配置在同一轴心线上,实现一种主动式立体全景视觉传感器(Active Stereo Omni-Directional Vision Sensor,ASODVS);最后根据全景图像上各像素点所带光源的颜色信息,通过颜色识别算法以及ODVS和PCSLG的几何关系推断PCSLG的发射角并估算成像物点的深度值.实验结果表明,该文设计的ASODVS能快速实时进行全景立体图像的特征点实时匹配和空间物点深度的测量,实现了一种以观察者为中心的3D主动立体视觉感知.
1289-1300

布朗运动模拟退火算法

摘要:针对传统模拟退火算法计算效率较低的问题,文中将布朗运动和模拟退火相结合,提出一种智能启发式算法.该算法将布朗运动中粒子运动时间和模拟退火温度联系在一起,布朗运动的粒子运动时间等效于退火温度的倒数,通过理论分析得到基于布朗运动的邻域函数模型以及相应的温度下降函数.温度下降函数具有更快的退温特性,保证算法执行过程中具有更高的效率.数值实验结果表明,该算法具有搜索速度快、稳定性高和易于实现的特点,能显著提高求解全局优化问题的计算效率.
1301-1308

基于自然手势跟踪的直接操作型三维人机交互范式

摘要:针对自然手势单通道条件下建立统一交互模型的难点问题和关键问题,该文提出一种基于二级行为模型的3D手势跟踪和交互方法,实现了一种基于自然手势的直接操作型3D人机交互界面范式原型系统.首先,建立了二级行为模型,然后,以行为模型为基础,设计并实现了一种基于行为模型的三维人机交互界面范式.文中主要创新点在于:建立了基本手势库的二级行为模型;用“令牌环”技术捕捉用户的交互意图;建立“多选一”的交互模型;用“替身”技术解决人手模型与不同物体的抓取过程中的多样性和复杂性问题,建立了抓取和释放操作的统一范式并提出了相关算法.文中算法在多个交互型虚拟装配平台上得到了验证.实验结果表明,与现有相关算法相比较,文中算法在时间开销和跟踪精度等方面得到了明显改善.
1309-1323

基于多层增量式可扩展扇形兴趣区域的大规模DVE场景对等渐进式传输机制

摘要:为了解决在有限的互联网带宽上高效下载海量虚拟场景的“瓶颈”问题,文中针对基于对等网络(P2P)的虚拟场景渐进式传输的增量判断和场景下载源节点最优选择这两个关键点,首先将传统的兴趣域(Area of Interests,AOI)细化为兴趣扇区域(Sector of Interest,SOI),又将其提升为多层增量式可扩展兴趣扇形区域(Multi Layered & Incrementally Scalable SOI,MISSOI),给出了MISSOI的分划扩展算法,并基于MISSOI提出了一个高效的整数级SOI场景下载的拾取算法;然后设计了一个基于对等网的海量DVE场景渐进式下载框架,并给出了在P2P-DVE中快速搜索场景下载源节点以及选择最优场景下载源节点的高效算法.仿真实验结果表明作者提出的方法在可视场景下载域的拾取、下载源查询成功率和下载请求失败率等性能指标上明显好于目前主流海量虚拟场景P2PDVE传输机制FLoD,更是远优于传统的Client/Server虚拟场景传输模式.
1324-1334

一种基于断点处边缘方向保持假设的闭合轮廓提取方法

摘要:文中提出了一种新颖的闭合轮廓提取方法.分析了当GVF Snake模型处理边缘断裂的图像时,存在无法提取目标原始轮廓信息,尤其是目标边角信息的问题.在GVF外力场演化的能量模型的基础上,基于保持断点处边缘原方向的假设,提出了一种新的具有边角保持特性的能量模型,由此模型得到了边角保持GVF(CP-GVF)外力场.CP-GVF外力场解决了当目标轮廓发生断裂时断点对于GVF外力场的影响问题,能够根据断点处的边缘方向信息,以保持该边缘方向的方式恢复目标轮廓中丢失的边角信息,从而恢复这类目标的原始形状.不同边缘结构的仿真图像和真实图像的实验结果验证了算法的性能.
1335-1341

基于切向约束构造复合二次B样条插值曲线

摘要:该文提出一种构造二次B样条插值曲线的新方法,包括新的参数化方法和新的插值方法.新参数化方法中,相邻曲线段的连接处与插值点相一致,以插值点的切向作为约束,利用二次B样条曲线本身的几何性质进行参数化,使曲线在每个插值点上都满足指定的切向,可以直观地控制插值曲线的形状以达到预期效果,参数化方法稳定,不必解方程组.在新参数化方法的基础上进一步提出了分段构造的思想,将形状不好的段分成多段构造,除插值点的切向外还留有其他的自由度进一步直观调控曲线的形状,使得二次B样条插值曲线的形状更自然.新方法对于数据点的改变具有良好的局部性.实例表明该方法是有效的.
1342-1351

基于软近邻投票的图像标签相关性计算

摘要:如何自动判断社会化标签与图像内容之间的相关性是社会化多媒体内容检索领域一个重要的研究问题.近邻投票算法是已知的计算标签相关性的最有效方法之一.但该算法采用硬投票策略,并未考虑近邻图像的权重以及近邻图像自身标签的质量.针对上述问题,文中提出一种一般性的软近邻投票框架,通过考察近邻权重和近邻标签权重这两个维度,系统性地比较了23种软近邻投票实现方案.以近120万张Flickr图像为训练集、约两万张图像为测试集的实验表明,软近邻投票策略要优于硬投票策略:平均查准率从0.764提升到0.783,且软近邻投票对于近邻个数这一重要参数的选取相对不敏感.
1365-1371

基于低秩矩阵恢复和联合学习的图像超分辨率重建

摘要:文中提出一种新的基于低秩矩阵恢复和联合学习的单帧图像超分辨率重建方法.首先根据相似性将训练样本块分成若干个子集合,使用低秩矩阵恢复方法学习每个子集合的潜在结构.然后使用联合学习方法同时训练出两个投影矩阵,将原始高、低分辨率图像块特征的低秩分量映射到一个统一空间中,最后在该统一空间中完成基于邻域嵌入的图像超分辨率重建.实验结果显示文中方法在数量指标和视觉效果上都优于目前几种典型的图像超分辨率重建方法.
1372-1379

基于多元统计模型的分形小波自适应图像去噪

摘要:为了克服分形小波去噪方法缺乏保护图像的边缘与细节的缺陷,文中提出了一种基于多元统计模型的分形小波自适应图像去噪算法.通过建立一个参数可以灵活改善的多元统计模型来准确地估计各种相关信息,并通过最小化残差来自适应调整模型参数;在适度的噪声方差下根据拼贴距离找出最好的子树域中的近优父子树,通过使用四叉树分割来实现对噪声图像自适应地预测分形小波无噪图像编码,从而达到去除噪声和保护图像的边缘与细节的目的.实验结果表明,该方法在去除噪声的同时,能有效地保持图像的边缘特征和保留图像的精细结构.由于采用了预测小波分形编码,优化了算法结构,算法的处理速度比较快.因此,完全可以达到实时图像处理过程中的去噪预处理对处理速度的要求.
1380-1389

基于区域上下文感知的图像标注

摘要:随着互联网的发展,网络图像指数般增长,图像理解技术变得日益重要.其中图像标注技术作为其关键技术得到广泛关注和研究.现有的图像标注技术大多是在图像层次上训练标签模型,忽略了图像区域之间的关系及其标签之间的关系.为了解决这个问题,文中提出了一种新的算法,结合区域之间的位置关系及其标签之间的共生关系辅助标注图像.具体而言,算法首先使用支持向量机对部分可确定区域赋予语义标签,然后利用区域位置关系帮助聚类标注未知区域.得到一幅图所有的区域标签后,我们提出两种模型对标签共生关系建模辅助修正标签集,一个是随机游走模型,另一个是条件随机场模型.最终算法输出每幅图像的文本标签集.在对图像集NUS WIDE的标注实验中显示,上述方法和单纯考虑区域关系的方法相比,标注效果和性能有了较好的改善,证实该方法是一种稳定、有效的标注算法.
1390-1397

基于区域边缘统计的图像特征描述新方法

摘要:直方图特征是计算机视觉领域最为常用的图像特征之一,然而空间统计信息的缺乏导致传统灰度直方图对图像特征的区分能力较差.对此,文中通过引入直方图子区间对应区域的边缘复杂度概念,提出了一种描述图像特征的区域边缘直方图方法.文章首先定义了区域边缘复杂度的概念,并提出以直方图各子区间的边缘复杂度作为空间权系数对各子区间进行加权,然后通过对加权后的直方图进行化简进而得到区域边缘直方图的简洁描述形式,最后,给出了基于积分直方图实现的快速计算方法.实验结果表明,区域边缘直方图方法对图像特征的区分能力明显优于灰度直方图,克服了空间直方图等改进方法对图像旋转的敏感性,运算效率比空间直方图提高了两个数量级以上.
1398-1410
计算机学报杂志物联网

信息-物理融合系统动态行为模型构建方法

摘要:信息物理融合系统(Cyber-Physical System,CPS)特有的计算、通信、控制的联合动态性,计算与物理的多尺度融合性,系统环境及状态的时空交互性以及系统动态行为的非确定性,不但使面向CPS的模型驱动设计与验证方法在CPS系统设计中更为重要,而且也向其提出了新的技术挑战.论文在结合典型实例分析CPS系统特征及其模型构建具体挑战的基础上,研究并总结了CPS动态行为建模的主要方法:一体化建模方法从CPS系统层面描述计算过程与物理过程的交互与融合;时空交互建模方法关注CPS系统行为与时间及空间关系的语义表示;功能和实现兼容建模方法侧重刻画CPS系统的逻辑设计和物理实现的映射与支撑;而集成建模方法则重点解决多异构模型的交互方式与语义的一致表达.论文基于多异构实体的CPS系统建模框架,提出了一种CPS系统结构与动态行为的协同建模方法,并用CPS-ADL对其进行了实现和验证.
1411-1423