发表咨询:400-808-1731
订阅咨询:400-808-1751
北大期刊
影响因子 0.51
人气 23755
北大期刊
影响因子 0.94
人气 20399
省级期刊
影响因子 0.3
人气 18182
部级期刊
影响因子 1.03
人气 13574
统计源期刊
影响因子 1.71
人气 12633
CSSCI南大期刊
影响因子 5.52
人气 12405
统计源期刊
影响因子 0.55
人气 11105
北大期刊
影响因子 0.62
人气 10773
省级期刊
影响因子 0.42
人气 10528
统计源期刊
影响因子 1.29
人气 9981
摘要:随着数字图像采集设备的普及,加之互联网技术的高速发展,海量的图像在上传并保存到互联网中.传统的图像编码方法(如JPEG和JPEG2000),可以在一定程度上压缩图像数据,但其独立压缩单幅图像的方式导致其压缩效率远远不能满足当今大数据的需求.为了更高效地压缩互联网图像数据,作者充分利用“大数据”这一挑战,提出了一种基于云数据的图像编码方法.针对上传到云数据库中的图像,算法采用“上传一幅、压缩一幅”的处理模式,有效地适应迅速变化的大数据环境.它充分利用了当前图像和云数据中其它图像之间的相关性,更加有效地对图像进行压缩编码.在该方法中,作者有3个创新性技术设计.首先,基于高效的图像检索技术,设计了一个方案对“大数据”进行筛选,仅保留与当前图像高度匹配的少部分图像数据.其次,利用这些经过选择得到的少量图像数据,进行图像间的预测编码.这一环节对于整个系统的性能非常重要.作者采用基于块匹配的预测编码和率失真优化技术,在保证图像重建质量的前提下将码率大大减少.还有,该文设计了一套对检索得到图像的预处理方案,将其变换成更为接近于当前图像的参考图像,从而提高预测准确度.作者采用投影变换技术将检索得到的图像与当前图像对齐,并通过光照补偿使得两幅图像中的匹配像素点的值尽可能接近.该文为大数据下的图像压缩提供了一个崭新的框架,可以大大节省如网络云盘中图像所占用的存储空间.相比于传统图像编码方法甚至是更为高效的HEVC帧内编码方案,该图像压缩系统都能取得明显的性能提升.实验表明:该方法对图像的压缩效率,比JPEG平均提升785%,比HEVC帧内编码提升672%.甚至相比于文献中最新的基于云的图像编码方法,该文的算法在同码率下的主观质量和客观质量都表现出明显优势.
摘要:三维模型检索已经成为虚拟现实领域的基本问题,草图是三维模型检索的最好方式,随着各种不同分辨率三维模型数据的快速增长,现有基于草图三维模型检索算法无法有效应用于大规模复杂三维模型数据库的检索.在该文中,为了解决低分辨率三维模型顶点数和面片数较少,不易获取完整光滑几何线图的问题,提出了利用高斯差分方法对三维模型深度缓存投影图像提取三维模型线图,并采用贝塞尔曲线优化线图结果.为了提高检索准确率,提出了一种局部多尺度多方向的特征计算方法,在珈伯多方向滤波的基础上,建立了局部形状金字塔尺度空间结构,配合梯度方向直方图计算局部形状特征描述,并利用词袋方法组织局部形状特征.为了提高检索速度,利用加权索引方法存储归一化后的图像特征向量,实现基于草图的三维模型实时检索过程.该文不仅比较分析了不同参数下方法的执行效果,而且运用多种评价方法,选用3个不同三维模型数据库进行方法测试,实现检索原型系统验证方法的有效性.实验证明,该方法相比于大部分其他方法具有更好的检索效果.
摘要:为仿真现实生活中由纵横交错的道路路网、大规模的车辆及其运动组成的交通场景,文中提出一种复杂路网内大规模车辆运动的仿真技术.首先设计一种层次路网语义模型,根据输入的路网车道线矢量数据,通过语义建模,从几何、拓扑等不同层次描述错综复杂的交通路网.其次,由于现有的车辆运动仿真方法中基于个体的微观方法针对大规模车辆运动计算效率较低,而基于流的宏观方法无法仿真复杂的交通现象,提出了一组新的宏观流方程来描述路网内车辆的运动,使得宏观流模型能够与车辆换道行为模型有机地进行结合,从而逼真地描述各种复杂的交通现象.实验结果表明,文中方法在实现复杂路网内车辆运动高细节模拟的前提下,其计算效率与一般宏观流模型保持在同一数量级.通过在实际应用中对真实交通路网进行虚拟现实建模,并在其上进行大规模车辆运动仿真,进一步验证了方法的有效性.
摘要:目前面部表情动画生成算法普遍具有捕捉设备昂贵、依赖用户表情数据预采集、需要用户具备专业知识等缺点,因此很难在普通用户中进行推广.针对这些不足,文中选择价格适中、操作简单的Kinect作为采集设备,提出了一种无须预处理的面部表情捕捉算法.首先从捕获的面部表情数据中提取面部特征点,利用几何度量建立低层面部特征点与高层表情语义之间的联系,根据权重和补偿策略建立几何度量样本集.然后采用无监督的方式自动分析样本分布,推测各表情单元的变化区间,实现表情参数的实时提取.最后利用表情参数驱动离线生成的通用表情基,生成能反映用户情绪的面部动画.在表情基生成过程中,首次引入控制点影响区域的概念来约束拉普拉斯变形算法,以提高通用Blendshape表情基的精度.实验结果表明,该方法简单易行,无需对每名用户进行表情数据预采集,即可在多人同时出现、部分遮挡等情况下实时、鲁棒地生成与用户近似的面部动画.主观评价中,该方法被证明具备优秀的采集灵活度、方便使用、实时性能良好,在普通用户中更具备推广价值.
摘要:对图像的质量进行评价有着广泛的应用,为定量的衡量图像的降质水平,文中在无指定图像失真类型的情况下,提出了一种通用的盲图像质量评价(Blind Image Quality Assessment,BIQA)方法.该方法首先提出了图像平坦区域和非平坦区域及视觉屏蔽的概念.将分割图像的平坦和非平坦区域引入评价系统中,从图像的非平坦区域中提取出能反应图像质量的视觉特征(Visual Features,VF),视觉特征涵盖了图像空域特性和DCT变化后的频域特性.利用非平坦区域中提取的空域与频域的联合VF和差分平均意见得分(Difference Mean Opinion Score,DMOS)训练提出的均衡广义回归神经网络(Equalization General Regression Neural Network,EGRNN).最后用LIVE的IQA数据库Release2测试了该方法.实验表明,分割图像非平坦区域,降低了平坦背景对图像质量评价的干扰,提升了预测的稳定性和准确性.此外,EGRNN通过均衡层的引入解决了视觉屏蔽现象,对图像质量的预测效果高于GRNN (General Regression Neural Network).该BIQA方法较其他方法预测更准确、更稳定.
摘要:该文针对多尺度变换融合图像中普遍存在的需要依据先验知识选取滤波器,导致融合效果存在不确定性的问题,提出了基于深度堆叠卷积神经网络的融合方法.首先,分别以高斯拉普拉斯滤波器和高斯滤波器为首层网络的初始卷积核,将源图像分解为高频和低频图像序列;其次,基于He K方法初始化其余层卷积核,获得与源图像尺寸相同的高频和低频重构图像各一幅,并将二者合成源图像的近似图像;再以源图像和近似图像像素值之差的平方和的均值为误差函数,进行反向传播训练形成基本神经单元;之后,将多个基本单元堆叠起来利用end to end的方式调整整个网络得到深度堆叠神经网络.然后,利用该堆叠网络分别分解测试图像对,得到各自的高频和低频图像,再基于局部方差取大和区域匹配度合并的规则分别融合高频和低频图像,并将高频融合图像和低频融合图像放回最后一层网络,得到最终的融合图像.实验结果表明:与基于双树复小波变换(Dual Tree Complex Wavelet Transform,DTCWT)、非下采样轮廓波变换(Non Subsampled Contourlet Transform,NSCT)和非下采样剪切波变换(Non Subsampled Shearlet Transform,NSST)的融合结果相比,用高斯拉普拉斯滤波器和高斯滤波器初始化的深度堆叠卷积神经网络融合效果主观效果好,客观指标最优个数为NSCT的3.3倍,运行时间为NSCT的30 3%和NSST的11.6%.
摘要:作为当前模式识别领域的研究热点之一,识别视频场景中的集体行为有着重要的科研意义和应用价值.已有的识别方法都忽略了对集体行为中多重交互关系的描述和分析,使得复杂视频场景中的集体行为识别仍存在局限性.该文提出了一种基于流密度的多重交互集体行为识别算法FDA,能够识别集体行为的局部和全局模式.为了准确地衡量个体间的行为一致性程度,受流体力学启发定义了流密度,并通过基于流密度的聚类算法识别局部子群组;为了精确描述集体行为客观存在中的多重交互关系,提出了多重邻接关系模型.该模型能够分析子群组间的全局一致性,进而通过合并具有较高一致性的子群组得到全局集体行为模式.在多个真实视频数据集上的实验结果表明,FDA算法相比于已有方法具有更高的识别精度.
摘要:室内三维场景生成技术近年来已得到广泛应用,但如何高效和自动化地生成场景元素的空间组织,仍然是个具有挑战性的问题.为了在给定的目标空间中快速生成符合日常生活规范的家居场景,提高室内场景建模的效率,该文基于室内设计领域的住宅空间家具配置流程,提出用于布局计算的复合模型,处理场景元素的组织和布局问题.具体地,该复合模型将室内场景中的对象分为区域和场景元素两个层次,首先以区域为单位,依据人体工程学的布局规则在目标空间中进行自动布局计算,然后通过案例库搜索,在区域中适配具体的场景元素,形成完整的家居场景.实验表明,与以家具为个体进行自动布局计算的方法相比,用区域一组家具进行布局减少了目标空间中参与布局的个体数目,降低了布局复杂度,在相同的运行时间下,能得到更为合理的布局结果.通过基于复合模型的家居场景生成方法,用户只需提供户型结构数据,而无需提前一一指定具体的家居元素,能给用户使用带来较大便利.
摘要:该文提出了一种基于子空间映射和一致性非刚体变换的准稠密匹配传播算法.该算法从一组稀疏的种子匹配开始,迭代地在其周围寻找新的潜在匹配.与现有方法最大的不同在于,该文的方法使用一致性非刚体变换模型来描述两个扩展窗口之间的几何关系,而不是使用离散二维视差梯度模型或者局部平面仿射模型.在计算非刚体运动模型之前,扩展窗口内所有像素的空间坐标信息和特征信息都被映射到一个新的子空间中.这一新的数据表达方式可以提升算法的鲁棒性,同时使矩形扩展窗口对于非刚体变换模型的计算依然有效.最终,两个扩展窗口中所有满足一致性非刚体模型的匹配被一次性找出.实验结果表明,该方法对于图像存在较大旋转、视点变化以及深度非平滑表面的情形有着较好的效果.
摘要:植物叶片形状一般具有小的类间差异和大的类内变化,再加之叶片的自遮挡和噪声的干扰,给叶片形状的识别带来了很大的挑战.文中提出了一种新的形状描述子——弦特征矩阵(Chord Features Matrices,CFM),精确而又鲁棒地应用于植物叶片图像的分类和检索问题.该方法将目标轮廓线的弦,依据轮廓线所围成的区域,分成内和外两个部分.因其与轮廓线凸凹特性的相关性,该方法用多个尺度级的内部弦长和外部弦长生成两个矩阵,旨在隐式地描述轮廓线的多尺度的凸凹特性.该方法还定义了多个尺度级的弧到弦的平均投影长度,并构成矩阵,以反应轮廓线在各个尺度级下的弯曲程度.组合这3个矩阵所形成的CFM描述子,全面地刻画了轮廓线的几何特性,具有强的形状表征能力.用Swedish、Flavia和ImageCLEF这3个具有挑战性的叶片图像测试集,对文中提出的CFM方法分别进行分类和检索性能评估.实验结果表明,文中提出的方法在精确度和对噪声的鲁棒性方面均优于其他植物叶片图像分类和检索方法.而文中提出的方法在MPEG 7测试集上的实验结果则验证了其具有应用于一般的形状识别任务的潜力.
摘要:相位恢复是指仅利用傅立叶变换或者其它线性变换的幅值对原始图像进行重建,文中针对相位恢复问题提出了一种对不同类型噪声及混合噪声均具有鲁棒性的相位恢复方法.该方法将相位恢复过程分为轮廓恢复和细节恢复两个步骤.首先利用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)求解融合全变差正则项的优化问题恢复图像轮廓.由于第一步重建过程中的全变差正则项平滑了重建图像的细节成分,为保证重建结果包含丰富的细节信息,在第二步中采用第一步获得的重建图像作为原始图像的粗略估计,利用傅立叶幅值约束以及图像在双树复数小波变换下的稀疏性重建图像细节部分.同时,为了使算法能够适用于不同类型噪声,在第二步细节恢复过程中采用l1范数与l2范数加权和作为数据保真项.实验结果表明该方法在无需噪声类型先验的条件下仍然能够获得较高的图像重建质量,且对不同类型噪声以及混合噪声均鲁棒.
摘要:立体图像缩放是图像处理领域的重要研究内容.Basha等人[14]提出一个新颖的立体接缝雕刻(stereo seam carving)算法,但是由于无法避开立体图像左右视图中的视角外区域和被遮挡区域,Basha方法在选取水平走向立体接缝时会出现同列多像素和间隔缝隙现象.因此,Basha方法不适用于垂直方向的立体图像缩放处理.针对Basha方法的上述局限性,作者提出了一种适用于垂直方向缩放的几何一致性立体接缝雕刻(stereo seam carving)算法.首先,作者引入基于视差的实投影和虚投影两个策略,以解决Basha方法中出现的同列多像素和间隔缝隙现象,并提出了一种新的水平走向立体接缝定义.然后基于该定义,提出了一个改进的几何一致性立体接缝雕刻算法,该算法不仅保持原Basha算法在水平方向的缩放功能,同时较好地实现垂直方向的立体图像缩放.作者提供了若干实验数据说明算法是有效的.
摘要:多片元效果具有实时透明等重要应用,它需要每个像素按深度顺序遍历对应的所有片元.深度剥离法将场景重复绘制多次来满足这个需求,故对显存带宽提出了很高的要求.该文针对大规模场景图元分布稀疏的特点,使用类体素八叉树在物体空间将场景近似剖分以减少图元读取总量.这允许场景能够按可见性顺序被分块加载、精确剖分和逐个绘制:通过光栅化对应的八叉树网格构造深度桶列表,在屏幕空间将场景块与网格布尔求交;通过为整个场景构造块的深度直方图,在剥取时利用它来避免硬件遮挡查询操作.由于为每块采取了不同的迭代次数,该文的两阶段剖分方法能够适应物体空间变化的深度复杂度.由于不依赖于面片的邻接信息,该文方法能够支持非流形网格和外存绘制.相比已有工作,该文方法在每次剥取一层时绘制效率有30%以上的提升.
摘要:矩是描述图像特征的一个重要算子,矩计算的效率与图像表示方法直接相关.非对称逆布局的模式表示模型(Non symmetry and Anti packing pattern representation Model,NAM)是一个有效的模式表示模型.位平面分解(Binary bit Plane Decomposition,BPD)是降低灰度或彩色图像复杂度的一种良好方法.鉴于传统图像块表示(Image Block Representation,IBR)的块扫描方法的缺陷,该文提出了一种新的NAM块扫描方法,它是一种“无偏向”的块扫描方法.基于新的NAM块扫描方法,该文提出了二值图像的一种新的NAM表示方法,其贪心准则为:每次寻找一个在当前看来最大的矩形子模式.与IBR表示方法相比,在不改变时间复杂度的情况下,该表示方法能进一步减少矩形子模式的总数量.基于新的NAM表示和BPD方法,通过调整参与矩计算的位平面的参数,该文给出了矩计算的一个重要定理,提出了一种新的灰度图像的快速矩计算算法,并给出了该算法的形式化描述和复杂度分析,该算法不仅能实现矩的精确计算,也能实现矩的近似计算.以惯用的“Lena”、“F16”、“Peppers”标准图像及南加州大学标准纹理库中的纹理图像(sipi.usc.edu/database/database.php?volume=textures)、医学图像等为测试对象,实验结果表明:在丢失5个低位位平面情况下,传统矩计算的平均时间分别是Spiliotis算法和该文算法平均时间的35 5182和53 9527倍,也即,该文算法比当前最快的Spiliotis算法还要快28 87%,因而是灰度图像的一种快速矩计算算法.