计算机学报杂志

发表咨询:400-808-1731

订阅咨询:400-808-1751

计算机学报杂志 北大期刊 CSCD期刊 统计源期刊

Chinese Journal of Computers

  • 11-1826/TP 国内刊号
  • 0254-4164 国际刊号
  • 3.18 影响因子
  • 1-3个月下单 审稿周期
计算机学报是中国计算机学会;中国科学院计算技术研究所主办的一本学术期刊,主要刊载该领域内的原创性研究论文、综述和评论等。杂志于1978年创刊,目前已被数学文摘、上海图书馆馆藏等知名数据库收录,是中国科学院主管的国家重点学术期刊之一。计算机学报在学术界享有很高的声誉和影响力,该期刊发表的文章具有较高的学术水平和实践价值,为读者提供更多的实践案例和行业信息,得到了广大读者的广泛关注和引用。
栏目设置:研究论文与技术报告、短文、学术通信、学术活动、中国计算机学会学术动态

计算机学报 2017年第12期杂志 文档列表

计算机学报杂志软件技术
基于执行序列的嵌入式软件时序异常检测2635-2657

摘要:序特性是嵌人式软件的重要特性,实时嵌人式软件运行的正确性不仅依赖于任务执行结果,更依赖于任务执行时间.执行任务往往具有多个时间约束,且相互之间可能存在制约关系,对时间约束进行验证和确认是嵌人式软件测试的一个重要问题.文中提出一种基于执行片段的嵌人式软件时序特性检测方法(Trace-Based Temporal Defect Detection,TBTDD).—方面,基于扩展语义接口自动机(Extended Semant CcInterface Automata,ESIA)模型,刻画嵌人式软件时序特性需求,分析不同时间约束间存在的相关关系类型,并提出基于相关矩阵的相关时间约束识别算法;另一方面,在目标软件运行环境中提取包含时间信息的执行片段,通过执行片段与时间约束模型的匹配,依据预先制定的时序特性检测准则,检验执行序列是否满足模型中各项独立和相关时间约束的要求,进而发现被测软件中存在的时序缺陷.实验以卫星定位系统软件为例进行建模与缺陷检测,并在执行片段集和缺陷检测能力等方面进行了对比分析.实验表明,该方法可有效检测软件运行过程中存在的各类异常时序,提高了软件时序测试的有效性和充分

基于策略推导的访问控制漏洞测试用例生成方法2658-2670

摘要:Web应用已经成为越来越流行的信息传输媒介.为了保护重要信息不被泄漏,许多Web应用设计了针对不同角色不同用户的访问控制机制.然而由于不完善的访问控制机制,使得访问控制漏洞仍普遍存在,攻击者可对Web应用的敏感数据进行非法访问.为了获得准确的访问控制机制,测试用例的准确性和有效性至关重要.然而,现有的测试用例生成方法存在漏报、冗余度高等缺陷.文中根据Web应用程序的访问控制模型,提出一种基于策略推导的测试用例生成方法.此方法从角色和用户两个级别发现对应的授权操作集合,推导Web应用程序的访问控制策略,并利用推导所得访问控制策略生成合法与非法两类测试用例.其中,合法用例用以对推导所得策略的正确性进行验证,非法用例通过违背授权约束生成,用以检测Web应用程序的访问控制漏洞.为了对方法的有效性进行验证,我们设计并实现原型系统ACV-Scanner,并将其运行在开源Web应用上.实验结果表明该方法在能全面检测各种类型的访问控制漏洞的前提下,对测试用例进行了精简,与同类研究对比,减少漏报,提高了效率.

基于混杂偏倚消除的谓词统计错误定位方法2671-2687

摘要:识别并消除统计错误定位过程中的混杂偏倚效应可以有效提高错误定位结果的精度.该文对谓词可疑度度量过程中的混杂偏倚现象进行了研究,提出一种基于混杂偏倚效应消除的谓词统计错误定位方法.首先,提出一种基于变量类型的错误候选谓词筛选方法来提高错误相关谓词的识别能力;其次,通过分析影响谓词取值和程序执行结果的条件,识别定位过程中的数据依赖和控制依赖混杂偏倚元素;再次,采用一种静态切片与动态约减相结合的谓词信息收集方法,提高谓词信息的收集效率;最后,针对收集的谓词信息、混杂偏倚元素信息和程序执行结果,使用线性回归分析度量谓词的可疑度,降序排列后提供给开发人员开展程序调试.实验表明该文方法可以有效识别错误相关谓词,提高错误定位的精度和效率.

基于方程求解与相位估计攻击RSA的量子算法2688-2699

摘要:量子计算的发展对现有的公钥密码体制提出了严峻的挑战,利用Shor算法就可攻击公钥密码RSA,ELGamal等.因此,研究量子计算环境下的密码破译有重大意义.经典的因子分解算法是通过求解同余方程α2≡β2(modn)实现的.据查证,目前还没有求解此方程的量子算法,故我们试图从量子计算的角度提出解决此同余方程的量子算法.该算法是对经典求解同余方程α2≡β2(modn)的量子化实现.相比于Shor算法,算法1所需量子位少,具有亚指数时间复杂度,且成功概率接近于1.为了降低时间复杂度,我们从非因子分解角度出发,基于量子Fourier逆变换和相位估计,给出了算法.同Shor算法相比,算法2不需要分解n,而从RSA密文C直接恢复出明文M,具有多项式时间复杂度,且成功概率高于Shor算法攻击RSA的成功概率,同时不必要满足密文的阶为偶数.

虚拟黑盒安全的程序混淆:模型、进展与挑战2700-2718

摘要:在密码复杂性安全级别上实现程序安全保护方法,主要有两种:函数加密和程序混淆.程序混淆(program obfuscation)是一个编译器,它可将一个程序(布尔表达的电路)转化为可执行的混淆化程序,混淆后的程序与原始程序在相同输入情况下达到相同输出功能,但无法从混淆程序中获得有关原始程序或电路的任何有用信息.程序混淆使软件代码逆项工程在密码学上是可证明困难的,可用于软件产权保护、安全外包计算以及敏感操作等场合,也可实现密码学领域中的重加密、不可否认加密以及对称加密转换为公钥加密等应用.目前程序混淆已受到研究人员的广泛重视,然而Barak等(Eurocrypt’01)已证明对一般电路的理想化黑盒安全是不可能的.程序混淆设计要么针对某些具体函数电路,如点函数、多点函数、超平面关系函数以及重加密功能函数等,以达到虚拟黑盒安全的构造,要么弱化安全要求获得实用性可证明安全的程序混淆方案.鉴于程序混淆在理论研究与实际应用上的重要意义,该文对程序混淆技术的系统模型、安全性、方案设计以及性能等作综述性研究和比较分析,从混淆函数电路的可能性和不可能性角度作了归纳,并对典型的函数电路混淆作了描述和探讨.对VBB安全混淆、VGB安全混淆、最可能混淆、可提取混淆以及不可区分混淆等安全模型进行了分析探讨.最后对密码技术实现的混淆在性能上进行定义和归纳,对当前方案作比较分析,并对今后的研究方向作了展望.

面向隐私保护的数据块调整机制2719-2733

摘要:在云计算环境下,通过分块混淆的隐私保护机制,将租户的数据分成多个数据块,并且存储到不同的数据节点上,以此实现数据的隐私保护.虽然该方法可以实现在明文状态下保护租户数据的隐私安全,但在实际环境中,由于租户的隐私需求、数据需求是可变的,导致云端底层的数据块结构和存储位置发生变化,因此在这种隐私保护机制下依然存在隐私泄露的风险.所以该文基于分块混淆隐私保护方法,提出一种面向隐私保护的数据块调整机制.该机制首先根据租户更新后的隐私约束,基于少动性原则,对原始的隐私保护策略中违背隐私约束的数据块进行分割;然后再结合隐私约束,重组数据块,并生成隐私保护调整策略;由于数据块分割结果的多样性,导致最终生成的可行隐私保护策略并不唯一,所以该文最后综合隐私需求、性能需求、负载需求和不对等均衡,提出了一种基于全局最优的隐私保护策略选择算法,实现从多种可行策略中筛选出满足所有要求的最优调整策略.实验结果表明,该文提出的数据块调整机制,可以找到一种最优的隐私保护调整策略,并且满足系统的性能和负载要求,增强租户数据的隐私保护效果.

支持轨迹隐私保护的两阶段用户兴趣区构建方法2734-2747

摘要:针对空间大数据开放共享中平衡隐私保护与数据可用性矛盾的需求,该文从空间和时间两个维度对空间时序数据进行分析,提出蕴含空间、时间和群体特征的用户兴趣区构建方法.该方法分为两个阶段:第一阶段的个人兴趣区构建首先将m个移动用户的轨迹数据预处理到n个采样时刻,并形式化为隐含时序关系的m×n阶位置矩阵;然后根据访问频率等指标对每个用户在位置矩阵中的行向量进行聚类、合并和优化,获得每个用户在不同时间段的若干个人兴趣区.第二阶段的公共兴趣区构建在第一阶段的基础上,首先对每个用户按照一定的选取方式提取代表个人兴趣区位置信息的位置点,并对全部m个移动用户的个人兴趣区的位置点进行二次聚类,获得所有用户在不同时间尺度上的若干公共兴趣区;然后根据实际应用场景需要,提取包含时间标记的公共兴趣区.通过对比公开数据集的处理结果和百度地图的实体数据,验证了该方法所构建的用户兴趣区与实际生活中的功能区域基本一致.应用实例证明,该文方法所构建的用户兴趣区可以为空间大数据开放共享中的轨迹隐私保护提供有效的技术支撑.

具有超父结点时间序列贝叶斯网络集成回归模型2748-2761

摘要:时间序列是现实世界中数据的主要表现形式之一,对时间序列进行预测也有着普遍的需求.现已发展了许多时间序列(单时间序列或多时间序列)预测模型,它们各有特点,被广泛用于解决诸多领域的实际问题,但这些模型或者需要时间序列平稳性和具有线性关系的假设,或者与某种分布紧密联系在一起,这使其适用范围受到限制,而且也不易于实现动态和静态信息的融合.文中在基于高斯函数估计属性密度的基础上,结合转换数据集构建、回归变量的离散化、类变量的数量化、属性联合密度的分解计算和以类的满条件概率为权重的加权平均等,建立用于时间序列预测的具有超父结点贝叶斯网络回归模型,该模型能够在统一的概率框架下实现对动态与静态信息的融合,不需要平稳性、分布和函数形式的假设,并能够通过具有不同超父结点贝叶斯网络回归模型的集成来进一步降低回归误差和提高泛化能力.使用UCI和宏观经济数据进行实验的结果显示,无论对单时间序列还是多时间序列,具有超父结点贝叶斯网络集成回归模型均具有良好的回归可靠性.

面向社会化媒体用户评论行为的属性推断2762-2776

摘要:针对用户网络行为进行属性推断,在个性化推荐、市场营销和提升平台服务质量等方面具有重要应用价值.现有工作主要针对浏览行为、社交行为等可追踪用户身份的网络行为进行属性推断,而评论性网站用户多为匿名身份,其网络评论行为数据具有碎片化、信息价值含量低和不平衡的特点,且用户群体的属性分布严重不均衡,这些问题给用户属性推断带来挑战.文中引入客体信息、环境信息和语义知识库,辅助用户特征建模,增加了用户评论行为的语义内涵,缓解了用户行为数据量不平衡性和稀疏性问题;基于信息增益度量特征,提出了面向概率性特征选择的两种代表性算法的改进策略:概率包裹式特征选择和启发式概率特征搜索,在解决特征空间高维问题,提高效率的同时,降低了数据噪音影响;提出了面向小比例类型数据的差异性特征选择和迭代式增强学习算法,集成多个特征相关的分类器,既保留了重要特征信息,也给低价值特征提供了小概率选择机会.分别使用真实的中文和英文数据集验证该文方法,包括不同的行为建模方式和特征筛选方法,以及不同参数和用户属性分布不平衡问题对属性推断的影响,并和其他方法进行了对比,实验结果表明该文方法更为有效.

基于计算方法的抗菌肽预测2777-2796

摘要:菌肽是由生物体免疫系统所产生的能抵抗微生物感染的一种小分子多肽,因其具有高效低毒的广谱抗菌活性且几乎无耐药性问题,被看做是抗生素的最佳替代品,对解决抗生素滥用问题具有重要的意义.抗菌肽预测是生物信息学的一个重要研究内容,对抗菌肽及其抗菌功能进行预测能有效帮助了解抗菌肽的作用机理,为抗菌肽药物的设计和改造提供理论依据.基于计算方法的抗菌肽预测是采用数学理论、计算机技术和生物信息学方法,通过对抗菌肽数据的分析来挖掘出抗菌肽的生物特征和抗菌活性之间的关联,从而自动地对抗菌肽的类别做出推断.由于不依赖于生物实验,而是依靠有效的算法和计算机的高速计算能力来完成预测工作,计算方法具有高效快捷、成本低廉等特点,且具有良好的可操作性和批量处理能力,非常适合大规模预测任务,因此已经引起了国内外学者越来越多的关注.文中对国内外的相关研究成果进行了阐述和总结,包括抗菌肽生物信息数据库、主流的预测方法和预测方法的性能检验等.抗菌肽数据库是专门针对抗菌肽建立的数据库,收录了大量的抗菌肽数据,使用者不仅可以从中提取所需要的信息,还可以使用数据库所提供的各类在线工具对数据进行处理.文中对常见的一些抗菌肽数据库进行了介绍,给出相关数据库的数据收录情况、功能特点和网址链接等,以方便读者查询使用.接着文中介绍了目前主要使用的抗菌肽预测方法,包括基于经验分析的预测方法和基于机器学习的预测方法,前者是根据已知的经验规则或者模式对某类抗菌肽的一些生化属性和抗菌活性之间的关联进行统计或建模来对该类抗菌肽进行识别,而后者则是利用机器学习技术,通过对抗菌肽的已知数据信息进行学习,建立合理的预测算法从�

一种基于效用的个性化文章推荐方法2797-2811

摘要:近年来,个性化推荐方法逐渐成为推荐系统领域的研究热点,文章推荐就是其中的一个分支.然而目前大部分文章推荐方法还存在以下问题:首先,这些方法大多还是基于协同过滤或者基于内容的推荐,而这些方法无法满足用户因自身偏好带来的需求,它们倾向于通过获取文章的各种不同属性来代表文章,这样的获取方式存在着对文章本身理解的偏差.其次,还存在一些文章推荐方法使用搜索代替推荐,这种方法仅仅以用户的偏好为基础,并不考虑文章的内在属性和联系,反馈回的数据依赖于用户做大量的判断.这些都为文章推荐方法的研究提出了挑战与机遇.该文主要聚焦的问题是:(1)已有的文章有多大的可能性成为用户的选择.对于推荐方法来说,过去的文章更多的是通过一些文章属性来获取.如研究领域、作者姓名、文章权威性、文章发表时间、引用数量等,这些属性的数据量庞大且没有量化标准,用户不容易通过这些信息来准确获取自己想要的文章;(2)什么样的推荐方法能将用户需要的文章更好的推荐出来.由于用户的偏好是一种理性和感性的共同选择,因此推荐方法不仅需要考虑文章自身的影响力,还要考虑用户需求的程度和方向.该文通过分析用户与文章的关系,提出一种个性化文章推荐方法,该方法基于效用理论,为了得到效用函数,该文将文章属性和用户偏好作为效用函数的元素,首先分析了文章属性和用户偏好之间的关系,其次通过最优化的效用函数得到用户对文章的评价值,最后通过对不同的评价值进行比较,将相关的文章推荐给用户.这样就可以通过效用函数最终获取用户所需的文章.该文的贡献主要包括以下几方面.(1)建立了一种关于论文属性和用户偏好的组合模型,该模型是通过效用函数建立的,目标是使用户的利益达到最大;(2)效用函数中的变量来自�

基于DSSI理论的信息易感用户动态提取模型2812-2826

摘要:在线社交网络信息扩散研究有助于用户获取信息、企业推广产品、政府调控舆情,其理论及应用价值巨大.该文主要针对在线社交网络中商业信息的扩散问题,在分析用户转发行为随机性和不确定性的基础上,利用通用发生函数(Universal Generating Function,UGF)方法及离散压力应力(Discrete Stress-Strength Interference,DSSI)理论,提出了一种新颖的信息易感用户动态提取模型.模型中,首先将用户的随机转发行为量化为节点易感性(Node Susceptibility,NS),然后基于UGF方法及DSSI理论计算出不同用户不同时期关于不同信息的NS值,最后通过NS值的动态排序提取信息易感用户.模型的决策结果有效地解决了以下三个问题:(1)哪些用户最易受信息影响?(2)他们最易受哪类信息影响?(3)他们何时最易受影响?这三个问题的答案可为有效信息扩散策略的制定提供理论依据.案例分析和模型对比说明了该模型的可行性及有效性.

多层自适应模块化神经网络结构设计2827-2838

摘要:针对单一全互连前馈神经网络难以应对复杂问题及模块化神经网络应用时其结构难以确定的问题,该文基于脑式信息处理是采用无监督学习半监督学习监督学习的学习机制以及大脑是由多个功能模块组成,每个功能模块中又包含多个子模块,大脑对信息的学习是有目的的选择不同功能模块中多个子模块协同学习的事实,提出一种多层自适应模块化神经网络结构设计方法.其实质是首先对所有的训练数据采用概率密度峰值快速聚类算法确定训练数据的聚类中心,以此确定模块化神经网络中功能模块的个数,其次采用条件模糊聚类实现对每个功能模块中子模块的划分并确定每个子模块的训练样本集;对功能模块中的每一个子模块采用训练误差峰值构造RBF网络的增长算法,该算法能根据分配来的训练样本自适应构建子模块结构;在子模块集成方面,采用基于距离测度的子模块集成方法,该方法能从不同的功能模块中选择不同的子模块对训练样本协同处理.该文提出的模块化神经网络结构设计方法只需要2个人工参数且学习速度提高了近10倍,在一定程度上实现了神经网络的黑箱效应.最后,文中基于人工数据集的复杂函数拟合问题、双螺旋分类问题以及真实数据集的回归问题进行了实验,并与当前国际流行的网络结构进行了对比,结果显示文中提出的模块化神经网络网络结构解决了全互连RBF网络难以应对的复杂问题,而且学习精度高,学习速度快,最终网络的泛化性能强.

基于多种支撑点的度量空间离群检测算法2839-2855

摘要:大数据的价值实现,归根到底还是依赖于数据挖掘技术.而在很多领域中,海量数据的非常规模式往往更具分析价值.离群检测,也叫异常检测,是用于挖掘海量数据中非常规模式的一项关键技术,广泛应用于网络入侵检测、公共卫生、医疗监控等领域.基于索引的离群检测算法通常具有较高的检测速度,然而现有的大多数基于索引的检测算法并非完全基于距离,导致通用性降低.较高的抽象能力使得度量空间具有比多维空间更广泛的适用范围,在其基础上设计的算法具有更高的通用性.而最新的度量空间基于索引的离群检测算法iORCA算法通过随机选取支撑点,基于数据到单支撑点的距离建立索引,并应用终止规则(Stopping rule)以期提前结束离群检测并得到正确的结果,多数情况下该机制起到加快检测速度的重要作用.然而iORCA算法未提供支撑点选取算法导致检测结果不稳定,且未能充分利用距离三角不等性减少距离计算次数.针对这些问题,文中指出基于距离的离群点定义应结合使用完全基于距离的离群检测算法,以确保算法的通用性,由此提出了度量空间离群检测的概念.在此基础上明确了支撑点选取的两大目标,即边缘支撑点和密集支撑点,并提出基于多种支撑点的度量空间离群检测算法VPOD.考虑到两个支撑点选取目标难以同时达到,VPOD算法分别予以选取,在近似的密集区域选取支撑点,即密集支撑点,对应使用终止规则,然后用FFT(Farthest-First Traversal)算法另选取若干支撑点,即边缘支撑点,与数据集计算距离而形成支撑点空间,利用距离三角不等性,使距离计算次数显著减少,从而提高检测速度.实验表明该算法能在可接受的时间范围内建立索引,并能高效检测离群点,加速比达2.05,最高达3.54,距离计算次数平均减少51.14%,最高达89.46%,同时保持对多种常见的基于距离的离群点定

一种基于快速k-近邻的最小生成树离群检测方法2856-2870

基于表现手法的国画分类方法研究2871-2882

摘要:传统国画的数字化是信息时代对国画有效保存和有效分享的重要手段.海量的数字化国画已成为数字博物馆乃至现代图书馆重要的组成部分.如何实现对数字化国画的高效检索和管理已成为一个亟需解决的问题.针对该问题,文中探索研究基于表现手法的国画分类方法.根据表现手法的不同,国画可以分为工笔画和写意画两种基本形式.画作的对象内容不同及不同画家的画法、风格不同等因素对工笔画和写意画的计算机分类带来了重大挑战.通过对国画表现手法的研究及对大量国画的分析,文中首先提出一种国画关键区域检测方法,通过融合Scale Invariant Feature Transform(SIFT)特征检测子和边缘检测得到国画关键区域.然后,提出国画关键区域描述方法,通过对关键区域视觉特征及内部邻域差异性的描述,有效捕获工笔画和写意画在绘画技法上的不同.最后,提出一种级联分类策略,融合不同维度特征,实现对国画的分类.在文中所构建的包含1718幅古代、现代、当代国画大家作品的数据集上的实验结果表明,文中所提方法在工笔画和写意画分类上取得了很好的效果,分类正确率比现有最好方法提高了3.4%以上.