计算机学报杂志

发表咨询:400-808-1731

订阅咨询:400-808-1751

计算机学报杂志 北大期刊 CSCD期刊 统计源期刊

Chinese Journal of Computers

  • 11-1826/TP 国内刊号
  • 0254-4164 国际刊号
  • 3.18 影响因子
  • 1-3个月下单 审稿周期
计算机学报是中国计算机学会;中国科学院计算技术研究所主办的一本学术期刊,主要刊载该领域内的原创性研究论文、综述和评论等。杂志于1978年创刊,目前已被数学文摘、上海图书馆馆藏等知名数据库收录,是中国科学院主管的国家重点学术期刊之一。计算机学报在学术界享有很高的声誉和影响力,该期刊发表的文章具有较高的学术水平和实践价值,为读者提供更多的实践案例和行业信息,得到了广大读者的广泛关注和引用。
栏目设置:研究论文与技术报告、短文、学术通信、学术活动、中国计算机学会学术动态

计算机学报 2018年第06期杂志 文档列表

一种新的访问控制策略描述语言及其权限划分方法1189-1206

摘要:云平台RESTful接口往往暴露在Internet上,为保证云资源的安全,防止数据泄露和非授权访问,必须实施安全策略对这些接口进行访问控制.然而,目前RESTful接口缺乏统一的访问控制策略描述语言及相应的权限划分机制.这导致两个问题:(1)用户不得不学习不同的策略语言来管理不同云平台上的权限;(2)云服务提供商缺乏对RESTful接口的细粒度的访问控制,不符合最小特权原则.对此,该文提出了一种新的访问控制策略描述语言.该语言定义了RESTful的标准请求格式,从而可以直接从一个RESTful请求中构造样本策略,为RESTful接口访问控制提供语法一致的策略语言.在该语言的基础上,进而提出了一种基于遗传算法的RESTful权限划分方法,采用2维矩阵表示一个权限划分,并作为遗传算法的种群个体.接着定义了选择算子、变异算子和交叉算子,提出了权限划分的三个原则:分类个数、测试用例覆盖、权限重叠,并设计适应度函数.该文基于OpenStack云平台给出了策略语言评估机制的参考实现,验证了方法的可行性.实验结果表明,相比OpenStack原有策略,该文策略评估开销降低了19.4%.在学习成本方面,与XACML策略语言相比,该文策略能够减少策略管理员41.6%的策略设计成本.该文的权限划分方法可以产生符合用户预期、可理解的划分结果,从而为云服务提供商进行权限划分提供指导.

云计算环境下基于随机化的安全防御研究1207-1224

摘要:云计算利用云端的资源向用户提供计算和存储服务,改变了个人和企业对信息资源的处理模式.但是,现有的云计算环境的安全加固方法无法应对源于云计算环境服务的单一性和自身漏洞引发的外部攻击.该文从云服务本身、云服务接口和网络接口三个方面研究了云计算平台存在的安全威胁.为了应对这些安全威胁,剖析和比较了应用于云服务本身、云服务接口和网络接口的随机化方法.接着,提出了多层次、层间随机化感知和分布式协同的随机化部署模型,讨论了模型部署中存在的随机化参数感知问题、不同虚拟机上同层服务的协同问题,并给出了相应的解决思路.最后,讨论随机化方法的安全性度量和局限性,进而指出未来研究工作方向.

支持SaaS应用多维异构性能需求的云资源放置方法1225-1237

摘要:SaaS(Software as a Service)应用是以云计算资源为基础,以按需定制及按需付费的服务模式向用户提供云计算软件服务的应用系统.云中的SaaS应用一般为多层多节点部署的大型软件应用系统,对于云计算SaaS服务提供商来说,往往需要在云数据中心中同时快速交付和部署多个不同的SaaS应用,需要满足不同租户对于不同的SaaS应用多样化性能、网络、存储和操作系统需求,即多维异构的性能环境需求.因此,如何快速选择合适的云资源来部署大规模SaaS应用系统,满足大规模不同租户的多维异构性能需求,同时节省云服务提供商的成本,是实现SaaS应用敏捷交付部署的关键.传统的按照等级和供需的云资源匹配方法已经很难满足云数据中心大规模SaaS应用敏捷化交付部署要求.为此,提出一种基于图匹配的SaaS应用云资源放置方法,将大规模SaaS应用的个性化云服务放置问题映射为云资源节点拓扑图的子图查询匹配问题,即SaaS应用的多节点多维性能需求和云资源节点拓扑均表示为带多维属性标签的异构图,基于偏序异构图查询匹配方法得到一组满足用户需求的云资源节点集合,用于放置SaaS应用及其数据,从而实现大规模SaaS应用的敏捷化交付部署.实验结果表明该方法能有效提高大规模复杂SaaS应用多维异构云资源放置的执行效率.

基于行为的大规模云工作流模型库高效检索方法研究1238-1254

摘要:为了提高流程模型检索效率,现有的基于行为的流程模型检索方法应用基于流程执行路径/任务执行次序关系的索引去过滤大规模流程模型库,以减少候选模型的数量.由于构建与维护基于流程执行路径的索引较为困难,而基于任务执行次序关系的索引并不考虑任务执行次序关系的约束属性(如时间约束),在模型数量巨大且存在大量具有相同或相似行为的流程片段的云工作流模型库中,其过滤能力有限.因此,这些方法并不适合基于行为的大规模云工作流模型库的高效检索.鉴于此,针对云工作流模型库的特征,该文应用带时间约束的任务执行次序关系索引及流程行为精确匹配算法,提出一种改进的基于行为的两阶段流程模型检索方法.该方法在过滤阶段,构建带时间约束的任务执行次序关系索引,通过该索引对大规模云工作流模型库进行过滤,以大大减少候选模型的数量.在精化阶段,应用带时间约束的流程行为精确匹配算法对候选模型集进行精化验证.评估实验结果表明,该方法能显著提高基于行为的大规模云工作流模型库的检索效率.

基于需求功能语义的服务聚类方法1255-1266

摘要:随着互联网上服务数量的急剧增长及类型的日益多样化,如何准确、高效地发现满足用户需求的服务成为服务计算领域的一大挑战.服务聚类是提高服务发现效率的重要技术.尽管已有很多服务聚类方面的相关工作,但是现有方法不仅局限于单一类型的文档,而且鲜有考虑服务需求的功能语义.有鉴于此,文中提出一种基于需求功能语义的服务聚类方法SCFSR(Service Clustering based on the Functional Semantics of Requirements).该方法对文档类型没有要求,且采用自然语言处理技术提取服务需求中的所有有用功能信息集;根据服务功能信息集度量服务的功能语义相似度;使用k-means算法实现服务聚类;使用ProgrammableWeb上API服务的真实数据来验证SCFSR方法的有效性.文中用准确率和召回率评估信息集提取的效果,并用纯度指标(Purity of Cluster)评估聚类的效果.评估结果表明,该方法可以有效地实现对服务的聚类,整个聚类的纯度达到了57.5%,比同类方法略有提高.

一种支持所有权认证的客户端图像模糊去重方法1267-1283

摘要:由于图像具有数量大、冗余多的特性,所以需要重复数据删除技术的支持,但已有的基于哈希值的文件重复删除技术不适用于图像去重.针对图像的去重面临以下三个挑战:需要支持图像模糊去重;需要对相似图像进行所有权认证;需要进行图像感知质量评价.针对以上挑战文中提出了一种支持所有权认证的客户端图像模糊去重方法.该方案的核心包括:采用高准确度感知哈希算法,以满足图像相似性的高准确度检查;采用新设计的协议进行相似图像的所有权认证;采用无参考通用图像质量评价方法,以完成图像感知质量的评价.经过安全性分析,结果表明,新方案达到了可证明其安全的安全强度,这是图像去重领域的新突破;同时,经过大量仿真测试,结果表明,新方案可以准确地进行相似检测,还可以对多种失真图像进行感知质量评价,满足了新的技术挑战;另外,性能测试结果表明,新方案的时间开销较小,能快速高效地去重,节省了大量存储资源和网络带宽.

基于Spark的并行化组合测试用例集生成方法1284-1299

摘要:软件系统的正常运行受很多因素影响,各种因素及其相互作用可能引发软件故障,需要设计测试用例检测这些故障.如果因素数量较多且取值情况较复杂,则所需测试用例的数量将非常庞大.如何设计规模较小的用例集是测试用例生成研究的一个关键问题.组合测试能够从待测软件的大规模组合空间中,生成小规模的用例集,实现对各因素取值组合的充分覆盖.已有研究表明,组合测试的最小测试用例集生成问题是一个NP完全问题.目前已有一些研究尝试使用启发式搜索算法生成尽可能小的用例集.启发式搜索算法将组合测试用例集生成问题转化为搜索问题,并使用元启发式算法生成用例集.启发式搜索算法通常能够生成较小规模的用例集,但需要较长的计算时间.为了解决这个问题,文中提出了一种基于Spark的岛模型并行化遗传算法,利用Hadoop分布式文件系统实现了Spark运行节点间交换信息的方法,进而实现个体在子种群间的迁移.该算法首先从初始种群创建Spark的弹性分布式数据集;然后,将该数据集划分为多个子种群分布到集群的多个节点中;接着,各个子种群在各自的节点上计算适应度函数值和独立进化,并每隔一定的进化代数选择一些个体在各个子种群间迁移,提高了种群的多样性以及搜索最优解的有效性和性能;最后,算法返回满足覆盖准则的最优测试用例集.这种基于Spark的并行化遗传算法是大规模并行化在组合测试用例集生成方面的一个有效尝试.在实验部分,首先对文中提出的并行化算法进行系统的参数调整,给出适合组合测试用例集生成的推荐参数配置;接着将文中所提算法与串行遗传算法和独立运行遗传算法进行比较.实验结果表明,文中所提算法在生成用例集规模和消耗时间上均显著优于这两个算法.在运行所选实例时,该算法比串行算法加速约4至30倍,�

基于因子分解机的质量感知Web服务推荐方法1300-1313

摘要:随着Web服务市场的发展,Web服务数量日益庞大,服务的质量日益受到重视,因此为用户评估服务质量并推荐高质量的服务成为了极为重要的问题.传统的协同过滤方法用于Web服务推荐,可能会因为数据稀疏导致性能不高.近年较流行的矩阵分解技术可以用来克服推荐系统的数据稀疏问题,但是计算的时间复杂度较高,可扩展性差.为同时提高Web服务质量推荐的精度和效率,文中引入了一种通用的因子分解机模型到Web服务推荐中.因子分解机具有线性的计算时间复杂度,不仅能适应数据高度稀疏的推荐系统环境,而且很容易结合用户和推荐对象的上下文信息以进一步提升性能.文中提出的质量感知Web服务推荐方法,是在因子分解机的基础上,考虑了Web服务质量与用户(或服务)位置之间的相关性.该方法先利用位置信息计算每个用户(或服务)的相似邻居,然后将相似用户(或服务)的影响与因子分解机结合来为目标用户预测目标服务的质量,最后在预测服务质量的基础上为目标用户发现和推荐高质量的服务.在真实的Web服务调用数据集上开展实验表明,该方法在预测精度上优于其它协同过滤及因子分解推荐算法.同时由于该方法具有较低的时间复杂度,可以较好地解决大规模Web服务推荐系统的可扩展问题.

化解“信息孤岛”危机的软件模型按需服务互操作技术1314-1331

摘要:"沟通成就一切、互动创造价值".面对无处不在的网络化交互,实现"互联网+"应用的创新价值服务,其关键在于如何通过支撑供-需交互的语义互操作技术,实现多样化涉众需求制导的业务协作以及面向软件模型资源的服务供给侧可互操作构造,以化解云计算中深层Web服务资源的"信息孤岛"难题.该文从软件服务工程的角度,探索了从模型驱动架构MDA到模型交互驱动架构MiDA的演进;提出并论述了MiDA的三大内核技术,即RGPS需求元描述、服务供给侧的O-RGPS构造元模型以及互操作性元模型框架标准系列MFI(O-RGPS),揭示了三者之间多个"含意三角形"模式联动的基本过程以及虚实互动的软件模型互操作过程,阐明了MiDA与MDA的兼容性.最后,论述了作者负责研制的、面向模型语义互操作性治理与管理的ISO国际标准系列,对其中"过程模型注册元模型"的语义互操作性能力进行了分析与度量.上述理论和方法有助于提升我国"互联网+"企业在云计算与大数据关联分析方面的创新服务能力,可满足企业的动态业务协作以及面向多租户的个性化服务推荐需求,能够为供-需互动提供可互操作的服务供给侧结构,具有重要的实际应用价值.

一种基于自适应监测的云计算系统故障检测方法1332-1345

摘要:监测技术是保障云计算系统性能与可靠性的关键,管理员通过分析监测数据可以了解系统运行状态,从而采取措施以及早发现并解决问题.然而,云计算系统规模巨大,结构复杂,大量的监测数据需要搜集、传输、存储和分析,给系统带来巨大性能开销.那么,如何在提高故障检测的准确性和及时性的同时,减少监测开销成为亟待解决的问题.为了应对以上问题,该文提出一种基于自适应监测的云计算系统故障检测方法.首先,利用相关分析建立度量间的相关性,利用度量关联图选择关键度量进行监测;而后,利用主成分分析得到监测数据的主特征向量以刻画系统运行状态,进而基于余弦相似度评估系统异常程度;最后,建立可靠性模型以预测系统可能出现故障的时间,基于此动态调整监测周期.实验结果表明,该文所提出的方法能够适应云环境下负载的动态变化,准确评估系统异常程度,自动调整监测频率以提高系统在异常状况下故障检测的准确性与及时性,降低系统在正常运行过程中的监测开销.

云计算中保护数据隐私的快速多关键词语义排序搜索方案1346-1359

摘要:可搜索加密技术主要解决在云服务器不完全可信的情况下,支持用户在密文上进行搜索.该文提出了一种快速的多关键词语义排序搜索方案.首先,该文首次将域加权评分的概念引入文档的评分当中,对标题、摘要等不同域中的关键词赋予不同的权重加以区分.其次,对检索关键词进行语义拓展,计算语义相似度,将语义相似度、域加权评分和相关度分数三者结合,构造了更加准确的文档索引.然后,针对现有的MRSE(Multi-keyword Ranked Search over Encrypted cloud data)方案效率不高的缺陷,将创建的文档向量分块,生成维数较小的标记向量.通过对文档标记向量和查询标记向量的匹配,有效地过滤了大量的无关文档,减少了计算文档相关度分数和排序的时间,提高了搜索的效率.最后,在加密文档向量时,将文档向量分段,每一段与对应维度的矩阵相乘,使得构建索引的时间减少,进一步提高了方案的效率.理论分析和实验结果表明:该方案实现了快速的多关键词语义模糊排序搜索,在保障数据隐私安全的同时,有效地提高了检索效率,减少了创建索引的时间,并返回更加满足用户需求的排序结果.

基于入侵肿瘤生长优化的云计算调度算法1360-1375

摘要:随着云计算应用的发展,云计算任务调度的要求越来越复杂.群智能算法能在满足多种约束限制下,实现复杂的云计算任务调度问题,因而得到广泛应用.入侵肿瘤生长优化算法ITGO(Invasive Tumor Growth Optimization)是一种新型的启发式群智能算法,该算法通过模拟肿瘤的生长和入侵行为,在解空间中搜寻最优解,具有较高的准确性和较快的收敛速度.该文将入侵肿瘤生长优化算法离散化,提出了一种离散化的入侵肿瘤生长调度算法D-ITGO,通过将云计算任务调度方式的可行解即任务—虚拟机对应关系映射成为肿瘤细胞的坐标,使之可以应用于云计算任务调度问题;并针对云计算调度问题进行优化设计,包括:(1)设计生长细胞到入侵细胞的转换策略,使得更容易和更快地跳出局部最优解;(2)设计死亡细胞到入侵细胞转换策略,以避免浪费资源,并提高搜索效率;(3)调整生长细胞的生长步长,在逼近最优解时放慢生长速度,以避免跳过最优解.该文基于CloudSim仿真环境对D-ITGO算法以及优化策略进行了实验测试,并且使用非参数假设检验,对实验结果进行了评估和分析.实验结果和分析结果表明,这些策略均能提高收敛速率和搜索效率,其中,生长细胞到入侵细胞的转换策略和死亡细胞到入侵细胞转换策略在一定程度上减少了计算时间,生长细胞的生长步长调整策略能强化D-ITGO的搜索效率.同时,D-ITGO算法比目前应用于云计算任务调度的算法,在云任务执行时间上有7.1%~11.2%的提升,在调度开销上也有一定的优势.

复杂网络上疾病传播溯源算法综述1376-1399

摘要:流感、肺结核等呼吸道传染病严重威胁人类的健康,因此当疫情爆发时,快速、准确地推断疾病起源,对于疾病防控具有重要的理论意义和应用价值.和社交网络上的谣言传播以及计算机网络上的病毒传播不同,呼吸道疾病依赖于人际物理接触,而且具有更为复杂的疾病传播模型.在该篇综述里,作者首先介绍了人际接触网络、疾病传播模型和疾病传播溯源问题的形式化定义,以及溯源问题在传播时间、快照覆盖程度、传播源数量和传播源候选节点这四个层面上的推广,给出了溯源算法的评价指标(准确率和错误距离)和基于贝叶斯极大似然估计的设计脉络;然后分别分析了现有的溯源算法,包括基于传染源中心性的算法、基于置信传播的算法、基于蒙特卡洛的算法以及基于最小描述长度的算法.在这四类算法中,基于传染源中心性的算法最多,使用了包括传播中心性、Jordan中心性、动态年龄和无偏中介中心性共4种中心性指标,并且基于传播中心性和Jordan中心性的算法被推广到更为一般的情形,如多个传播源、快照信息不完全等.作者分别在四种理想网络和两种真实人际接触网络下,实现并比较了常用溯源算法的性能.评估结果(包括准确率、错误距离、运行时间)表明:(1)溯源算法普遍对网络结构较为敏感;(2)多数算法对疾病传播参数具有鲁棒性;(3)相对于其他算法而言,动态消息传递算法尽管耗时几乎最长,但具有最高的准确度;(4)在耗时较短的算法中,无偏中介中心性具有相对较小的误差距离.根据实验结果,根据不同的使用场景推荐了不同的算法:(1)当运行时间不重要时,推荐动态消息传递算法;(2)相反,当希望快速溯源时,应该考虑基于无偏中介中心性的算法,当网络是随机树时,Jordan中心估计算法更优;(3)反向贪心算法和动态年龄算法分别�

基于突变基因网络的致癌驱动通路检测算法1400-1414

摘要:通过检测突变驱动通路研究癌症的发病机理是当前癌症基础性研究的关键问题之一.该研究以人类基因组工程提供的体细胞突变数据为研究对象,结合基因组图谱中广泛存在的互斥性原理,提出一种新型的基于基因互斥网络的致癌突变驱动通路检测算法(Megnet).该算法首先利用大量癌症病人的体细胞突变数据,结合基因间互斥性原理构建突变基因网络,然后检测该网络中具有高覆盖的最大完全子图.为验证算法的效率和鲁棒性,我们将该算法应用于模拟数据中,结果显示所有模拟过程均在15秒内完成驱动通路检测,Megnet算法比Dendrix和Multi-Dendrix算法运行时间更短且结果准确率更高.同时为验证算法的有效性,我们将该算法应用于肺癌数据和神经胶质瘤体细胞突变数据中,结果显示Megnet算法不仅比Dendrix和Multi-Dendrix算法检测的基因集合具有更高的生物相关性和统计显著性,而且还检测出一些可供生物验证的新候选基因集合,并且这些检测的基因集合与已知的P53、RB、RAS和PI3K等信号通路及细胞循环和细胞凋亡通路具有较高的重叠.Megnet算法不需要指定通路中的基因个数和任何先验知识,为癌症发病机理研究提供新视野.该算法通过构建突变基因网络,简化了基因间相互关联关系,降低了算法复杂度,提高了致癌突变驱动通路检测的效率和准确性,对于癌症发病机理研究具有较强的理论意义和实践价值.

融合多平台表达数据的转录组差异表达分析1415-1430

摘要:差异表达分析是转录组研究的基本目标之一,对揭示基因功能和调控规律以及选择性剪切的波动变化具有重要作用.基因芯片与RNA-Seq是当前主流的测量转录组表达水平的两种实验平台,并被广泛应用于转录组差异表达分析.随着测序技术的发展,测序成本不断降低,许多研究采用多种测量平台以获得更为准确的结果.当前公共数据库中积累了大量的基因芯片和RNA-Seq表达数据,为多平台转录组数据分析提供了研究空间.研究表明:融合多平台表达数据能够提高差异表达分析的准确性和可靠性.大多数现有的融合多平台表达数据的差异检测研究主要对多种类型的基因芯片表达数据进行融合,较少考虑RNA-Seq表达数据.并且现有方法忽略了很多有用的信息,例如测量误差和重复实验产生的波动性.针对现有方法存在的问题,该文提出了融合多平台转录组数据的差异检测模型mpDE(multi-platform Differential Expression model),寻找差异表达的基因和异构体.该模型将不同实验平台的表达数据和表达水平的技术性测量误差融入到模型中,同时考虑了同一平台在不同条件下的生物重复或技术重复的波动性,从而提高差异检测准确度.该文将mpDE应用到两个人类多平台表达数据集进行差异表达检测,涉及了Affymetrix的传统3’芯片、外显子芯片、HTA2.0芯片,RNA-Seq四种常用的转录组表达水平测量平台.该文将mpDE计算结果与单平台的差异检测结果和其他多平台表达数据融合算法进行了对比.实验结果表明,mpDE获得了更为准确的差异检测结果,差异基因检测准确率与以往方法相比提高了2%~8%;差异异构体检测准确率提高了1%~15%.