发表咨询:400-808-1731
订阅咨询:400-808-1751
北大期刊
影响因子 0.51
人气 23755
北大期刊
影响因子 0.94
人气 20399
部级期刊
影响因子 1.03
人气 13574
北大期刊
影响因子 3.18
人气 11699
统计源期刊
影响因子 0.55
人气 11105
北大期刊
影响因子 0.79
人气 9750
省级期刊
影响因子 0.41
人气 9524
省级期刊
影响因子 0.57
人气 9498
省级期刊
影响因子 0.15
人气 9369
统计源期刊
影响因子 0.35
人气 8483
摘要:在分析并行应用为高效能计算机系统提出的挑战的基础上,针对Cray和IBM的相关计划,探讨了应用对高效能计算机研发计划、系统决策、系统架构以及系统软件的影响,总结了有代表性的千万亿次计算机计划及其系统,并从应用范围的角度对高效能计算机系统进行了分类;进一步综述了高效能计算机系统在体系结构、编程环境、管理以及鲁棒性等方面取得的进展.最后从应用的角度展望了高效能计算机系统的发展.
摘要:高性能计算应用在高性能计算技术的支持下为科技创新做出了巨大贡献,并且和高性能计算技术在相辅相成中不断发展.自2004年以来,中国科学院计算机网络信息中心超级计算中心针对中国科学院在“十一五”期间的高性能计算需求在全院范围内开展了多次调研活动,对中国科学院在“十一五”期间高性能计算的整体需求及各应用领域需求的分布情况有了比较全面的了解,其调研结果对“十一五”中国科学院高性能计算环境建设和高性能计算应用的发展具有良好的借鉴作用.首先介绍了国内外高性能计算应用的发展现状,并结合中国科学院高性能计算环境建设和高性能计算应用的发展情况,分析了“十一五”中国科学院高性能计算的应用需求,最后对我国高性能计算应用的发展前景进行了展望.
摘要:针对经典分子动力学和PIC方法等粒子类模拟方法具有粒子动态移动、粒子计算局部性好等共性,首先,提出了粒子量数据片对象.该对象是单网格片上的一团粒子,其中网格片是包含多个网格单元的矩形区域.然后,设计了并行算法,包括对象之间的粒子迁移和数据交换以及动态负载平衡.最后,在JASMIN框架上具体实现,进而开发了并行经典分子动力学程序和并行PIC程序.在64个处理器上实测表明,并行PIC程序模拟包含3百万个网格、2千万个粒子的复杂物理模型时,获得了80%的并行效率.
摘要:工程优化设计往往需要进行大规模的数值计算,拥有大量闲置资源的网格环境为建立这种高性能计算平台提供了可能.但是网格资源的动态性、异构性和分布性的本质特征,阻碍了网格技术在工程应用上的普及.为了利用网格环境中大量的闲置资源来协同解决实际工程中复杂的优化设计问题,建立了一个4层结构的高性能网格计算平台,并利用Kriging近似模型,在该平台上开发了以减轻基础重量和降低基础振幅为目的的多目标汽轮机优化设计的网格算法.使用该算法,在网格平台上对两个汽轮机基础进行了优化设计,与序列线性规划方法的结果比较表明所开发的优化算法有较高的计算精度.还分析了当使用不同数量的计算节点时网格的加速情况,说明所发展的优化方法能够在网格环境中高效地运行,搭建的网格平台也适合于工程优化设计.
摘要:与射线层析成像相比,Fresnel层析成像考虑波频率的影响,具有较高的分辨率,但所需的存储空间和计算量更大,因此提出了Fresnel层析成像的并行算法.把大型层析反演方程组的求解,转化成对其中的各个方程进行相互独立的计算,避免了大型系数矩阵的存储问题;把一个Fresnel带的正演和反演计算放在一个进程,不同Fresnel带的计算相互独立进行,不需要信息传递,达到了极高的并行度;从进程之间没有通信,仅当从进程计算结束后,在主进程与各从进程之间有少量的数据传递,使通信开销达到了极小的程度.应用MPI在LinuxPC集群环境下实现了该算法,实际测试表明,该算法具有较高的并行度和加速比.
摘要:多尺度现象及相关理论方法是复杂物质系统研究中重要的科学问题.单一的量子力学或分子动力学方法无法解释多尺度体系中存在的现象.第一原理离散变分线性标度(DVM-DAC)算法是一种有效的大尺度体系计算方法.它采用分而治之方案,获得了O(n)的计算复杂性.但由于需要求解大量的特征方程,实现中存在严重的计算瓶颈.发展了一种并行DVM-DAC算法并付诸实现,有效地解决了原有算法的计算瓶颈问题.测试结果表明,并行DVM-DAC算法具有很好的可扩展性,并成功完成104碳纳米管原子体系的计算,为多尺度体系研究提供重要工具.
摘要:根据图形处理器的最新可编程单元Vertex Shader和Pixel Shader的体系结构和单机Direct3D9应用程序的执行流程,提出支持Shader的Direct3D9应用程序在图形集群的透明并行化策略.图形集群的节点划分为资源分配和资源绘制节点,资源分配节点通过截取绘制接口将应用程序实时转换为6类绘制资源,包括命令流、Vertex Shader、Pixel Shader、顶点流、索引流和纹理流.资源绘制节点根据绘制资源的描述信息和资源数据重构出Direct3D9的绘制命令.图形集群中的所有绘制节点都保留全部的绘制资源,并且通过计算基于多流模式场景数据在屏幕空间的包围盒进行绘制任务划分.实验证明,使用,这种策略完全可以实现支持Shader的Direct3D9应用程序透明并行化.相对于单机绘制,基于图形集群的并行图形绘制不仅提高绘制性能而且得到较高绘制加速比.
摘要:生物基因的可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,具有重要的生物学意义.随着生物数据的快速增长,单机计算环境难以满足可变剪接研究所需要的超大计算能力.为了解决这一问题,提出了一种面向生物基因组可变剪接问题的网络并行求解方案.它充分考虑了可变剪接问题的挑战,设计了面向服务的网络资源虚拟化方案,提供了对网络资源一致的选择、访问、监控接口.通过一组API提供了面向用户的应用层支持,屏蔽了访问网络资源的细节,支持用户快速有效的开发应用程序.
摘要:逐次超松弛迭代方法被广泛应用于油藏数值模拟中压力方程的求解.其并行实现是提高模拟速度的重要途径.传统并行方案大都只是在一次迭代内进行数据划分,而没有进一步将数据划分与迭代空间划分相结合,故针对SOR算法和SMP(symmetric multi-processors)系统的特点,以OpenMP为并行化实现工具,提出了基于SMP的并行逐次超松弛迭代方法(parallelSOR).方法通过改变不同迭代步内数据点的更新次序,使不同区域内的数据点可以并行执行多次迭代.总结出针对三维油藏区域在数据空间划分和迭代空间合并上相对较优的策略,分析了迭代过程中网格块的生长形状.与传统的并行策略相比,该方法具有可减小同步开销、改进数据局部性、cache命中率高等优点.实验结果表明,该方法具有较高的加速比和效率.
摘要:程序性能特征分析是理解程序行为的基础,对识别程序性能瓶颈、了解软硬件资源利用状况具有重要作用.特别在大规模并行系统的性能评价中,受时间和空间的约束无法分析完整应用性能特征.一个有效的方法是通过抽样的方法分析应用程序部分代码的性能特征,以此代表完整应用的性能特征.分析了Profiler程序负载来源,提出了基于抽样的程序性能特征分析方法,并基于该方法实现了性能特征分析器SamplePro.与其他方法比较,基于系统抽样的程序性能特征方法在最小样本容量下得到最优的分析结果,仅需抽样分析1%~3%的程序指令就能实现小于3%的分析误差.
摘要:HPDPM系统是基于无共享群集结构的支持并行数据处理的中间件.提出了中间件系统的体系结构和主要功能模块,详细论述了利用中间件系统实现并行数据处理的方法.阐述了实现数据放置、缓存管理等关键技术的策略和方法.给出了实验和现场测试结果.利用中间件系统,为用户提供统一的服务接口和管理平台,提高了系统性能,增强了系统的可用性和可维护性,保护了用户已有投资.系统目前在大型应用工程中得到实际应用,应用中涉及的数据规模达到TB级.
摘要:基于协同式检查点的回卷恢复是在大规模并行计算机系统中得到采用的一项重要容错技术,其性能开销主要为协同协议和检查点映像存储所决定.描述了一个在MPICH2中实现的应用透明的并行检查点系统,相比已有的技术,该系统有以下特点:1)协同协议操作利用了并行应用的近邻通信特性,通过虚连接方法减少协议的处理开销;2)采用Lustre文件系统简化检查点映像文件管理的复杂性;3)通过并行I/O操作提高性能,优化检查点映像的存储过程.实际应用的测试表明,该检查点系统具有较小的运行时间开销和良好的可扩展性.
摘要:面向行业的高性能计算越来越复杂,一个任务的完成不仅仅需要计算服务,还需要数据服务以及各种辅助设备服务.依靠作业管理系统构建的高性能计算用户环境仅仅支持作业间的时序依赖,没有容错机制和健全的流程控制,不能完全满足日益复杂的面向行业的高性能计算用户的需求.基于工作流构建的高性能计算用户环境,在石油物探行业得到了较好的应用.它不仅便于业务流程的创建和控制,而且扩展了各种关系依赖和流程语义,特别是具有检查点功能的基于事件模型的工作流引擎,给系统提供了可靠性保证.这使得基于工作流的高性能计算用户环境能够灵活地适应不同用户环境的变化.
摘要:广义Hermitian特征问题并行求解器的性能依赖于所选择的并行算法和矩阵的分布策略等诸多方面.基于块存储和快算法策略,提出了一个新的标准化转化的并行算法,该并行算法将Cholesky分解结合到广义特征问题标准化转换中,降低了已有并行算法的通信开销,并增加了算法的并行性.新算法可显著改善已有并行算法的性能和可扩展性.另外给出了一个有效求解具有多个右端项的三角矩阵方程AX=B的并行块算法.通过自主开发的特征问题并行软件包PSEPS的测试结果表明,并行算法比传统的并行算法快大约1倍,并具有较好的可扩展性.