科学计数法的方法汇总十篇

时间:2023-09-10 14:57:54

科学计数法的方法

科学计数法的方法篇(1)

企业间因为信息化而加速了沟通进程,同时也发展了市场经济,促使市场竞争日趋白热化,企业必须抓住信息化发展基于实现持续发展。企业中很多员工都会使用计算机办公软件,而软件应用也会提高其工作效率。但是,因为不同软件的数据结构不一样,使用时容易出现各种问题,只有运用计算机软件数据接口来进行解决。

1 计算机软件数据接口应用情况

所谓计算机数据接口,即软件开发商按照数据软件的互动交流给用户提供规范软件,以提高应用效率。其特点就是安全灵活,应用效率高,用户可以利用数据接口在不同的计算机上一起使用软件。如今我国有固定格式数据文件、应用程序API函数、数据库等不同的计算机软件数据接口规范。在计算机软件使用中,数据接口发挥着纽带作用使不一样的数据接口计算机软件被连接,便于用户使用,工作效率也很高。

安全隐患一直是计算机软件数据接口的重要问题,对用户的使用影响很大。相关程序开发时,倘若在前台页面或者后台数据库中对信息进行直接调取,那么黑客就能够通过迅速分析应用程序引用对象来盗取整个数据库的基本逻辑结构。要是用分布式远程数据库访问接口,开发人员还要对应用数据库中的全部对象的基本信息进行合理记录,比如数据库名、用户基本资料、远程主机名等等,而记录时不能有丁点儿差错,不然就会弄丢数据库目标,进而难以查找[1]。当用户学会使用以后,才能不断掌握数据库的科学应用方法。计算机技术发展使得用户对SQL语句能够初步运用,所以使用时能够绕开应用程序直接交互使用SQL,而这种数据库对象的访问不安全,数据很容易不一致。网络技术的广泛使用让黑客与网络非法分子有了很多机会盗取计算机信息,造成的不良影响很大。不少人都认为在网络技术发展中软件技术的使用越来越普及,比如利用数据库查询语句与数据信息等等,而这也会相应带来安全隐患。尽管我国计算机软件数据接口技术发展并不成熟,但还是需要不断大力培养设计开发人员,加强信息核对输入与开发,使计算机数据接口功能的实现流程更加便捷。

2 计算机软件数据接口设计原则

2.1 面向对象

开发计算机软件的人认为应该要详细而复杂地设计接口才能到达更好的效果,而且各程序模块的耦合性的降低作用也更佳,并且有主减少程序的开发成本及难度。所以,在设计计算机软件数据接口时,应该针对对象来提高其合理性,并以科学的原则让软件程序的使用效率最大化。另外,还必须详细描述数据接口的各项功能。

2.2 可拓展性

软件接口的设计要以软件自身情况为基本,由于用户对软件程度的应用越来越熟练,软件系统也在持续升级,所以数据接口的升级也必须跟上脚步,这样才能确保用户的使用满意度[2]。对于第三方开发商来说,其软件接口应用会受到数据接口升级影响。所以,开发设计者应该按照可拓展性来设计数据接口,要努力不影响第三方软件运营商,以便于计算机软件数据接口用户的利益受到保护。

2.3 高容错性和高健壮性

所谓高健壮性就是当规则以外的指令被输入计算机软件数据接口时,计算机会存在额外的处理能力。优秀的系统既可以快速接受正确指令,还可以对突发指令或者规则以外的指令进行处理、判断。因为计算机软件数据接口拥有很多程序,故而开发员在设计中应该根据高容错性原则确保计算机对错误的高效处理能力,防止因为数据接口错误而影响软件系统,使其能够被正常使用。

3 计算机软件数据接口应用方法

计算机软件数据接口有应用程序接口函数、经过封装的接口函数等等,甚至还有固定格式的数据接口。事实上,对于接口形式的有效选择应该遵循计算机软件数据形式、转换要求来进行,那么才会确保它们发挥作用。

3.1 文件交换

所谓文件交换就是根据特定结构数据接口来进行数据交换,让第三方开发商与用户可以有效转换数据。ini与txt文件是两种最普通的数据文件交换模式。windows系统配置的就是ini文件,而且也是该系统的操作要求所决定的,运用windows本身的API函数可以转换文件[3]。所以,ini文件在系统配置与数据转换里运用很广。而windows系统里还有自带有txt文件,它属于文本格式,能够对开发商与程序员的软件开发过程进行记录。txt文件在日常应用中由于应用广泛而使得它成为了软件开发时统一提供操作方法的一种格式,使得程序员或者开发商能够自由应用txt文件。txt文件对于各种用户的使用需求也能响应,从而在编程与设计中与数据接口应用需求相一致。

3.2 应用程序接口函数

作为函数体系的计算机软件数据接口函数,该函数囊括了开发商在软件开发时定义好的诸多函数,而且也封装好了。就此来看,应用程序接口函数有着较好的保密性,尽管能够提供软件数据接口服务,可是并非对用户是开放的。这样一来,数据接口的安全性就有了保障,当用户在操作时就能够按照开饭时制定的规则选择合适的封装函数,做好数据交换工作。如今,国内的应用程序接口函数有着大范围的使用,不少开发商为了使转化效果更佳而公布了自身的接口函数,希望能够加强接口函数的应用力度。

3.3 中间数据库模式

在软件数据接口模式里,中间数据库模式比较常见,它属于软件开发商定义、授权的程序,公共数据库能够被自由访问。有的特定的且能够访问的数据库被开发商在开发时就定义与规范了,这是一种开发难度并不大的数据库模式,也便于用户灵活使用数据库。要是用户想对特定数据库之外的别的数据库进行访问,那么就应该深入地分析别的数据库的相关配置,要是数据模式太复杂了,就会提高中间数据库模式的应用难度。因此,这是一种应用范围并不广泛的中间数据库模式,也不适宜广泛地进行推广使用。

4 结束语

总的来说,信息技术所提供的便捷性使得其应用的范围越来越广泛,但是由于计算机软件种类繁多,而且其数据结构也不统一,所以在同时使用很多软件的时候容易出现数据不兼容的情况,这样不仅会影响计算机的整体运行效率,而且也会影响用户的工作效率。而计算机软件数据接口的出现很好的解决了这样的一个问题,计算机软件数据接口相当于桥梁纽带的作用,能够最大程度的缓解各软件之间的不兼容问题,以向用户提供更加便捷的服务。为使计算机软件数据接口的应用更加广泛,在对其进行设计的时候应遵守一定的原则和规范,这样才能够最大程度的发挥出其作用。换言之,计算机软件数据接口的应用对于计算机软件系统的发展和推广具有十分重要的意义。

参考文献

科学计数法的方法篇(2)

中图分类号: TP391.1

文献标志码:A

0引言

近年来,随着工业规模的不断扩大,工业技术的不断发展以及自动化水平的不断提高,工业监控从传统的现场监控发展到了远程监控模式[1]。对于工业远程监控系统而言,其数据传输的可靠性、实时性和网络覆盖范围的灵活性是评价其性能的主要指标[2]。通用分组无线服务(General Packet Radio Service, GPRS)无线网络以其覆盖范围广、实时在线、按量计算等优点[2],在工业远程监控中比其他有线和无线方式的传输网络应用更加广泛[3]。但GPRS的网络传输速率不高,传输大量数据时会造成系统传输延迟,在各行业远程监控系统中,为高效利用GPRS网络有限的通信通道完成数据的传输,研究人员提出了适用于多种数据形式通用无损压缩方法[4]及有损压缩方法,通用无损压缩方法有基于Huffman编码技术的方法[5-7],解决了如全球定位系统(Global Positioning System, GPS)数据、记录数据等数据的压缩传输问题;基于LZW(LempelZivWelch)算法的数据压缩算法[8-10],通过建立快速字典查找方法,减少文本数据及电能数据的压缩时间,提升传输效率。有损压缩方法有基于小波变换与LZW等算法的结合方法[11-13],能够快速压缩监测的电能和震动数据的波形文件。工业监控数据的精度要求使得有损压缩是不适合的,只能以无损压缩实现压缩传输,然而通用的无损压缩算法由于忽略浮点数本身的特性[14]及监控数据间的关系,在工业监控数据的无损压缩上无法取得很好的效果。

文献[15]分析了双浮点型科学计算浮点数的特点后提出的科学计算浮点数压缩(Floating Point data Compression, FPC)算法能够提供较高的压缩吞吐量,适合监控数据的压缩,但压缩率普遍不高。本文根据FPC算法直接应用时预测器结构的不足,将其改进后作为工业监控数据中浮点数部分的压缩算法,提出基于改进FPC算法的工业监控数据无损压缩方法――BFPC(Block Floating Point data Compression),实验结果表明对FPC算法的预测器的改进能够提高预测精度,提高浮点数部分压缩率,BFPC方法与经典的通用无损压缩算法相比,在压缩率和压缩效率上都有所提高,大幅减少了传输时间,提高了监控系统实时性。

1工业远程监控数据特点

现在的大型工业生产过程都是通过一些可编程控制器如PLC(Programmable Logic Controller)进行控制的,远程数据的监控就是对控制器中所采集的传感器值和所输出的控制值进行定义后通过无线网络GPRS向远程服务器端传输,其传输数据的结构如图1所示,数据值前的数据格式及数据地址作为数据值的定义部分是为了方便远程接收端的解析,远程服务器端接收后再对接收值进行实时显示及定时存储。为了满足计算与显示精度,监控值存储时会转化为单精度浮点数,其精度的要求决定本文研究的是其无损压缩方法。

浮点数形式的存储与其他数据类型的存储方式有本质的不同,单精度浮点数根据IEEE754[16]的存储规则如图2所示,可以看出通用的无损压缩算法由于忽略了浮点数尾数部分的变化幅度大的特点,始终以字节为单位进行压缩,导致基于统计的无损压缩算法的各字节出现频度相近,基于字典的无损压缩算法出现相同字符串可能低,即通用无损压缩算法对浮点数据的压缩一直不理想。除了浮点数存储的特点,工业远程监控数据还存在其他的特点,对于稳定的控制系统而言,其监控值随时间的变化是很微小的,而且工业现场所监控的传感器值都有其物理意义,比如温度、流量等,同一种生产工艺相同物理意义的值之间存在很强的规律性。

2FPC算法的改进

FPC算法的原理简单来说就是利用有限上下文方法(Finite Context Method, FCM)[17]与差值有限上下文方法(Differential Finite Context Method, DFCM)[18]预测器获得预测值,再将预测值与真实值进行异或操作获得异或值,最后根据较小异或值的前导零字节数及预测器编号进行编码实现压缩。文献[14]证明了预测精度与压缩率的关系,所以通过对FPC算法的预测器结构进行改进使得预测精度提高能够提高其压缩率。

2.1FPC算法预测器结构的不足

FPC算法在直接应用时预测器部分的不足主要有以下几点:预测器只依据待压缩数据之间的关系对下一个值进行预测,忽略了各值在时间线上的规律;使用同一预测表存储不同块中可能出现的相同上下文预测规律,使得预测表中的存储值被不断覆盖,降低了预测环节的准确度;造成后一步过程的数据预测前一步过程的值即逆过程预测,使得预测表中存储了无效的预测规律。其中预测规律的覆盖是由于其预测表中值的刷新,以FCM预测器的预测表值刷新操作作为说明,其预测表在每次压缩后都会进行刷新操作,步骤的伪代码如算法1所示。

算法1Fcm_Update。

程序前

input: True_Value, hash;

output: FCM

Begin:

hash=(hash shl 6) XOR (True_Value shr 21) AND 0x0fff;

FCM[hash]=True_Value;

End

程序后

可以看出Hash值更新时若采样的真实值之间有相同的规律,但此规律更新存储的真实值不同就会导致预测规律的覆盖,特别有些监测值的数量级比较接近,相同的预测规律较容易出现从而降低其预测精度。DFCM预测器的刷新操作与FCM预测器类似。

2.2对于预测器结构的改进

针对以上的不足,本文提出了对其预测器结构的几点改进:考虑时间线上的规律,在原有预测器的基础上加入时间序列预测器,由于时间线上的值变化幅度较小,这里的时间序列预测器直接使用前一采样点的真实值作为下一采样点的预测值;为避免规律覆盖,将待压缩数据按物理意义分块,使用不同的预测表存储预测规律;为避免逆过程预测,各块首值不通过FPC预测而使用一阶指数平滑法预测,如式(1)所示:

st=ayt+(1-a)st-1(1)

其中:st表示对t+1时刻的预测值,yt表示t时刻的真实值,a表示平滑系数,本文取a为0.7。

对预测结构的改进如图3所示,改进后的预测结构在压缩的处理时间上不会有很大的增加,而空间存储上可以使用相同的预测表总存储量。改进后的FPC算法对各块数据的压缩主体过程伪代码如算法2所示,其中对于n-c串(预测器编号-剩余字节个数)的构成方法与原FPC算法类似,只不过将原来用一位存储的预测器编号改为两位存储。

需要注意的是改进后FPC需要对各块的一阶指数平滑的y1及FCM、DFCM预测表赋初始值,这里使用初次采集的数据进行初始化而不对其进行压缩,解压缩时的初始化也使用此初次读取的数据,对各块预测器的初始化操作的伪代码如算法3所示,整个改进后算法的处理过程由一个算法3和分块总数个算法2构成。

算法2

IMFPC(improved FPC)。

程序前

input: 块输入数组, 块内浮点数个数, 一阶指数平滑预测值,三个预测器的存储数组;

output:块输出数组, 块输出字节个数;

Begin:

初始化FCM与DFCM的预测Hash码为0;

for i:=1 to 块内浮点数个数do

从输入块中读入浮点数真实值;

if i==1 then

将指数平滑预测值与真实值相异或得异或编码值;

else then

从3种预测器中得到三个预测值;

将3个预测值分别与真实值异或得三个异或值;

取3个异或值中最小的作为异或编码值;

按规则更新FCM与DFCM预测器的Hash码;

End if

计算所获得的异或编码值的剩余字节个数;

将n-c串存入输出数组的n-c串存储部分;

将剩余字节存入输出数组的剩余字节存储部分;

更新输出字节个数;

End for

End

程序后

算法3INIT(初始化)。

程序前

input: init_buff

output: FCM, DFCM, y1

Begin:

y1:=init_buff[0];

FCM[0]:=init_buff[0];

DFCM[0]:=init_buff[1]-init_buff[0];

End

程序后

2.3基于改进FPC算法的BFPC压缩结构

根据工业监控数据的传输格式,可以看出使用改进FPC算法对浮点数部分压缩后,其传输数据域的定义部分没有被压缩,这里根据数据值部分压缩后得到的前一部分n-c串字节值大小比较集中的特点,使用区间编码[19-20]对定义部分及n-c串部分进行压缩,整体的基于改进FPC算法的压缩方法BFPC的结构如图4所示。

3实验结果与分析

3.1实验平台及实验数据

实验平台:VS2010,计算机主频3GHz,内存2GB,操作系统为32位Windows 7系统。

实验数据:由于真实工业数据涉及工业生产工艺方面的机密,而且每个工业监控数据的规则都不一样,不具备代表性。所以本文实验所用的数据是根据工业监控数据特点模拟生成所得,共分为两种数据集:一种是随机性较强(块中规律几乎没有重复出现,下面以无复现代替)的数据集; 一种是规律性较强(块中规律重复出现,下面以有复现代替)的数据集,生成这两种数据是为了说明在较理想状况与最差状况下压缩算法改进的有效性。

数据集生成过程为:

第1步按规则生成监控数据的设定值(稳定值),传感器值按照正态分布取值如表1所示,原因是对于一种工业生产过程,其使用传感器量程基本一致。取值时假设传感器的线性范围[21]在其最大量程的中间值左右,所以按其量程中间值左右一段范围取正态分布随机数N(μ,σ2),其中μ为均值,σ2为方差。执行器开度值的取值范围是在假设执行器的线性范围在中间值附近的情况下选取的,这里选择在区间(1/3,2/3)内取随机值。

第2步每个监控值按其设定值的稳态误差(这里假设为5%的稳态值)取随机值生成100个采样点的数据,生成时完全随机的是无复现数据集,生成时每块按不同规则重复出现的是有复现数据集,有复现指输入块的值在特定个数的采样周期(本文取10、20、30、40、50)后重复出现一次。最后加入数据的定义部分,数据地址为2字节不同整数,数据格式为单字节数据。

按照不同的数据量及1输入对应1输出的原则,共取5种数据量的数据集存入float1.all至float10.all共10个文件中,其中float1.all与float2.all中存储500监控值的无复现与有复现监控数据,后面的8个文件中存储的数据量按100递增,每两个一组分别存放无复现与有复现数据。由于对于FPC算法改进前后的对比与每块的数据量没有关系,所以在对比改进FPC算法前后的实验中仅使用数据量为500的两个数据集,之所以选择500个数据作为初始数据量是因为在GPRS上载速度[22](大约为13.4kb/s)下此数据量的监控数据能够引起秒级延迟。

3.2预测及压缩的性能指标

本文对比的预测及压缩性能有:可压缩预测比k、压缩率、压缩时间、解压缩时间、传输时间减少百分率R,其中可压缩预测比k定义如式(2)所示:

k=NrB

其中NrB

R=Npre/V-Ncom/V-Tcom-TdecNpre/V×100%(3)

其中:V代表网络传输速率; Npre 代表压缩前的数据量,Ncom代表压缩后的数据量; Tcom代表压缩时间,Tdec代表解压缩时间,压缩率是指压缩前的数据量与压缩后数据量的比值。可压缩预测比大小表示预测精度高低,比值越大精度越高,传输时间减少百分比用于表示各无损压缩算法的综合性能,其值越大代表综合性能越好。

3.3分块后的预测性能分析

由于验证分块前后的预测性能需要保证预测表的存储量不变,而分块后总的存储量必然增加,所以不对比压缩率与压缩及解压缩时间,仅对比能反映预测精度的可压缩预测比。对比结果如图5所示,可以看出随着压缩过程进行分块后的可压缩预测比在10次采样压缩之后都大于分块前,特别是对于有复现的数据,分块后的趋势相比分块前有明显的增加趋势,10次之前有些可压缩预测比较低的原因是原预测表面向的是全部的数据,数据量较大,在规律覆盖不明显的压缩初期优势更大。综合而言分块后可以保存更多的预测规律。

3.4改进预测结构后压缩性能分析

本节对比结构改进前后压缩率、可压缩预测比的变化以及平均压缩解压缩时间的大小,最后计算了随采样的待压缩数据的增加,所加入的时间序列预测器的使用率情况。在两种数据集上的压缩率实验结果如图6所示,可以看出整体而言改进后FPC算法的压缩率高于改进前,而且对于有复现的数据,改进后的算法的增加趋势较改进前更加平稳。

由于图5已经表现了分块前后可压缩预测比的趋势变化,可以肯定的是加入时间序列预测器后其趋势变化不大,所以本节对比其平均值以及平稳性(方差的大小)。结果如表2所示,可以看出改进后的FPC算法的可压缩预测比的均值增加了10%以上,方差降低了约10倍,改进后的可压缩预测比不仅在比值的大小上提高了,在平稳性上也提高了。

改进后时间序列预测器的使用率计算结果如图7所示,从图中可以看出,对于无复现的数据集而言,其值保持在0.55以上,而对于有复现的数据而言,其值随时间会有明显的下降,原因是对于有复现的数据,原有的FCM及DFCM预测器能够存储较为明显的预测规律,其预测效果逐渐比时间序列预测器的预测效果好。但不可否认的是即使是有复现的数据,时间序列预测器的使用率最后也会在0.4以上,说明加入时间序列预测器是有必要的。

由于压缩时间的大小只与数据量大小及程序的指令多少有关,随着压缩过程的进行其压缩时间不会出现较大波动,所以本节只比较改进前后的平均压缩及解压缩时间,结果如表3所示,可以看出改进前后平均压缩与解压缩时间几乎相同,改进后平均压缩时间有略微的增加,是加入预测器所带来的程序指令的增加所导致的,可以认为改进的FPC算法依然有很快的压缩与解压缩的处理速度。

3.5与通用无损压缩算法的压缩性能对比

本节对BFPC算法与通用无损压缩算法在压缩不同数据量的监控数据时的压缩性能作对比实验。结果如表4~9所示,表中DyHuff指自适应Huffman算法,Range指区间编码,LZW指基于字典的LZW算法。与常用的压缩工具(rar、zip等)所使用的静态压缩模型不同的是,实验中Huffman算法与区间编码使用的是自适应的压缩模型,原因在于使用静态压缩模型需要对原数据读取两次,且传输时需要将模型的构造细节一并传输,在本文所解决问题的数据量下不仅增加了压缩时间,也降低了压缩率。表4、表6、表7和表9中加下划线的结果只对于同一文件平均压缩解压缩时间最低的结果,表5和表8中加下划线的结果表示对于同一文件平均压缩率最高的结果。

从表4~9可以看出对于不同数据量及不同类型的数据,BFPC算法的压缩率一直高于通用的无损压缩算法。虽然在表8中可以看出其平均压缩率有下降的趋势,其原因在于随着块中数据量的增加,块内数据规律也会出现覆盖,考虑到实际监控时会同时监控多个工业现场的情况,每个监控现场所使用的预测表存储量不会很大从而导致块内规律的覆盖,但其下降的趋势是微小的,与通用无损算法中压缩性能最好的区间编码相比,对于无复现的数据提高了12%的平均压缩率,对于有复现的数据提高了28.2%的平均压缩率。从压缩率的比较上可以发现相比无复现数据, BFPC的平均压缩率在有复现数据上是有明显提升的,而通用无损压缩算法几乎没有变化,即BFPC算法对于规律性较强的工业监控数据可以提供更高的压缩率。

对于压缩与解压缩的平均时间比较,BFPC算法的平均压缩时间是最低的,LZW算法的解压缩时间是最低的,但LZW算法的压缩时间是BFPC算法的近30倍,BFPC的解压缩时间为LZW的5倍左右,综合而言在平均压缩解压缩时间的比较上BFPC优于LZW算法。从以上的比较中可以看出BFPC在提供较高压缩率的同时还拥有较高的压缩与解压缩效率。在综合指标传输时间减少百分比的比较上,从表4~9中可以看出压缩与解压缩的时间都是毫秒级的,而实验所选取的都是在理想情况下会导致秒级传输延迟的数据量,则压缩与解压缩的处理时间在计算传输时间减少百分比时可以忽略不计,式(3)可以简化为式(4):

R≈Npre-NcomNpre×100%=1-1Rcom×100%(4

可以看出传输时间减少百分率与压缩率Rcom成正比,即压缩率越高,时间减少百分率越大。对于无复现与有复现的数据,本文算法的压缩率分别在1.31与1.5左右,高于通用无损压缩算法,能够减少23.7%至33.3%的传输时间,提高监控系统的实时性。

4结语

本文提出了基于改进FPC算法的工业远程监控数据分块压缩方法BFPC,首先分析了通用无损压缩算法无法很好压缩监控数据浮点数部分的原因,从而引入FPC算法,然后分析了FPC算法在直接应用时其预测器结构的不足,根据监控数据的特点对其预测器进行改进,最后与区间编码结合后完成对整个监控数据的压缩。实验部分首先对改进FPC算法前后对浮点数部分的压缩性能进行了对比,结果表明改进后的FPC算法在保持高压缩效率的情况下提高了压缩率,最后将基于改进FPC算法的压缩方法BFPC与通用无损压缩算法的压缩性能作对比,实验结果表明BFPC方法提高了12%以上的压缩率且降低了38.5%以上的压缩时间,在忽略压缩与解压缩时间的前提下降低了23.7%以上的传输时间,对于传输效率不高的GPRS网络而言,在传输大量监控数据时能够大大提高监控实时性,而且由于压缩后数据传输时避免了明码传输,对于数据安全方面有一定的保护作用,有一定的应用价值。

参考文献:

[1] WANG J. Research summarize of GPRS DTU based on GPRS[J]. Application Research of Computers, 2005, 22(11):92-93.(王俊佳. 基于GPRS的工业现场数据控制器研究[J]. 计算机应用研究, 2005, 22(11):92-93.)

[2] ZHU L, WU Z, LI Q. Research and implementation of selforganized network structure in the industrial remote monitoring system[J]. Computer Measurement and Control, 2012, 20(1):15-18.(朱林, 吴战国, 李琦. 工业远程监控系统中自组织网络结构研究与实现[J]. 计算机测量与控制, 2012, 20(1):15-18.)

[3] XU H. Remote measuring and control system based on Web and GPRS[J]. Electric Power Automation Equipment, 2009, 29(7):134-137.(徐海峰. 基于Web技术GPRS技术的远程测控系统设计[J]. 电力自动化设备, 2009, 29(7):134-137.)

[4] ZHEN C. Research of several common lossless data compression algorithms[J]. Computer Technology and Development, 2011,21(9):73-76.(郑翠芳. 几种常用无损数据压缩算法研究[J]. 计算机技术与发展, 2011, 21(9):73-76.)

[5] SHI P, LI M, YU T, et al. Design and application of an XML data compression algorithm based on Huffman coding[J].Journal of Beijing University of Chemical Technology: Natural Science, 2013, 40(4):120-124.(施鹏, 李敏, 于涛, 等. 基于Huffman编码的XML数据压缩方法[J]. 北京化工大学学报:自然科学版, 2013, 40(4):120-124.)

[6] YANG J, ZHANG N, LI Y, et al. Improved Huffman codingbased data transmission and compression method for agricultural machinery operation[J]. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(13):153-159.(杨敬锋, 张南峰, 李勇,等. 基于改进Huffman编码的农机作业数据传输压缩方法[J]. 农业工程学报, 2014, 30(13):153-159.)

[7] LIU X, CHEN K, YU X. Huffman coding and application in compression for vector maps[J]. Journal of Geomatics Science and Technology, 2014, 31(1):89-92.(刘兴科, 陈轲, 于晓光. Huffman编码在矢量地图压缩中的应用[J]. 测绘科学技术学报, 2014, 31(1):89-92.)

[8] HU P, ZHANG J. Study and implementation for terminal data compression technologies in remote fault diagnosis system[J]. Computer Engineering and Applications, 2012, 48(34):130-135.(, 张金钟. 远程故障诊断终端的数据压缩技术研究与实现[J]. 计算机工程与应用, 2012, 48(34):130-135.)

[9] BARR K C, ASANOVIC K. Energyaware lossless data compression[J]. ACM Transactions on Computer Systems, 2006, 24(3): 250-291.

[10] MA S, ZHEN C, ZENG Y, et al. . Data compression based on signal periodic similarity and LZW Encoding[J]. Electrical Measurement and Instrumentation, 2014, 51(6):95-100.(马士强, 郑常宝, 曾野,等. 基于信号周期相似性和LZW编码的数据压缩方法[J]. 电测与仪表, 2014, 51(6):95-100.)

[11] WANG C, WANG J. Data compression method based on energy threshold and adaptive arithmetic encoding[J]. Automation of Electric Power Systems, 2004, 28(24):56-60.(王成山, 王继东. 基于能量阈值和自适应算术编码的数据压缩方法[J]. 电力系统自动化, 2004, 28(24):56-60.)

[12] ZHANG F, LAN L, ZOU J, et al. Data compression with wavelet transform and LempelZivWelch (LZW) coding[J]. Journal of Beijing University of Chemical Technology: Natural Science, 2013, 40(2):100-105.(张凤元, 兰丽, 邹佳,等. 小波变换结合LZW压缩算法探究[J]. 北京化工大学学报:自然科学版, 2013, 40(2):100-105.)

[13] SUN P, GUO Q, WANG Q, et al. Twodimensional discrete wavelet transform compression algorithm for power quality data[J]. Journal of Computer Applications, 2014, 34(1):234-237. (孙佩霞, 郭庆, 汪谦,等. 二维离散小波变换电能质量数据压缩算法[J]. 计算机应用, 2014, 34(1):234-237.)

[14] HE K. High performance lossless compression of scientific floating data[J]. Chinese Journal of Computers, 2010, 33(6):966-976. (何克晶. 科学计算浮点数据的高性能无损压缩[J]. 计算机学报, 2010, 33(6):966-976.)

[15] BURTSCHER M, RATANAWORABHAN P. High throughput compression of doubleprecision floatingpoint data[C]// Proceedings of the 2007 IEEE Data Compression Conference. Piscataway: IEEE, 2007: 293-302.

[16] IEEE 754: Standard for binary floatingpoint arithmetic[S/OL].[20150122].http:///groups/754/.

[17] SAZEIDES Y, SMITH J E. The predictability of data values[C]// Proceedings of the 30th Annual IEEE/ACM International Symposium on Microarchitecture. Piscataway: IEEE, 1997: 248-258.

[18] GOEMAN B, VANDIERENDONCK H, de BOSSCHERE K. Differential FCM: increasing value prediction accuracy by improving table usage efficiency[C]// Proceedings of the 7th International Symposium on HighPerformance Computer Architecture. Piscataway:IEEE, 2001: 207-216.

[19] MARTIN G N N. Range encoding: an algorithm for removing redundancy from a digitised message[C]// Proceedings of the 1979 IERE International Conference on Video and Data Recording.Piscataway: IEEE, 1979: 187-197.

科学计数法的方法篇(3)

计算数学作为数学学科一个精细分类,其递推法的应用与其他数学分支一样,既作用在数学学科自身,也对其他学科与实用科研应用提供了支持。

1.1数学学习丰富性运用

根据数学的纯粹数学与应用数学的基本分类,计算数学递推法的应用对数学学习的丰富性作用体现在两个方面:一是,纯粹数学学习丰富运用。计算数学的递推法作为一种借助已知条件的简单算法,其对纯粹数学的空间形式几何类学习、离散系统代数类学习与连续现象分析类学习,都具有在学习与解题方法上的化繁为简的作用。例如,在几何类的学习中,几何关系中数形关系、数量关系之间的证明与求解,计算数学的递推法的顺推方法是最长见的应用,即从已知推导出问题的答案。二是,应用数学丰富性运用。计算数学从数值计算与分析层面对应用数学进行了丰富,计算数学递推法的应用不仅丰富了计算数学本身的相关方法,也为计算数学的广泛运用做出了科学性突破。例如,基于演化策略的最优统计聚类算法,在液体火箭发动机推进系统超高维故障样本数据计算与分析;再如,计算数学递推法在概率中的运用,在现实生活中的购买等活动即是其最基本的应用之一。

1.2其他学科学习支持性运用

站在应用数学的相对宏观科学视角,因计算数学自身对其他学科学习的支持作用,其递推法相应地被适当地运用。其一,模糊数学的兴起。其是与计算机功能结合的初步运用于模糊控制、识别、聚类分析、决策、评判,以及系统理论、信息检索、医学、生物学等各个方面,且以不确定事物为研究对象的计算数学运用,当前在心理学、控制学与气象学有着较为显著的成果。其二,其他理工科学科学习的运用支持。较为典型的学科有力学、物理、化学、计算机技术、医学与工程技术等,计算数学递推法的应用会满足这些学科基本的空间关系、逻辑关系与其他的关系数据支持,让这些学科的学习在更加精确的数据与数学方法支持下,开展更加深入的学习与发展。

1.3科研实用性应用

计算数学递推法的科研实用性应用,实践中主要表现在两个方面:首先,生活与工作需要的科研性应用。即为了改善、满足生活与工作中的各种需要,而运用计算数学递推法开展的相关活动,使自己的需要达到相对精确的理想水平。在当前生活中应用较多的,就是那些民间兴趣性的机械制造行为,如飞机、汽车甚至潜艇的制作,他们都需要运用计算数学对其中各个部件的数据进行计算以确保其科学性与安全性等。工作的应用典型表现在各种建设工程的施工过程中,由于设计图纸和现实工作环境的非一致性,需要根据实际情况作出适当地修正等,或者需要在原来的基础上增加一些技术性的支持等,就需要运用计算数学递推法快速地完成数值计算与分析工作,以确保工作的顺利开展。其次,创新需要的科研性应用。创新无论对于国家民族,甚至一个企业等都具有根本性的积极意义。尤其在科技高速发展的时代,科研创新更具有决定企业等生死存亡的重大意义。计算数学递推法因其对数值计算与分析的简捷性,能为各种创新研究赢得时间和推广应用的最佳机遇。例如,离散元与有限元耦合的时空多尺度递推法计算、光谱透射比测量的信号波动递推法计算分析与数据处理、航空航天飞行器的温度变化承受能力数据递推法计算与分析等。总之,上述两种不同层次的科研性应用,一方面满足了基本的生活与工作的应急需要,另一方面站在科学发展的高度对相关学科与行业的发展起到了基础性的创新支持。

2计算数学递推法应用开发思考

计算数学作为应用数学的一个部分,其递推法应用所带来的计算简捷与高效,为其创设了更加广阔的运用科技。在信息科学的支持下,尤其是高速计算机的运用,为各种应用创设了“实践能力培养所需的基本技能”的平台。

2.1数学知识间边缘性开发

在知识爆炸性增长的时代,各学科都在朝着更加精细化的方向发展,在各种应用性需要的情况下,也就催生了更多的边缘性数学学科。由于计算数学的高应用价值,计算数学递推法也在随着计算数学本身被边缘化开发。首先,计算数学递推法应用方向的边缘化。即在实际应用方向的边缘化,其中较为典型的如计算数学仿真(如三维数值模拟技术、不同时刻非均质油藏含水饱和度分布与前沿饱和度位置的计算预测)、计算数学模型(如机载成像仿真系统的误差建模)与“计算数学组织理论”等,尤其是结合各种领域的实际发展需要,把计算数学与计算数学递推法推向更加精细与纵深的边缘化。其次,计算数学递推法自身发展方向的边缘化。即在计算数学的自身范畴内的边缘化发展,虽然属于应用数学的范畴却是按照“纯粹数学”的方式实现自身的发展,使其具有更强大的适应能力,如计算数学的计算机演示、计算数学与纯粹数学的结合与计算数学递推法的稳定性等边缘化。

2.2学科间结合性开发

就是与其他学科或领域结合性的应用功能开发,不仅发挥了计算数学与计算数学递推法的优势,也为其他学科的拓展激活了创新的灵感。表现在两个方面:第一,结合后的新学科产生。这类学科主要集中在计算数学领域,以计算数学及其递推法广精细化的发展为主要特征,如计算力学(如转换位移自由度法求解滑动接触等方面计算知识)、计算物理、计算化学与计算生物等交叉学科,在自然科学、社会科学、工程技术与国民经济的各个领域得到了日益广泛的应用。第二,结合后的某种应用性侧重发展。在当前主要表现为计算数学递推法融入进其他学科领域后,对其他学科或领域产生的支持性拓展作用,使其得到了更为广阔的发展。如计算数学在血浆置换治疗中的应用,计算数学模型在路基工程最优化的应用,“反向递推非线性控制方法在三相四桥臂逆变器非线性系统”中的应用等。

3计算数学递推法应用的应用范围开发

计算数学递推法站在数学及应用数学服务生活、工作与各项研究的最前沿,其应用范围或适用范围的研究,是当前提高其应用率与推动自身创新的动力之一。

3.1计算数学递推法应用业务开发

由于计算数学递推法不仅为数学自身的发展创设快捷的计算方式,也为其他相关学科与科研构建了高效的计算平台,因而,其应用业务也随着计算数学本身所需要运用的计算技术与相关配套软件的开发被开发出来。首先,计算数学递推法应用软件自身的开发。主要是服务于各种计算应用,例如上述所谈到的生物学、航天速度仿真、机械制造与人体医学微观变化测定等。在实际的业务应用中,各领域只需要打开相关的软件输入基础数据就可以得出需要计算的数据,为其工作与研究的继续开展打下基础。其次,计算数学递推法与其他数学方法以及其他学科研究方法结合性应用开发。当前,主要体现在计算数学或应用数学领域内,如顺推法、逆推法与有限插值法、有限元素法等结合性运用,从实践的层面丰富了存在性、唯一性、收敛性和误差分析等理论。

3.2计算数学递推法应用人才培养

科学计数法的方法篇(4)

中图分类号:TP31 文献标识码:A 文章编号:1006-4311(2013)09-0220-02

0 引言

随着计算机现代智能的高速发展,计算机已经完全融入我们的生活,甚至占据了重要领域,从国家核心科技到每个人生活的小细节,都离不开计算机的覆盖和使用。我们简单的在键盘上操作几个键,打出一系列符号命令,就能使计算机按照人类的要求,高速运行和进展,从而达到人力所不能达到的速度和正确率。

我们从小学习数学,数学是什么呢?数学是利用符号语言研究数量、结构、变化以及空间模型等概念的一门学科。数学,作为人类思维的表达形式,反映了人们积极进取的意志、缜密周详的逻辑推理及对完美境界的追求。数学更多的是一种抽象的概念,是一门重要的工具学科。人类利用抽象的概念及一些固定的定律形成理论,而脱离实际应用的概念并不是人类发展学习的初衷,而是利用它们来指导实际,化抽象为实体。而计算机就由此演化。1946年2月15日界上的第一台计算机诞生在宾西法尼亚大学,主要运用于高倍数的数学运算。时至今日,计算机直接能识别的语言仍然是1、0二进制代码。

1 计算机中所需要的数学理论

计算机学科最初是来源于数学学科和电子学学科,计算机硬件制造的基础是电子科学和技术,计算机系统设计、算法设计的基础是数学,所以数学和电子学知识是计算机学科重要的基础知识。计算机学科在基本的定义、公理、定理和证明技巧等很多方面都要依赖数学知识和数学方法。计算机数学基础是计算机应用技术专业必修并且首先要学习的一门课程。它大概可分类为:

1.1 高等数学 高等数学主要包含函数与极限、导数与微分、微分中值定理与导数的应用、不定积分、定积分及应用、空间解析几何与向量代数、多元函数微分法及其应用、重积分、曲线积分与曲面积分、无穷级数、微分方程等。各种微积分的运算正是计算机运算的基础。

1.2 线性代数 线性代数主要包含行列式、矩阵、线性方程组、向量空间与线性变换、特征值与特征向量、二次型等。在计算机广泛应用的今天,计算机图形学、计算机辅助设计、密码学、虚拟现实等技术无不以线性代数为其理论和算法基础的一部分。

1.3 概率论与数理统计 概率统计与数理统计包含随机事件与概率、随机变量的分布和数学特征、随机向量、抽样分布、统计估计、假设检验、回归分析等。概率论与数理统计是研究随机现象客观规律并付诸应用的数学学科,通过学习概率论与数理统计,使我们掌握概率论与数理统计的基本概念和基本理论,初步学会处理随机现象的基本思想和方法,培养解决实际问题的能力。这些都是计算机编程过程中不可或缺的基础理论知识和技能。

2 计算机编程中数学理论的应用

计算机的主要专业知识包括计算机组成原理、操作系统、计算机网络、高级语言程序设计、数据结构、编译原理、数据库原理、软件工程等。计算机程序设计主要包括如:C语言、C++、JAVA、编译语言、汇编语言等编程语言的基本概念、顺序结构程序设计、分支结构程序设计、循环结构设计、函数、指针、数组、结构、联合以及枚举类型、编译预处理、位运算、文件等内容,掌握利用各种编程语言进行程序设计的基本方法,以及编程技巧。算法是编程的核心,算法的运用离不开数学,数学运算正是编程的基础。

计算机科学是对计算机体系,软件和应用进行探索性、理论性研究的技术科学。由于计算机与数学有其特殊的关系,故计算机科学一直在不断地从数学的概念、方法和理论中吸取营养;反过来,计算机科学的发展也为数学研究提供新的问题、领域、方法和工具。近年来不少人讨论过数学与计算机科学的关系问题,都强调其间的密切联系。同时,人们也都承认,计算机科学仍有其自己的特性,它并非数学的一个分支,而有自身的独立性。正确说法应该是:由于计算机及程序的特殊性,计算机科学是与数学有特殊关系的一门新兴的技术科学。这种特殊关系使得计算机科学与数学之间有一公共的交界领域,它范围相当广,内容相当丰富,很富有生命力。这一领域既是理论计算机科学的一部分,也是应用数学的一部分。

2.1 计算理论是关于计算和计算机械的数学理论。主要内容包括:

①算法:解题过程的精确描述。②算法学:系统的研究算法的设计,分析与验证的学科。③计算复杂性理论:用数学方法研究各类问题的计算复杂性学科。④可计算性理论:研究计算的一般性质的数学理论。⑤自动机理论:以研究离散数字系统的功能和结构以及两者之关系为主要内容的数学理论。⑥形式语言理论:用数学方法研究自然语言和人工语言的语法理论。

2.2 计算几何学是研究几何外形信息的计算机表示,分析和综合的新兴边缘学科,它是计算机辅助几何设计的数学基础。主要内容如:贝塞尔曲线和曲面、B样条曲线和曲面、孔斯曲面。

2.3 并行计算问题是 “同时执行”多个计算问题。他的延伸学科有:并行编译程序、并行程序设计语言、并行处理系统、并行数据库、并行算法。

2.4 形式化方法是建立在严格数学基础上的软件开发方法。软件开发的全过程中,从需求分析,规约,设计,编程,系统集成,测试,文档生成,直至维护各个阶段,凡是采用严格的数学语言,具有精确的数学语义的方法,都称为形式化方法。

科学计数法的方法篇(5)

关键词 :统计学 研究对象 研究方法

一、统计学的定义

人们的印象里,统计学就是对数据进行简单的运算,然后通过图表、表格把它们表示出来,这是长久以来人们对统计学的一些片面认识。统计学的定义有很多种,每种定义对统计学阐述的侧重点不同。其中维基百科是这样定义统计学的:“统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学,被广泛的应用在各门学科之上,从自然科学和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上”。简单来说,统计学就是数据的科学,是一门收集、整理、分析、解释数据并从数据中得出结论的科学。

二、统计学的研究对象及其特点

统计学研究必须要求明确统计学研究的客体是什么,即统计学的研究对象。统计学中某种性质相同的个体所组成的集合叫总体。统计学就是研究客观总体的数量特征、数量关系和变动规律,或者说统计学是研究统计过程的规律和方法以及客观现象统计规律的科学,它的研究对象既涉及到自然科学领域,又涉及到社会科学领域。统计学研究对象的特点有以下几点:

(1)依赖性。依赖性即统计学研究对象的寄生性,依赖性是统计学独有的特点,统计学研究的数据是来自各领域的,是依靠解决其他领域的问题而存在和发展的。统计学现在已经发展成为一门媒介科学,它研究的对象是其他学科的逻辑和方法论。

(2)数量性。数量性即统计学研究对象是通过数量特征和数量关系表示的。数量性是统计学研究对象的基本特征,因为数字是统计的语言,统计是通过数量方面来认识事物的,对统计数据进行分析,归纳统计规律性,就可以达到统计分析研究的目的。

(3)总体性。总体性即统计学以研究对象总体的数量为研究对象。每一个个体都有自身的随机性,而这些研究对象的总体又具有共同的特征和共同趋势,所以统计学研究是通过对大量的个体特征进行研究,从而过渡到对总体普遍存在的事实进行观察和综合分析,进而得出研究对象总体的数量特征和统计规律。只有掌握研究对象的总水平、总规模、总体特征和共同趋势才能体现统计学规律的作用。

(4)变异性。变异性即构成统计学研究对象总体中的各个个体,除了在某一方面必须是同质的以外,在其他方面又要表现出一定的差异和变异。如果各个个体之间没有区别和差异,统计研究就是没有意义的。统计学的这种变异既可以表现为数量上的,也可以表现为非数量上的,但是因为统计学具有数量性,所以表现为数量上的变异才是统计学所要研究的对象。

(5)具体性。具体性即统计学研究对象是具体的数量方面。统计学所研究的数量是具体、现实的,而不是抽象的,并且统计学研究的数量是有现实意义的。比如,要研究城乡居民收入差距,必须确定具体年份的具体范围内的城镇和农村居民收入数量、收入构成、收入变化以及计算方法,才能对研究对象进行统计分析。

(6)广泛性。广泛性即统计学研究数量方面的范围的很广泛。其广泛性包括政治、经济、文化、军事、教育等各类社会现象的数量方面。统计学研究对象的广泛性是统计学成为媒介学科的必要特征。

三、统计学的研究方法

每个学科都有自己独特的研究方法,统计学也不例外,统计学在长期实践中总结、归纳出了一系列专门的研究方法,如实验法、大量观察法、统计分组法、综合指标法、统计描述法等。

(1)实验法。统计学的实验法包括假设检验和实验设计。假设检验就是在对在总体参数提出假设的基础上,利用样本信息来判断假设是否成立的统计方法。实验设计就是设计合理的实验程序,使得收集得到的数据符合统计分析方法的要求,以便得出有效的客观的结论,其中最常用的实验设计是正交设计法。

(2)大量观察法。大量观察法就是对全部或者足够数量的研究现象进行观察和研究,推理归纳出客观现象的本质特征和发展变化规律。通过对大量的研究对象进行观察和研究,才能排除偶然因素造成的影响,揭示研究对象的统计规律和本质特征。

(3)统计分组法。由于所研究现象具有差异性、复杂性及多样性,需要我们对研究现象进行分组研究,进而来区别研究现象的类型,研究不同组别之间的区别和联系。统计分组法包括传统分组法、聚类分析法和判别分析法等。

(4)综合指标法。综合指标法是利用总量指标、平均指标、相对指标、标志变异指标等对研究现象的数量关系和数量特征进行分析,来反映统计学研究现象的数量方面特征。综合指标法在统计学的经济应用中具有重要的作用。

(5)统计描述和统计推断。统计描述指对调查或实验得到的统计数据进行整理、分类、计算出各种能反映总体数量特征的综合指标,并加以分析研究,从而得出有价值的信息,用表格和图形表示出来。统计推断指以一定的置信水平,根据样本数据资料来判断总体数量特征的归纳推理方法。统计描述和统计推断在统计学研究中应用非常广泛。

四、统计学的发展趋势

(1)统计学实际应用的范围扩大。在大数据时代的背景下,统计学开始被各行各业运用起来。统计学逐渐应用到企业管理、保险金融、政府决策、国家经济安全等方面。统计学在企业管理方面可以提高企业的管理能力和效率。在保险金融方面可以监控分析金融风险和保险问题来保证金融保险市场的正常运行。在政府决策方面可以帮助政府宏观调控,从而减少决策失误。在国家经济安全方面可以监控经济安全问题,预防经济危机。

(2)统计学与其他学科交叉融合。统计学的性质决定了统计学是一门媒介学科,统计学的发展是建立在各类学科的基础上的,其涉及领域非常广泛。因此,统计学与其他学科交叉融合更能发挥它的作用,例如,统计学与经济学、管理学等学科进行融合等,在融合中能不断完善统计学体系,创新统计学研究方法。

(3)统计学与网络、计算机的结合。大数据时代的到来,使得以网络、计算机为代表的信息科技在统计理论、统计分析方法、统计处理过程等方面都为统计学发展提供了新的支持。统计与网络和计算机的结合,能更好发挥统计的作用,使统计学的应用更加广泛。

科学计数法的方法篇(6)

二、数据科学的统计学内涵

(一)理论基础

数据科学中的数据处理和分析方法是在不同学科领域中分别发展起来的,譬如,统计学、统计学习或称统计机器学习、数据挖掘、应用数学、数据密集型计算、密集计算方法等。在量化分析的浪潮下甚至出现了“metric+模式”,如计量经济学、文献计量学、网络计量学、生物统计学等。因此,有学者将数据科学定义为计算机科学技术、数学与统计学知识、专业应用知识三者的交集,这意味着数据科学是一门新兴的交叉学科。但是这种没有侧重的叠加似乎只是罗列了数据科学所涉及到的学科知识,并没有进行实质性的分析,就好似任何现实活动都可以拆解为不同的细分学科,这是必然的。根据Naur(1960,1974)的观点,数据科学或称数据学是计算机科学的一个替代性称谓。但是这种字面上的转换,并没有作为一个独立的学科而形成。Cleveland(2001)首次将数据科学作为一个独立的学科提出时,将数据科学表述为统计学加上它在计算技术方面的扩展。这种观点表明,数据科学的理论基础是统计学,数据科学可以看作是统计学在研究范围(对象)和分析方法上不断扩展的结果。一如统计学最初只是作为征兵、征税等行政管理的附属活动,而现在包括了范围更广泛的理论和方法。从研究范围的扩展来看,是从最初的结构型大规模数据(登记数据),到结构型的小规模数据(抽样数据)、结构型的大规模数据(微观数据),再扩展到现在的非(半)结构型的大规模数据(大数据)和关系数据等类型更为丰富的数据。从分析方法的扩展来看,是从参数方法到非参数方法,从基于模型到基于算法,一方面传统的统计模型需要向更一般的数据概念延伸;另一方面,算法(计算机实现)成为必要的“可行性分析”,而且在很多方面算法模型的优势越来越突出。注意到,数据分析有验证性的数据分析和探索性的数据分析两个基本取向,但不论是哪一种取向,都有一个基本的前提假设,就是观测数据是由背后的一个(随机)模型生成,因此数据分析的基本问题就是找出这个(随机)模型。Tukey(1980,2000)明确提到,EDA和CDA并不是替代关系,两者皆必不可少,强调EDA是因为它被低估了。数据导向是计算机时代统计学发展的方向,这一观点已被越来越多的统计学家所认同。但是数据导向仍然有基于模型与基于算法两种声音,其中,前文提到的EDA和CDA都属于基于模型的方法,它们都假定数据背后存在某种生成机制;而算法模型则认为复杂的现实世界无法用数学公式来刻画,即,不设置具体的数学模型,同时对数据也不做相应的限制性假定。算法模型自20世纪80年代中期以来随着计算机技术的迅猛发展而得到快速成长,然而很大程度上是在统计学这个领域之外“悄然”进行的,比如人工神经网络、支持向量机、决策树、随机森林等机器学习和数据挖掘方法。若响应变量记为y,预测变量记为x,扰动项和参数分别记为ε和β,则基于模型的基本形式是:y=f(x,β,ε),其目的是要研究清楚y与x之间的关系并对y做出预测,其中,f是一个有显式表达的函数形式(若f先验假定,则对应CDA;若f是探索得到的,则对应EDA),比如线性回归、Logistic回归、Cox回归等。可见,传统建模的基本观点是,不仅要得到正确的模型———可解释性强,而且要得到准确的模型———外推预测能力强。而对于现实中复杂的、高维的、非线性的数据集,更切合实际的做法是直接去寻找一个恰当的预测规则(算法模型),不过代价是可解释性较弱,但是算法模型的计算效率和可扩展性更强。基于算法的基本形式类似于非参数方法y=f(x,ε),但是比非参数方法的要求更低yx,因为非参数方法很多时候要求f或其一阶导数是平滑的,而这里直接跳过了函数机制的探讨,寻找的只是一个预测规则(后续的检验也是基于预测构造的)。在很多应用场合,算法模型得到的是针对具体问题的解(譬如某些参数是被当作一个确定的值通过优化算法得到的),并不是统计意义上的推断解。

(二)技术维度

数据科学是基于数据的决策,数据分析的本质既不是数学,也不是软件程序,而是对数据的“阅读”和“理解”。技术只是辅助数据理解的工具,一个毫无统计学知识的人应用统计软件也可以得到统计结果,但无论其过程还是结果都是可疑的,对统计结果的解释也无法令人信服。“从计算机科学自身来看,这些应用领域提供的主要研究对象就是数据。虽然计算机科学一贯重视数据的研究,但数据在其中的地位将会得到更进一步的加强”。不可否认,统计分析逐渐向计算机科学技术靠近的趋势是明显的。这一方面是因为,数据量快速膨胀,数据来源、类型和结构越来越复杂,迫切需要开发更高效率的存储和分析工具,可以很好地适应数据量的快速膨胀;另一方面,计算机科学技术的迅猛发展为新方法的实现提供了重要的支撑。对于大数据而言,大数据分析丢不掉计算机科学这个属性的一个重要原因还不单纯是因为需要统计软件来协助基本的统计分析和计算,而是大数据并不能像早先在关系型数据库中的数据那样可以直接用于统计分析。事实上,面对越来越庞杂的数据,核心的统计方法并没有实质性的改变,改变的只是实现它的算法。因此,从某种程度上来讲,大数据考验的并不是统计学的方法论,而是计算机科学技术和算法的适应性。譬如大数据的存储、管理以及分析架构,这些都是技术上的应对,是如何实现统计分析的辅助工具,核心的数据分析逻辑并没有实质性的改变。因此,就目前而言,大数据分析的关键是计算机技术如何更新升级来适应这种变革,以便可以像从前一样满足统计分析的需要。

(三)应用维度

在商业应用领域,数据科学被定义为,将数据转化为有价值的商业信息①的完整过程。数据科学家要同时具备数据分析技术和商业敏感性等综合技能。换句话说,数据科学家不仅要了解数据的来源、类型和存储调用方式,而且还要知晓如何选择相应的分析方法,同时对分析结果也能做出切合实际的解释②。这实际上提出了两个层面的要求:①长期目标是数据科学家从一开始就应该熟悉整个数据分析流程,而不是数据库、统计学、机器学习、经济学、商业分析等片段化碎片化的知识。②短期目标实际上是一个“二级定义”,即,鼓励已经在专业领域内有所成就的统计学家、程序员、商业分析师相互学习。在提及数据科学的相关文献中,对应用领域有更多的倾向;数据科学与统计学、数学等其他学科的区别恰在于其更倾向于实际应用。甚至有观点认为,数据科学是为应对大数据现象而专门设定的一个“职业”。其中,商业敏感性是数据科学家区别于一般统计人员的基本素质。对数据的简单收集和报告不是数据科学的要义,数据科学强调对数据多角度的理解,以及如何就大数据提出相关的问题(很多重要的问题,我们非但不知道答案而且不知道问题何在以及如何发问)。同时数据科学家要有良好的表达能力,能将数据中所发现的事实清楚地表达给相关部门以便实现有效协作。从商业应用和服务社会的角度来看,强调应用这个维度无可厚非,因为此处是数据产生的土壤,符合数据科学数据导向的理念,数据分析的目的很大程度上也是为了增进商业理解,而且包括数据科学家、首席信息官这些提法也都肇始于实务部门。不过,早在20世纪90年代中期,已故图灵奖得主格雷(JimGray)就已经意识到,数据库技术的下一个“大数据”挑战将会来自科学领域而非商业领域(科学研究领域成为产生大数据的重要土壤)。2008年9月4日刊出的《自然》以“bigdata”作为专题(封面)探讨了环境科学、生物医药、互联网技术等领域所面临的大数据挑战。2011年2月11日,《科学》携其子刊《科学-信号传导》、《科学-转译医学》、《科学-职业》专门就日益增长的科学研究数据进行了广泛的讨论。格雷还进一步提出科学研究的“第四范式”是数据(数据密集型科学),不同于实验、理论、和计算这三种范式,在该范式下,需要“将计算用于数据,而非将数据用于计算”。这种观点实际上是将数据从计算科学中单独区别开来了。

三、数据科学范式对统计分析过程的直接影响

以前所谓的大规模数据都是封闭于一个机构内的(数据孤岛),而大数据注重的是数据集间的关联关系,也可以说大数据让孤立的数据形成了新的联系,是一种整体的、系统的观念。从这个层面来说,将大数据称为“大融合数据”或许更为恰当。事实上,孤立的大数据,其价值十分有限,大数据的革新恰在于它与传统数据的结合、线上和线下数据的结合,当放到更大的环境中所产生的“1+1>2”的价值。譬如消费行为记录与企业生产数据结合,移动通讯基站定位数据用于优化城市交通设计,微博和社交网络数据用于购物推荐,搜索数据用于流感预测、利用社交媒体数据监测食品价等等。特别是数据集之间建立的均衡关系,一方面无形中增强了对数据质量的监督和约束;另一方面,为过去难以统计的指标和变量提供了另辟蹊径的思路。从统计学的角度来看,数据科学(大数据)对统计分析过程的各个环节(数据收集、整理、分析、评价、等)都提出了挑战,其中,集中表现在数据收集和数据分析这两个方面。

(一)数据收集方面

在统计学被作为一个独立的学科分离出来之前(1900年前),统计学家们就已经开始处理大规模数据了,但是这个时期主要是全国范围的普查登记造册,至多是一些简单的汇总和比较。之后(1920-1960年)的焦点逐渐缩聚在小规模数据(样本),大部分经典的统计方法(统计推断)以及现代意义上的统计调查(抽样调查)正是在这个时期产生。随后的45年里,统计方法因广泛的应用而得到快速发展。变革再次来自于统计分析的初始环节———数据收集方式的转变:传统的统计调查方法通常是经过设计的、系统收集的,而大数据是零散实录的、有机的,这些数据通常是用户使用电子数码产品的副产品或用户自行产生的内容,比如社交媒体数据、搜索记录、网络日志等数据流等,而且数据随时都在增加(数据集是动态的)。与以往大规模数据不同的是,数据来源和类型更加丰富,数据库间的关联性也得到了前所未有的重视(大数据的组织形式是数据网络),问题也变得更加复杂。随着移动电话和网络的逐渐渗透,固定电话不再是识别住户的有效工具变量,相应的无回答率也在增加(移动电话的拒访率一般高于固定电话),同时统计调查的成本在增加,人口的流动性在增加,隐私意识以及法律对隐私的保护日益趋紧,涉及个人信息的数据从常规调查中越来越难以取得(从各国的经验来看,拒访率或无回答率的趋势是增加的),对时效性的要求也越来越高。因此,官方统计的数据来源已经无法局限于传统的统计调查,迫切需要整合部门行政记录数据、商业记录数据、个人行为记录数据等多渠道数据源,与部门和搜索引擎服务商展开更广泛的合作。

(二)数据分析方面

现代统计分析方法的核心是抽样推断(参数估计和假设检验),然而数据收集方式的改变直接淡化了样本的意义。比如基于浏览和偏好数据构建的推荐算法,诚然改进算法可以改善推荐效果,但是增加数据同样可以达到相同的目的,甚至效果更好。即所谓的“大量的数据胜于好的算法”这与统计学的关键定律(大数定律和中心极限定理)是一致的。同样,在大数据分析中,可以用数量来产生质量,而不再需要用样本来推断总体。事实上,在某些场合(比如社会网络数据),抽样本身是困难的。数据导向的、基于算法的数据分析方法成为计算机时代统计学发展无法回避的一个重要趋势。算法模型不仅对数据分布结构有更少的限制性假定,而且在计算效率上有很大的优势。特别是一些积极的开源软件的支撑,以及天生与计算机的相容性,使算法模型越来越受到学界的广泛重视。大数据分析首先涉及到存储、传输等大数据管理方面的问题。仅从数量上来看,信息爆炸、数据过剩、数据泛滥、数据坟墓、丰富的数据贫乏的知识……这些词组表达的主要是我们匮乏的、捉襟见肘的存储能力,同时,存储数据中有利用价值的部分却少之又少或尘封窖藏难以被发现。这除了对开采工具的渴求,当时的情绪主要还是迁怨于盲目的记录,把过多精力放在捕捉和存储外在信息。在这种情况下,开采有用的知识等价于抛弃无用的数据。然而,大数据时代的思路改变了,开始变本加厉巨细靡遗地记录一切可以记录的数据。因为:数据再怎么抛弃还是会越来越多。我们不能通过删减数据来适应自己的无能,为自己不愿做出改变找借口,而是应该面对现实,提高处理海量数据的能力。退一步,该删除哪些数据呢?当前无用的数据将来也无用吗?显然删除数据的成本要大于存储的成本。大数据存储目前广泛应用的是GFS、HDFS等基于计算机群组的文件系统,它可以通过简单增加计算机来无限地扩充存储能力。值得注意的是,分布式文件系统存储的数据仅仅是整个架构中最基础的描述,是为其他部件服务的(比如MapReduce),并不能直接用于统计分析。而NoSQL这类分布式存储系统可以实现高级查询语言,事实上,有些RDBMS开始借鉴MapReduce的一些思路,而基于MapReduce的高级查询语言也使MapReduce更接近传统的数据库编程,二者的差异将变得越来越模糊。大数据分析的可行性问题指的是,数据量可能大到已经超过了目前的存储能力,或者尽管没有大到无法存储,但是如果算法对内存和处理器要求很高,那么数据相对也就“大”了。换句话说,可行性问题主要是,数据量太大了,或者算法的复杂度太高。大数据分析的有效性问题指的是,尽管目前的硬件条件允许,但是耗时太久,无法在可容忍的或者说可以接受的时间范围内完成。目前对有效性的解决办法是采用并行处理。注意到,高性能计算和网格计算也是并行处理,但是对于大数据而言,由于很多节点需要访问大量数据,因此很多计算节点会因为网络带宽的限制而不得不空闲等待。而MapReduce会尽量在计算节点上存储数据,以实现数据的本地快速访问。因此,数据本地化是MapReduce的核心特征。

四、结论

(一)数据科学不能简单地理解为统计学的重命名,二者所指“数据”并非同一概念,前者更为宽泛,不仅包括结构型数据,而且还包括文本、图像、视频、音频、网络日志等非结构型和半结构型数据;同时,数量级也是后者难以企及的(PB以上)。但是数据科学的理论基础是统计学,数据科学可以看作是统计学在研究范围(对象)和分析方法上不断扩展的结果,特别是数据导向的、基于算法的数据分析方法越来越受到学界的广泛重视。

(二)从某种程度上来讲,大数据考验的并不是统计学的方法论,而是计算机科学技术和算法的适应性。譬如大数据的存储、管理以及分析架构,这些都是技术上的应对,核心的数据分析逻辑并没有实质性的改变。因此,大数据分析的关键是计算机技术如何更新升级以适应这种变革,以便可以像从前一样满足统计分析的需要。

(三)大数据问题很大程度上来自于商业领域,受商业利益驱动,因此数据科学还被普遍定义为,将数据转化为有价值的商业信息的完整过程。这种强调应用维度的观点无可厚非,因为此处是数据产生的土壤,符合数据科学数据导向的理念。不过,早在20世纪90年代中期,已故图灵奖得主格雷就已经意识到,数据库技术的下一个“大数据”挑战将会来自科学领域而非商业领域(科学研究领域成为产生大数据的重要土壤)。他提出科学研究的“第四范式”是数据,不同于实验、理论、和计算这三种范式,在该范式下,需要“将计算用于数据,而非将数据用于计算”。这种观点实际上将数据从计算科学中单独区别开了。

科学计数法的方法篇(7)

【中图分类号】G420 【文献标识码】A 【文章编号】1674-4810(2014)10-0008-02

信息与计算数学专业是高校本科数学类专业,其专业培养目标是具有良好的数学基础和计算机技能的综合型人才。实际上,不同的高校对专业的定位还可以有很大的自由度来创建自身的特色。不管主要方向是以培养研究型人才还是应用型人才为主,信息与计算科学不应是理论数学与计算机操作的拼盘,而应在科学计算方法设计上充分发挥数理逻辑思想的优势。教师在专业模块课程建设上应重视这一点。

一 计算机专业学生与信息与计算机专业学生的比较

信息与计算科学专业有很大一部分毕业生走向了与IT行业相关的工作岗位。有人说,信息与计算科学专业本科生就业是在抢计算机专业的饭碗,其实不然。从就业岗位情况上看,至少表面上信息与计算科学的毕业生确实与计算机类专业的毕业生一样,从事计算机软件开发等工作的较多,但是若干年以后会发现,他们的发展方向有所区别,他们的工作能力特长是不一样的。我所执教的杭州电子科技大学是一所以电子信息为特色的普通高校,因担任数学建模课程以及全国竞赛的指导工作,我有机会认识和了解一些来自我们学校数学、通信、电子信息、计算机软件与计算机技术、信息安全、财经和管理类的学生。他们都是所在学院成绩优秀的大二、大三的本科生。在研究如何利用数学方法解决大数据的实际应用问题时,我发现大二学生已经具备了一些具有专业性的特色差异:将计算机类专业学生与信息与计算科学专业的学生作比较发现:计算机类学生思路很活跃,搜索现代科技学术成果能力较强,重视一种方法的计算实现,具有较强的编程能力。他们比较注重计算结果的好坏,也比较喜欢拿程序作为研究成果,对数学方法原理的理解往往不够深入,算法选择的随机性较大。而信息与计算科学专业的学生由于大规模数据计算实现能力的训练不足,面临着长无所用的问题。得益于基础数学逻辑思维训练,信息与计算科学专业学生数学方法的逻辑表述强于计算机类学生,更注重于解决问题方法的合理性和数学方法本身的质量,但是能把比较复杂的算法编程实现的学生很少,对于数据存储与读取方法、算法设计技巧往往缺少足够的了解。也就是说,该拿的学分都拿了,学了不一定真正理解,也不会应用。而事实是,掌握计算实现能力的学生有能力解决实际问题,而只有解决问题的思路却无法实现计算的学生,没有别人的合作无法完成一个能解决大数据问题的算法实现。

二 信息与计算科学专业建设应重视算法设计能力培养

信息与计算科学专业究竟要培育什么样的专业特色?毕业生将从事的研究或应用领域在什么方向?不同类别的学校可以根据自身条件来设计自己的专业特色。在大规模数据处理已成为通信、商业、交通管理、军事等领域的必要手段的今天,快速、有效的算法设计方法研究及计算实现凸显了算法在现代社会经济发展中的重要位置。我们从算法设计能力培养对信息与计算科学专业建设的相关性、社会效益与可行性等方面,来讨论专业建设在这一方面的必要性与现实意义。

1.专业相关性

强化算法设计能力可以使数学方法与现代计算工具的使用有效结合,这一目标与信息与计算科学专业的培养目标完全一致。算法设计能力的提升不仅仅有利于培养数学方法在科学计算方向的应用型人才,以研究算法效能为目标的人才培养也是一个值得建设的专业模块。

2.专业特长认知

算法设计能力培养有利于提升信息与计算科学专业学生对专业定位的认知度。了解自己专业的特点与长处,明确自己的努力目标,可以对自己的发展建立一个适合于自身条件的规划,有利于激发学生潜在的学习热情。应让我们的教育对象真正认识到所学专业是现代社会有用和有很大发展空间的专业,有了正确的认识和定位,才能激发学生主动学习和研究的兴趣和动力。

3.科学计算是信息与计算科学专业的特色方向

强化算法设计训练可以促使数学理论到生产实践问题计算实现的有效结合,大数据综合问题的计算方法设计与实现研究可以加深学生对计算机计算原理的认识和理解,从而激发科学计算方法的研究兴趣。有效的算法设计训练能使信息与计算科学专业的研究方向多元化,学生的软件开发能力也更具备数学专业的特色与潜在优势。在专业模块课程设置中,加强算法设计的理论与实践可以使专业理论课程与实践课程结合得更加紧密,从而更有效地实现专业培养目标。

4.社会效益

现代社会处于国际化大市场、大信息环境,不管是通信、交通、生产、管理还是军事及安全部门都需要能及时处理大量错综复杂的各类数据,提炼有用的信息与情报,并依此做出正确的判断与决策的计算机人才。从社会需求角度看,当前许多企业及行政管理机构的市场分析、经营管理与决策都需要大量这方面的人才。高校输出符合社会需求的毕业生将对高校的就业以及所产生的社会效益都将产生积极作用。从一些优秀毕业生的反馈情况来看,与证券业或银行以及IT行业相关工作的毕业生中,有相当一部分从事计算机算法研究有关的工作。

5.可行性

目前全国设立信息与计算科学专业的高校多数都有计算机类专业,只要制订培养计划的学校相关部门以及分院真正认识到算法设计在专业建设的必要性。我们通过师资培训以及增进数学专业与计算机专业的师资融合与交流,随着计算机的普及,强化编程实现训练的实验条件已经充分具备。

从已经毕业工作若干年的毕业生发展情况来看,很多在工作岗位上表现得十分出色,有从事投资与证券分析、电子商务网搜索算法设计、金融行业风险评估管理、市场分析与生产管理方面的各种工作的毕业生来自信息与计算科学专业。我们的专业特质和潜在能力有待于社会发现,是因为这些优秀人才在社会上的影响力还没有形成规模。有很多单位提出要我们推荐一些数学能力与计算机编程都比较强、不经过培训就可以直接上岗的毕业生,我们发现这方面的社会需求缺口很大,有些IT行业对算法设计能力有比较高的要求,甚至带着算法设计试卷到学校招聘。

经过我们对专业课程设置和实践环节系统的加强,以及增加一些必要和有效的训练,相信信息与计算科学专业会办得更有质量,不仅仅是帮助本科生直接就业,对于进入研究生学习阶段的学生来说,良好的算法设计能力对于进一步研究数学的现代计算方法也是必不可少的。当毕业生在社会各行业和部门起到主导作用时,信息与计算科学专业将获得社会的普遍认可。从培养应用型人才的角度考虑,在理论课程与实践环节中强化信息与计算科学专业算法设计训练作为专业特色切合专业培养目标,操作上可行,同时符合社会需求和广大学生的利益。

三 实践课程要从基础抓起

信息与计算科学专业设立至今经历了时间的检验,培养目标大框架是教育部制定的,学校的课程设置虽各有所侧重,但基础数学课程和计算机语言都得到了普遍重视。问题是计算机编程实现能力在学生中的差异往往超过其他任何理论课程。不少学生计算机语言课程考试成绩不差,但不能真正独立完成编程和计算实现。我们的教法是传统课堂讲解,作业和考试几乎都是在纸上。俗话说:“万事开头难。”我们缺少在学生刚刚接触计算机语言时给予操作上的必要指导,或在最初需要实践指导时教学环境没有及时跟上,现实存在的课程体系分工太明确,理论课归理论课,实践课就是实践课,缺少一种过渡过程的训练和氛围。像福州大学将数学与计算机合在一起设立学院是相当有远见的,该校数学专业的本科毕业生在社会上就很受欢迎。

杭州电子科技大学信息与计算科学教研室除专业实验室正常实验教学活动外,还成立了一个攀峰工作室,由若干年轻教师负责在课外对学生进行一对一的计算机编程技术、图像处理、统计数据分析等传帮带工作,这一项工作已经开展了许多年,教师的付出是巨大的,学生受益面很大,学生还可以再带学生,一年级第二学期开始跟随攀峰工作室的老师直到毕业的三年多时间,这些学生群体在就业方面很受欢迎,工作后个人发展空间比较大。

当前高校理工科类专业普遍重视数学基础的背景下,数学专业的不少学生却对专业前景比较悲观,在普通高校,一些学生们感觉数学难学,认为自己不是做研究的料,而计算机应用能力又比不上计算机专业的,不知道自己将来可以做什么。信息与计算科学专业的学生应充分利用自身良好的数学背景,在新生入学阶段学会基础的计算机编程技术,对算法设计与分析有一个感性的认识,培养对计算科学的研究兴趣,从而提升对信息与计算科学专业的认知度。正确的专业认知能激发学生的学习兴趣,确立个人的努力方向和奋斗目标,在本科阶段打下良好的研究基础,为今后的发展做好准备。从长远的角度看,强化算法设计能力不但有利于提升信息与计算科学专业本科毕业生的就业竞争力,更有利于拓宽将来的职业发展空间。

科学计数法的方法篇(8)

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2013)26-0021-03

一、工科《概率论与数理统计》课程的作用

随着科学技术的飞速发展,数学学科地位发生了巨大的变化,这些变化反映在三个方面:一是把数学提高为与自然、社会科学并列成基础科学的三大科学领域。二是把计算、理论与实践并列成科学研究的三大支柱。数学不仅是支撑其他科学的工具,现代数学的原理和方法与计算机结合将成为21世纪中威力无穷的数学技术。三是现代数学的三大基础泛函分析、拓扑学和近世代数取代了经典数学中的数学分析、高等代数和解析几何和这三大基础。这些变化对工科数学提出了更新更高的要求,如何理解工科数学的作用及充分发挥工科数学作用的效能,需要我们进行深入细致的分析。工科数学在工科院校中是举足轻重的基础课。工科数学的作用主要体现在三个方面:一是为工科专业课程提供必要的基础数学知识,起到掌握其他基础知识的作用。二是为培养学生的思维能力等方面提供必要的环境与手段,工科数学起到培养能力的作用。三是为将来学生服务于社会提供必备的数学技术,起到打好文化素质基础的作用。正因为在社会的各行各业中都离不开数学,所以人们把数学看成是一种特殊的文化形态——数学文化。这三个方面的作用相辅相成,缺一不可。现代数学的学科地位的巨大变化对工科数学《概率论与数理统计》课程提出了更新更高的要求,主要反映在工科院校对人才培养的要求上,表现在:一是对人才的素质要求提高了,不仅要求业务水平高,而且要求思想文化素质高。二是对培养的人才的能力要求高了,人才能力是多方面的,不仅有理论方面,如理解能力、思维能力、更新知识能力(自学能力)等,而且有实践方面,如应用计算机能力、外语能力、绘图能力等,其别强调人才要有创造性思维等方面的能力,因此工科数学《概率论与数理统计》课程的数学内容、教学方法和教学手段必须适应现代的需要进行改革与创新。三是对人才的适应性要求高了,现代人才要求不仅懂得理论,而且还要求懂得会应用,就是要求人才是复合型、应用型的。目前工科数学《概率论与数理统计》课程的教学现状还不能适应培养现代人才的需要,这就要我们对工科数学的改革进行认真细致的研究并进行实践。

二、工科《概率论与数理统计》课程的现实状况

工科《概率论与数理统计》课程的教学状况,多年来变化不大,人们在积极进行着教学改革的研究与探索。我们经多年的深入研讨把工科数学《概率论与数理统计》课程的教学现状归纳为三点:重视经典内容的完善而轻视现代内容的引入;重视概率论内容的完整轻视数理统计内容的丰富;教学上从训练应试方面考虑得较多而从提高能力素质方面考虑得较少。工科《概率论与数理统计》课程作为工科院校重要的基础课,工科数学《概率论与数理统计》课程教学内容发展得已经比较完善成熟,而且每个人的看法也不一致,见仁见智,但是工科基础数学课程的教学要进行教学改革的认识是一致的。工科基础数学课程教学改革的困难点是教学内容的改革,工科基础数学课程的教学内容改革是教学改革中最应该深入地去研究与探讨的。工科基础数学《概率论与数理统计》课程的教学方法的教学改革根据教学内容和教学对象用正确的教育理念而进行。教无定法,教学方法不能一成不变,更不能有什么“样板”,但教有定则,教学方法必须切合实际。工科基础数学《概率论与数理统计》课程的教学手段的改革应要注重,数学教师一般来说不太注重教学手段的改革,有一种陈旧的观念认为靠嘴和粉笔就能把数学课完全讲好。根据教育心理学观点,课堂教学的过程中教学手段的措施对受教育者是十分重要的,也是教育从应试教育转向素质教育的重要环节。

三、工科《概率论与数理统计》课程的教学内容改革

根据工科数学《概率论与数理统计》课程的现实状况,我们对工科数学《概率论与数理统计》课程教学内容的改革方面归纳为如下几个个方面:一是教学内容上应体现现代科学与技术的发展,处理好继承与创新的关系,在保证教学内容精华的同时,必须重视引入现代观念的教学内容。二是为了提高学生的能力与素质,教学内容改革必须从提高学生的文化修养水平与数学思想素质去考虑。三是在教学内容中应强调逻辑思维、抽象思维、计算技能等方面能力的培养,把强化数学理念与思维方法的传授和培养看成教学内容改革的方向。四是在教学内容的改革上要把《概率论与数理统计》作为工科基础课程的支撑作用放到主要的位置上,学习的目的全在于应用,工科数学课程的教学内容应该充实这方面的内容。在工科《概率论与数理统计》课程教学内容的教学改革上我们总结了几项原则:①坚持标准,教学内容应按培养目标设定,应满足后继的专业课程需要。②保证质量,教学内容的改革必须要以保证质量为大前提,为了保证质量,相应的教材改革一定要跟上。③鼓励实验,教学内容的改革要进行实验,在积累了一定的经验后在一定的范围内进行推广,应该是以点带面,但在面上应该稳妥。④要遵循教育规律,教育教学改革问题是学术问题,是一项大课题,提倡多听教育专家们和心理学家们的意见。美国在中学数学课程改革过程中,急于向现代迈进,把大量的现代数学概念引入中学,编写《统一现代数学》,结果以失败而告终,这个教训值得记取。⑤少而精的原则,教学内容不能越来越多,教材也越来越厚,要搞好继承与创新的关系。⑥教学内容要体现学科的科学性、系统性,体现理论联系实际的理念,旧的体系可以打破,新的体系必须符合科学性、系统性,不能违背思维规律和采取实用主义。

四、工科《概率论与数理统计》课程的教学方法改革

关于工科数学《概率论与数理统计》课程的教学方法,我们认为,虽然教无定法,但教有定则。集我们多年的数学教学经验,经过长时期与同行们的深入研讨,我们归纳总结了工科数学《概率论与数理统计》课程教学方法的改革应该明确以下四个方面:

第一方面是强调三教作用。教学活动最主要的是课堂教学这一环节,不管用什么教学方法把提高课堂教学质量作为提高教学质量和加强素质教育的关键与突破口。必须明确在教学改革中更要强调优化一堂课的教学,为此强调三教的作用:①教思想,即向学生讲请楚《概率论与数理统计》课程的随机数学学科处理问题的思想方法。教学内容要体现辩证唯物主义思想,结合科学技术和数学发展的历史介绍某些理论的来源与实际背景,讲述数与形对应的思想,数与形是数学中的两大支柱,每研究概念都应把数与形结合起来进行讨论等。②教方法,教《概率论与数理统计》课程中用随机数学解决实际问题的思想方法。应在工科数学《概率论与数理统计》课程的教学中讲贯穿随机数学解决问题的思维方法是人类的基本思维方法,例如检验与估计、分析与综合、演绎与归纳、系统与整理等等。再如讲清楚解决问题的方法,有顺着思路正推的方法,即由因导果综合归纳法,也有逆着思路反推的方法,即由果寻因分析法;有直接用条件去推出结论的推理法,即直接证法,也有从反面进行的推理的方法,即反证法;有肯定结论的说理方法,即演绎法,也有否定结论用举例的方法,即反例法等。③教做人,教学生做人的道理,将启迪思想的教育贯彻在课堂教学活动中,结合科学技术和数学科学的发展历史,根据不同时代的特征,结合教学内容来激发学生的学习积极性,结合教学的实践培养学生严谨的治学态度,结合学习实践培养学生奋发好学的品质。

第二方面是重视三个面向,素质教育的核心是培养学生全面发展,也是区别与应试教育的基本特征,因此强调重视三个面向:①面向全体学生,促进全体学生的全面成长,这是教学的立足点,因此教学应对全体学生有统一的要求,促进他们的全面发展。②面向学生的大多数,教学的出发点要求应针对大多数学生的实际情况去要求和安排,因材施教,实施的措施应使大多数学生的成绩有所提高。③面向两头的学生,教学的注意点是一头注意学习好的学生,激励这些学生取得更优异的成绩,一头是注意学习较差的学生,鼓励这些学生增强学习的信心,帮助他们改进学习方法,使学习较差的学生在已有的成绩基础上能有所提高。

第三方面是引导学生走正确的学习道路,教学活动像教师为向导引导学生在攀登知识山峰,向导的作用是引导走正确的道路,在教学上要明确怎样引导学生走上正确的学习道路。①引导学生走学会到会学的正确道路,在当前的国内外教学改革中,不仅强调教师的主导作用,而且强调学生的主体作用,为此课堂教学一方面要传授知识,使学生学会更多的知识,更重要的是教会学生怎样掌握这些知识的学习方法,从而提高学生的能力和素质,以达到教学改革的目的。②引导学生走苦学到乐学的道路,优秀人才的成长都经历过一段艰苦学习的里程,因此在教学中应向学生们灌输学习是艰苦的劳动,在成长的道路上要出大力流大汗的观点。在教学方法上必须适应年轻人的特点,教学方法应发挥情感在教学中的作用,用愉快性教学法进行教学,讲课有趣味有吸引力,在学生苦学的基础上引导学生克服厌学的情绪,培养学习兴趣,使得学生不把学习看成一种很重的负担,而看成是一种有趣味的事,即引导学生走乐学的道路。③引导学生走要我学到我要学的道路,使学生认识到学习是每个现代人的自身需求,从被要求学习到自己喜爱学习来自于正确的动力和恰当的压力。教学改革的目的是激励学生成长为现代社会需要的人才。

第四方面是提倡几种做法,根据我们多年的教学经验和同行们的广泛研讨,认为在教学方法的改革中应明确提倡几种做法。①注重针对性,针对教学中不同的教学内容、教学对象选用适当的教学方法,教无定法,教有定则,重要的是教学方法应真正切合学生的实际,注重情感因素在教学中的作用,使教师在教学活动中不断地形成教师自己的教学风格,实现教学方法的改革,教育学家和心理学家经过试验提出如下经验公式:人类接受信息的总效果=7%的文字+38%的语音+55%体态语言(体态语言是指发出信息者的表情、眼神、姿势、动作、手势等),可见情感在教学活动中的重要作用,这就是我们常说的教师在讲课时应有一种激情去激发感染学生。②强调启发性,老师的责任之一是启迪学生的思想,教导学生做一个有思想的人。老师的责任之二是给以学生开启知识的宝库,培养学生成为有学问素质高的人。老师的责任之三是培养学生思维、创造、开拓的能力,教导学生成为一个能生活会工作有创造能力的人。培养学生成为上述的人是教学改革的目标。③提高积极性,提高教与学的积极性即老师和学生的积极性,强调教学相长,教育教学改革的最终目的是充分发挥教与学的积极性,让教学一线的教师真正发挥其水平,让培养的学生能更主动更自觉地学习并完善自我,使我们培养的学生成为适应现代化的人才。

五、工科《概率论与数理统计》课程的教学手段改革

随着科技的发展,教学手段也要进行相应的改革。数学教师一般来说不太注意教学手段的改革,认为靠嘴和粉笔就可以把课讲好了,这是一个误区。在这里我们认为完全有必要强调进行教学手段的改革,根据教育学和心理学的理论,在教学过程中有效的课堂教学方式有利于调动学生听课的积极性,老师适当结合体态语言进行课堂教学有助于吸引学生听课的注意力,有利于激发学生的听课热情,更好地培养了学生观察、分析问题的能力。在课堂教学中适当变换方式,适当配合教具和体态语言是有必要的。教育家和生理学家的实验已经证明,人通过听觉获得的信息,长期记忆有15%,通过视觉获得信息,长期记忆有25%,通过视觉和听觉的结合,长期记忆则可达85%。实验表明,人类接受信息只有在全神贯注的条件下,在大脑皮层停留8到20秒才能储存起来。教学改革有必要十分重视教学手段的改革。当前工科基础数学课程的教学辅助手段有用教具、模型、挂图、投影仪、影像、计算机辅助教学、课件等等。工科基础数学课程教学手段的改革要特别注意结合工科基础数学课程的特点,在工科基础数学课程的课堂教学中一定要注意给学生留有认知和思考的时间与空间。

工科数学《概率论与数理统计》课程的教学改革只有把教学的内容、方法、手段的教学改革相结合才能有成效。经过广大同行的努力,相信工科基础数学《概率论与数理统计》课程的教学改革会取得进一步深化,工科数学《概率论与数理统计》课程会以崭新的面貌展现在工科院校中,工科基础数学《概率论与数理统计》课程将以崭新的姿态在工科院校中起到真正的基础支撑作用。

参考文献:

[1]徐利治.数学方法论选讲[M].武汉:华中工学院出版社,1988.

[2]解思译.世界数学家思想方法[M].济南:山东教育出版社,1998.

科学计数法的方法篇(9)

0引言

随着国家创新形式的发展,统计创新工作已经得到相关部门的重视,统计创新包括统计实践创新和统计教育创新两个方面。统计教育的创新是统计创新的基础,没有统计教育的创新,就谈不上统计实践的创新,下面我从统计学的基本发展趋势来探讨目前统计教育的改革方向。

1统计学的基本发展趋势

统计学的发展与其它学科的发展相似,也需要走与其它学科相联系的发展道路。

1.1统计学与实质性学科相结合的趋势统计学是一门通用方法论的科学,是一种定量认识问题的工具。统计方法只有与具体的实质性学科相结合,才能够发挥出其强大的数量分析功效。并且,从统计方法的形成历史看,统计方法基本是从一些实质性学科的研究活动得来的,例如,最小平方法与正态分布理论源于天文观察误差分析,相关与回归源于生物学研究,抽样调查方法源于政府统计调查资料的搜集。同时历史上一些着名的统计学家同时也是生物学家或经济学家等。另外,从学科体系上看,统计学与实质性学科之间的关系不是并列的,而是相交的,统计方法与实质性学科相结合,才产生了统计学的分支,如统计学与经济学相结合产生了经济统计学,与社会学相结合产生了社会统计学等,而这些分支学科都具有“双重”属性:一方面是统计学的分支,另一方面也是相应实质性学科的分支,所以经济统计学、经济计量学、社会统计学不仅仅属于统计学,同时也属于经济学、社会学、生物学的分支等。这些分支学科的存在主要不是为了发展统计方法,而是为了解决实质性学科研究中的有关定量分析问题,统计方法是在这一应用过程中得以完善和发展的。这个发展趋势说明了统计方法的学习必须与具体的实质性学科知识学习相结合。因此,统计专业的学生必须在学好本专业知识的同时,也要通晓相关的实质性学科的课程知识,只有这样,所学的统计方法才有用武之地。

1.2统计学与计算机科学结合的趋势纵观统计数据处理手段发展历史,数据处理手段的每一次飞跃,都给统计实践带来革命性的发展。电子计算机技术的诞生与发展,使得复杂的数据处理工作变得非常容易,那些计算繁杂的统计方法的推广与应用,由于相应统计软件的开发与商品化而变得更加方便与迅速,非统计专业的理论工作者可以直接凭借商品化统计分析软件来处理各类现实问题的多变量数据分析,而无需对有关统计方法的复杂理论背景进行研究。计算机运行能力的提高,使得大规模统计调查数据的处理更加准确、充分与快捷。随着计算机应用的越来越广泛,信息数据也越来越多,大量信息在给人们带来方便的同时也带来了许多问题:信息过量、信息真假、信息安全等问题出现了,同时信息形式的不一致也导致信息难以统一处理。于是如何从大量的信息中找出有用的信息?如何提高信息的利用率?数据挖掘和知识发现(DMKD)技术随之应运而生了。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一门交叉学科,它把人们对数据的应用从低层的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求下,汇聚了不同领域的研究者们投身到数据挖掘这一新兴的研究领域。虽然统计学家与计算机专家关心Datamining的视角不完全相同,但可以说,Datamining与DSS一样,使得统计方法与计算机技术的结合达到了一个更高的层次。

因此,统计学越来越离不开计算机技术,而计算机技术应用的深入,也同样离不开统计方法的发展与完善。所以,对于统计专业的学生来说,一方面要学好统计方法,但另一方面更加要学会利用商品化统计软件解决实践中的统计数量分析问题,学好计算机信息系统开发的基本思想与基本程序设计,能够将具体单位的统计模型通过编程来实现,以建立起统计决策支持系统。所以统计与实质性学科相结合,与计算机技术相结合,这是发展的趋势。所以统计教育的一些课程要改革,教学方式也要改革。以下谈一谈统计教育需要改革的几个方面。

2统计教育的改革

2.1统计专业课程建设专业建设考虑的是应当培养什么样的人才和怎样培养这样的人才。专业建设的核心问题则是课程设置和规范课程的内容。培养统计理论人才应当设置较多的数学课程,目的是让学生能对各种统计方法有较深刻的理性认识;培养应用统计人才应当设置较多的相关应用领域的专业课程,将统计方法与相关领域的专业知识完美结合。例如培养从事经济管理的统计人才,在课程设置上至少应当包括三方面的知识:(1)经济理论课程,让学生了解经济活动的主要进程和基本规律;(2)研究社会经济问题主要统计方法,包括常用的统计数据搜集方法,统计数据处理方法和分析方法;(3)适用电脑技术,让学生初步掌握运用电脑进行统计数据处理和分析的基本理论和技能。

2.2教学方法和教学手段的改革统计教学方法和教学手段改革中,应充分运用现代教育技术、教学手段,更新教学方法,促使教育技术、教学手段和教学方法有机结合。

2.2.1改接受式的教学为互动式教学,以案例分析与情景教学开启学生的思维,使学生更形象、快捷的接受知识,发挥其独立思考与创造才能,培养学生的创造性思维能力。

2.2.2构建以课堂-实验室-社会实践多元化的立体教育教学体系。在传授和学习已经形成的知识的同时,加强实践能力锻炼,提高学生的动手能力和创新能力。只有将统计学的方法结合实际进行应用,才能展现统计学的生命力。

2.3统计学与计算机教学相结合教材要与统计软件的应用相结合。现在许多教材都是内容与软件分家,现在计算机已非常普及,无论是高校、高职和中专,培养出来的学生都会要用统计软件分析数据。再者,统计学是一门应用的方法型学科,统计学应当从数据技巧教学转向数据分析的训练。统计学与计算机教学有机地合为一体,除了要培养学生搜集数据、分析数据的能力外,还要培养学生处理大量数据的能力,即数据挖掘的能力。

2.4教学与实际的数据分析相结合统计的教学不能只停留在课本上,案例教学与情景教学应成为统计课程的重要内容。通过计算机对大量实际数据进行处理,可以在试验室进行,亦可在课堂上进行讨论,这样学生不仅理解了统计思想和方法,而且也锻炼和培养了学生研究和解决问题的能力。

2.5要有一批能用电脑、网络来教学的新型教师电脑、网络的出现,不仅改变了教学的手段,还影响着教学的内容。语言、数学、计算机、专业知识是一个统计人才必备的素质,它们之间是不可分离的,而是要尽可能结合在一起来进行教学,单一化人才已不适应现代化教育教学的需要,现代教育更注重教育信息技术中的多媒体、网络化、社会化和国际化、多样化和多层次的综合人才。

参考文献:

科学计数法的方法篇(10)

0 引言

随着国家创新形式的发展,统计创新工作已经得到相关部门的重视,统计创新包括统计实践创新和统计教育创新两个方面。统计教育的创新是统计创新的基础,没有统计教育的创新,就谈不上统计实践的创新,下面我从统计学的基本发展趋势来探讨目前统计教育的改革方向。

1 统计学的基本发展趋势

统计学的发展与其它学科的发展相似,也需要走与其它学科相联系的发展道路。

1.1 统计学与实质性学科相结合的趋势 统计学是一门通用方法论的科学,是一种定量认识问题的工具。统计方法只有与具体的实质性学科相结合,才能够发挥出其强大的数量分析功效。并且,从统计方法的形成历史看,统计方法基本是从一些实质性学科的研究活动得来的,例如,最小平方法与正态分布理论源于天文观察误差分析,相关与回归源于生物学研究,抽样调查方法源于政府统计调查资料的搜集。同时历史上一些着名的统计学家同时也是生物学家或经济学家等。另外,从学科体系上看,统计学与实质性学科之间的关系不是并列的,而是相交的,统计方法与实质性学科相结合,才产生了统计学的分支,如统计学与经济学相结合产生了经济统计学,与社会学相结合产生了社会统计学等,而这些分支学科都具有“双重”属性:一方面是统计学的分支,另一方面也是相应实质性学科的分支,所以经济统计学、经济计量学、社会统计学不仅仅属于统计学,同时也属于经济学、社会学、生物学的分支等。这些分支学科的存在主要不是为了发展统计方法,而是为了解决实质性学科研究中的有关定量分析问题,统计方法是在这一应用过程中得以完善和发展的。这个发展趋势说明了统计方法的学习必须与具体的实质性学科知识学习相结合。因此,统计专业的学生必须在学好本专业知识的同时,也要通晓相关的实质性学科的课程知识,只有这样,所学的统计方法才有用武之地。

1.2 统计学与计算机科学结合的趋势 纵观统计数据处理手段发展历史,数据处理手段的每一次飞跃,都给统计实践带来革命性的发展。电子计算机技术的诞生与发展,使得复杂的数据处理工作变得非常容易,那些计算繁杂的统计方法的推广与应用,由于相应统计软件的开发与商品化而变得更加方便与迅速,非统计专业的理论工作者可以直接凭借商品化统计分析软件来处理各类现实问题的多变量数据分析,而无需对有关统计方法的复杂理论背景进行研究。计算机运行能力的提高,使得大规模统计调查数据的处理更加准确、充分与快捷。随着计算机应用的越来越广泛,信息数据也越来越多,大量信息在给人们带来方便的同时也带来了许多问题:信息过量、信息真假、信息安全等问题出现了,同时信息形式的不一致也导致信息难以统一处理。于是如何从大量的信息中找出有用的信息?如何提高信息的利用率?数据挖掘和知识发现(dmkd)技术随之应运而生了。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一门交叉学科,它把人们对数据的应用从低层的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求下,汇聚了不同领域的研究者们投身到数据挖掘这一新兴的研究领域。虽然统计学家与计算机专家关心data mining的视角不完全相同,但可以说,data mining与dss一样,使得统计方法与计算机技术的结合达到了一个更高的层次。

因此,统计学越来越离不开计算机技术,而计算机技术应用的深入,也同样离不开统计方法的发展与完善。所以,对于统计专业的学生来说,一方面要学好统计方法,但另一方面更加要学会利用商品化统计软件解决实践中的统计数量分析问题,学好计算机信息系统开发的基本思想与基本程序设计,能够将具体单位的统计模型通过编程来实现,以建立起统计决策支持系统。所以统计与实质性学科相结合,与计算机技术相结合,这是发展的趋势。所以统计教育的一些课程要改革,教学方式也要改革。以下谈一谈统计教育需要改革的几个方面。

2 统计教育的改革

2.1 统计专业课程建设 专业建设考虑的是应当培养什么样的人才和怎样培养这样的人才。专业建设的核心问题则是课程设置和规范课程的内容。培养统计理论人才应当设置较多的数学课程,目的是让学生能对各种统计方法有较深刻的理性认识;培养应用统计人才应当设置较多的相关应用领域的专业课程,将统计方法与相关领域的专业知识完美结合。例如培养从事经济管理的统计人才,在课程设置上至少应当包括三方面的知识:(1)经济理论课程,让学生了解经济活动的主要进程和基本规律;(2)研究社会经济问题主要统计方法,包括常用的统计数据搜集方法,统计数据处理方法和分析方法;(3)适用电脑技术,让学生初步掌握运用电脑进行统计数据处理和分析的基本理论和技能。

2.2 教学方法和教学手段的改革 统计教学方法和教学手段改革中,应充分运用现代教育技术、教学手段,更新教学方法,促使教育技术、教学手段和教学方法有机结合。

2.2.1 改接受式的教学为互动式教学,以案例分析与情景教学开启学生的思维,使学生更形象、快捷的接受知识,发挥其独立思考与创造才能,培养学生的创造性思维能力。

2.2.2 构建以课堂-实验室-社会实践多元化的立体教育教学体系。在传授和学习已经形成的知识的同时,加强实践能力锻炼,提高学生的动手能力和创新能力。只有将统计学的方法结合实际进行应用,才能展现统计学的生命力。

2.3 统计学与计算机教学相结合 教材要与统计软件的应用相结合。现在许多教材都是内容与软件分家,现在计算机已非常普及,无论是高校、高职和中专,培养出来的学生都会要用统计软件分析数据。再者,统计学是一门应用的方法型学科,统计学应当从数据技巧教学转向数据分析的训练。统计学与计算机教学有机地合为一体,除了要培养学生搜集数据、分析数据的能力外,还要培养学生处理大量数据的能力,即数据挖掘的能力。

2.4 教学与实际的数据分析相结合 统计的教学不能只停留在课本上,案例教学与情景教学应成为统计课程的重要内容。通过计算机对大量实际数据进行处理,可以在试验室进行,亦可在课堂上进行讨论,这样学生不仅理解了统计思想和方法,而且也锻炼和培养了学生研究和解决问题的能力。

上一篇: 采纳审计建议 下一篇: 健康数字教育
相关精选
相关期刊