统计学的特征汇总十篇

时间：2023-08-11 17:18:37

统计学的特征

统计学的特征篇（1）

[摘要] 医学统计是运用统计学的原理和方法，通过统计学的手段将一种医学信息转换成另一种医学信息，医学统计信息中的客观表达以及信息的质量取决于人的知识和道德水平。人的行为决定着这种信息转换过程中统计信息的准确性和客观性。该文主要从行为角度分析了医学统计中信息失真的情况，总结了医学统计的几大信息特征，并且提出了几点保证医学统计信息质量的建议，旨在能够提高医学统计信息的质量，使得医学统计工作能够准确，顺利的开展。

[

关键词 ] 医学统计；信息失真；信息特征；质量保证

[中图分类号] R5

[文献标识码] A

[文章编号] 1672-5654（2015）01（a）-0176-02

[作者简介] 张秋颖（1962-），女，黑龙江青岗人，大专，高级统计师，主要从事医院医疗统计工作。

医学统计的主要工作内容包括搜集各种医学数据，并且进行统一的整理和分析，主要目的是为了以大多数人可以理解的方式表述一种客观事实，或者反映一种规律[1-2]。因此，医学统计的重要性不言而喻。但是，当前我国医学统计工作常常会存在信息失真现象，并没有充分发挥医学统计的作用及职能，如何提高医学统计信息的质量已经成为当前医院信息管理工作者思考的重点。

1 医学统计信息失真现象

基于行为角度分析，医学统计主要存在信息隐瞒、误用统计工具、操作缺陷、信息伪造、滥用统计工具五种信息失真现象。①信息隐瞒。主要是指医学统计人员刻意没有将统计报表中的重要信息呈报，导致信息不对称。比如，某医院出现事故死亡事件，但是相关责任人为了能够逃避责任，在统计报表中故意隐瞒。②误用统计工具。有时统计人员并没有使用正确的统计工具，会导致使用者转换信息的方式错误，这样会使对应关系错误，无法真正揭示统计结果的规律。③操作缺陷。这主要是因为统计呈报系统有所缺陷，导致无法正常呈报一些信息。或者是由于使用者并没有根据相关规范进行系统操作，但是医学统计信息并不全面。④信息伪造。这种现象和信息隐瞒的性质其实比较类似，但是信息伪造主要是指人为刻意修改统计呈报信息。⑤滥用统计工具。这种情况是指医学统计工作者在明确知道统计工具的使用方法的情况下，为了使统计结果达到自己需要的结果，故意采用不当的使用方法。

2 医学统计的信息特征

根据“经济人”的假设理论，每个人都会为了自己的利益从而利用信息，这是导致各种信息失真现象的主要原因[3]。然而，人的行为会受到不同信息源的影响，就医学统计信息失真现象而言，主要受到信息特征的影响，而医学研究对象是信息特征的信息源。医学研究对象主要是指人体以及和人健康相关的问题，因此，医学统计信息不仅具有机械工程、经济统计等领域统计信息的一般共性特征，同时也有自身独特的信息特征，主要表现在以下几点。

2.1私人性

私人性是当前医学信息统计过程中的关键环节，同时也是常常被忽视的一个相当重要的环节，故应当对此方面的工作加以重视和分析。医学统计中的信息，主要是搜集人体以及和人体健康相关的各种问题，这就说明医学统计信息必须是和患者个人情况有关的。一般情况下，患者的个人信息都不允许随便向外部透露，也不能公开，除了患者患有传染性非常强的疾病外。

2.2 控制难度较大

根据我国现行法律法规规定[4]，临床实验对象应选择动物为主，不能选择人，然而人和动物之间存在很大的区别，这样会导致医学科研结果可能和临床信息存在一定差异。同时，人体的系统较为复杂，人的行为也千变万化，这种复杂性、变化性导致很难有效控制临床结果等。因此，医学统计信息的识别、控制难度较大。

2.3 分散性程度较高

前面提到医学统计信息具有较强的私人性，这一特征也决定了医学统计信息分布具有较高的分散性。医学统计体系和社会经济统计体系存在较大差异，目前尚未制定合理的价格系统转换、传递信息，而且医学统计信息缺乏规范性，导致医学统计信息的传递效率不高。因此，医学统计信息在鉴别、搜寻等方面的成本比较高。

2.4 检验具有长期性

人体构造非常复杂，也会受到很多其他因素的影响，因此，在检验的过程中需要考虑到多方面的因素影响，检验时间会比机械工程实验的时间长得多。一般医学统计数据，都需要根据人体系统在时间维度下的演变，经过长时间的检验才可以获得。

3 提高医学统计信息质量的几点建议

3.1 进一步完善医学统计的相关法律法规

根据我国现行的《统计法》内容，统计对象锁定在社会发展、国民经济发展等方面。而在《统计法实施细则中》的内容主要包含有卫生统计，并且明确指出卫生统计可以在相关法律法规规定下独立行使统计监督权、报告权及调查权[5]。这充分说明，医疗统计已经纳入我国现行立法中。然而从整体来看，我国对统计的现行立法主要强调经济统计，并没有重视社会发展方面的统计，相关工作的开展没有严格的遵循体制的要求和工作的标准来进行，最终出现了重大的问题，对数据统计信息工作的开展形成了不小的影响[6]。当前我国医学统计工作常常会存在信息失真现象，并没有充分发挥医学统计的作用及职能，相关工作的标准制定和科学化的准则研究也没有达到应有的高度，加上我国在统计监督方面的执行力度较差，导致很多医疗统计并没有严格按照相关的法律发挥进行统计，这也在一定程度上助长了医疗统计信息失真现象[7]。因此，我国应尽快完善关于医疗统计方面的法律法规，加强制度和相关体系的建设，加强政策方面的科学性和完善性，以健全的理念和正确的思想实现工作的稳步改进。并且在实践的统计和数据分析过程之中还应进一步细化、具体化医疗统计的实施标准和细则。加强调查监督的力度，制定科学、合理的惩罚机制，一旦发现有统计信息失真现象，应严格根据相关法律、法规给予相应的惩罚措施。

3.2 进一步完善医学统计的教育体系

首先，应积极改革医学统计教材、教育方法，应该立足于医学实践，进一步完善医学统计教材。同时近年来随着计算机技术的快速发展和应用，在医学统计中也引入了很多计算机技术，因此，在医学统计教学中，应注意将统计模型的应用条件、统计模型功能等内容作为教学重点，提高他们的计算机实践应用能力。同时应适当增加医学统计的课程，并且进一步深化教学难度。

3.3 注重医学科研的声誉效应

由于医学统计具有分散性高、控制难、检验长期性等几大信息特征，因此，重复检验信息的难度较大，也增加了统计信息监督的难度，很难避免滥用统计工具或者误用统计工具的行为。因此，在医学统计过程中，应建立必要的事后追责机制以及惩罚机制。目前，我国医学科研基金逐渐变得市场化，也没有建立完善的科研成果选择机制，当前我国医学统计工作常常会存在信息失真现象，并没有充分发挥医学统计的作用及职能，诸多的影响都对当前相关信息统计和数据分析工作产生了重大的影响，使得相关工作的开展难以得到应有的进度和质量保障，并且最终导致对于医学统计的道德缺失行为约束力较差。笔者认为，可以充分利用医学科研人员的声誉效应，一旦出现有滥用统计工具或者误用统计工具的行为，应立即公开。这样可以有效规范科研人员的行为，提高自己的职业道德素质，减少败德行为。

综上所述，医学统计具有私人性、控制难度大、高分散性、检验长期性等几项信息特征，不同的特征和不同的工作难点，使得工作的开展也受到了重大的影响，而在实践的工作之中，这些特征使信息供求双方信息不对称问题更加突出，若没有制定完善的管理制度，很容易导致信息失真现象。正如上文所分析到的，当前我国医学统计工作常常会存在信息失真现象，并没有充分发挥医学统计的作用及职能，故在实践的工作之中，如何提高医学统计信息的质量已经成为当前医院信息管理工作者思考的重点。因此，我国应尽快完善关于医疗统计的相关立法，制定科学、合理的医学统计教育体系，充分发挥医学科研的声誉效应，全面提高医学统计信息质量，使其作用和职能得以充分发挥。

[

参考文献]

[1] 顾海雁，朱和新，等．医学统计学素质教学的课堂实践与探讨[J].中国交通医学杂志，2012(3)：343-344．

[2] 陈景武，陈建红，等．现代医学统计学的应用领域及方法进展[J].现代预防医学，2012(3)：368-371.

[3] 胡志德,胡成进,邓安梅.国内检验医学临床研究常见科研设计缺陷和统计学错误辨析[J].国际检验医学杂志，2013(2)：239-241.

[4] 董秀玥.医学期刊中的生存分析及存在的问题[J].数理医药学杂志，2013(5)：421-422.

[5] 王彦丽.Excel在医学统计中的应用[J].医学信息，2012(9)：536-539.

统计学的特征篇（2）

一、引言

双语教学是我国高等教育改革的一个重大举措。会计学科作为国际经济交往的重要学科之一，开展双语教学，加强学生英语的实际应用能力，培养学生的国际竞争意识，意义深远。近几年，许多高校纷纷开展了会计双语教学的理论研究和教学模式的探讨，提供了很多宝贵的经验。然而，会计学的双语教学是个特殊而且特殊的系统工程，从各个方面对高等院校也提出了严峻的挑战。因此有必要对这个双语教学系统的进行分析和研究。

二、会计学双语教学中存在的问题

1.缺乏师资。强大的师资力量是成功实施双语教学的关键。要真正实现双语教学的目标，就要求教师既要精通会计专业知识，又要具备扎实的英语水平。有研究表明：现有的高校扩招给大学英语教学带来的巨大压力已经远远超出了教师的承受能力，现有教师也很少有机会在职进修，更缺乏定期出国提高自己语言能力，改善自身知识结构的可能。许多大学双语教师都没有接受过系统，专门的双语培训。大多数外籍教师对会计专业知识不甚了解，尤其是我国的会计制度，会计方法更是知之甚少。

2.教师的工作量明显加大，课堂信息不足。有研究表明：原来用母语教学10分钟就能完成的知识点，用“双语”后需要40分钟，甚至更多。而授课教师的英语应用能力高低不同，备课时间长短也不同。有教师认为双语教学备课量是非双语教学的三倍以上。

3.中西方会计准则和方法的差异增大教学难度。这种差异很大程度给教学带来了许多麻烦。比如西方会计对会计科目没有那么严格的要求和规定。而我国对此是进行了严格的规定。由于中西方国情，体制和文化等的差异。这些带给学生更多的是困惑。

4.学生英语水平参差不齐，师生沟通不流畅。就目前情况来看，大学生的英语综合能力参差不齐，不少学生对专业词汇掌握很少，听力和口语不是很少，这些都使得教师不得不把重点转移到词汇的讲解，从而影响了教学进度，达不到预期目标。

5.国内外教材不统一。双语教学需要用国外的原版教材，但是国外原版教材难以与国内相应的学科教学要求相符。并且深浅程度不一致，理论和案例各自偏向不同的特点。许多国外教材是根据当地的文化习惯和思维方式编写的，中国学生缺乏理解发达国家经济制度运作的常识，理解教材中的内容和案例还有很多困难。

6.教学中教育主体性缺失。会计学双语教学应该是学生和教师的主体性都是个和谐和统一的过程。但是目前是主体性的发挥存在不平衡。主要表现为：教师的主体性极度膨胀，学生的主体性没有发挥出来。很多学生收到家庭环境，传媒信息，个性特征，知识基础，思维方式的影响，适应双语教学还需要一个过程。

7.教学方法需要配套改革。虽然目前，许多教师采用了多媒体来教学，但是也只是做了形式上的改变，把粉笔，黑板变成了电脑和幻灯片。以“学生为中心”的教学模式并没有形成。

8.课程考核方式单一，缺乏专门的双语教学质量评价指标体系。目前许多高校对双语教学体系的评价，或者借助现有的单语教学评价指标，或者以查代评，以考代评，定性多于定量，片面代替全面，评价的科学性还不是很完善。

三、会计学双语教学系统的构建

从前面的分析来看，会计学双语教学在发展中存在许多问题，形成这些问题的原因是多种多样的。我们对上述的问题进行简单的归类。发现可以归类为：外部环境的问题（如学生的英语水平，师资的缺乏问题等），教学内容的问题（如会计准则和方法的差异问题，教材选用的问题等），教学方式，方法的问题（如教育主体性缺失问题），考核办法的问题（考核方式单一）。

考察、分析和解决会计学双语教学中的问题都要着眼整个系统，要以合作的精神从大系统的全局出发。当我们对双语教学实施管理的时候，就是管理着一组有特定目的和目标的相互关联、相互制约的要素的组合体，而当要解决其中任何一部分的问题时必须考虑到对系统其它部分以及周围环境的影响，根据轻重缓急，予以通盘考虑，逐次解决。会计学双语教学是适应经济全球化和科技革命的挑战。但是教学能否快速，良好的发展关键取决于自身的基础条件，内部教学系统的构建与运行以及外部环境的条件等。从这个意义来考虑，我们有必要构建一个会计学双语教学系统，从而实现会计的跨文化交流，把学生培养成国际化的人才。

首先，构建一个会计学教学系统必须有系统目标。系统的目标性要求我们在确定系统的目标时，运用各种调节手段把系统导向预定的目标，达到系统整体性最优的目标。根据国家教学要求，会计学双语教学的目标应该是用英语作为课堂主要语言进行会计专业课程的教授，向学生推进会计专业理论的逐步演绎。使得学习者掌握本课程严密的专业知识，同时还可以培养学习者运用两种语言进行思维的能力。

从系统论的角度，我们已经明确了系统中的子系统（教学内容，教学方式，方法和考核方法等），外部环境（培养创新人才的需要，高等教学体制改革的重要举措等）自身的基础条件（师资力量，学生的英语水平）现构建系统如下：

系统必须具备三个要素：系统的部件，系统的环境，系统的输入与输出。系统的部件，也就是系统下面的各个子系统，它们具有不同的属性，又相互影响。他们组合结构从整体上影响了系统的特征和行为。系统是在一定的外界环境条件下运行的，它即受环境的影响，同时也对环境施加影响。系统与环境的交互影响就可以产生输入与输出的含义，输入与输出体现了系统与环境之间的交互影响，系统在目标与要求明确以后，其部件就可以接受一系列的外界输入以及进行有效和高效率的处理后，提供系统所期望的实现目标的输出，返回到环境。

概括的说，会计学双语教学系统的部件主要包括以下几个子系统:(1)教学内容。包括有课程设置和教材两个子系统。在课程设置上，应该与国际接轨，课程设置要借鉴国际知名同类院校的经验，但是一定要结合本校的资源状况，有辨别，有参考，有借鉴的学习和引进。并且要循序渐进，稳步实施。应该是先从高年级到低年级，先选修到必修，在大一和大二开设基础英语和专业基础理论课程，构成基础模块。在大二下学期到大三开设会计专业的外语课程，跨文化方面的课程。为双语教学提供专业知识和文化环境作铺垫。构成过渡模块。在前两个基础作好的情况下，开设会计学双语课程。从目前实践情况看，许多高校都开设管理会计和成本会计的双语教学，其目的主要是为了避免中西方的会计准则差异，方便教学。总之，所选课程要有代表性，衔接性和外延性。在教材方面，主张采用原版英文教材，所选教材必须在国际会计学术界公认先进水平，要有一定适应性，比如英，美两国的会计教材都可以迅速，全面反应最新的会计学术成果。

(2)教学方式和方法。教学方式和方法应该多样化。包括有教学工具的多样化和教学的互动化。除了传统教材，多媒体以外，还应该采用视频剪辑材料，网络材料，模拟实物等多种形式来为学生提供丰富的教学原始材料，这样也容易产生更为直接的正向学习迁移。由于双语教学的特殊性，情感过滤的效应更为明显，不同学习者可能会产生差异较大的主观情感体验，因此设置互动的教学情景非常重要。比如讲座，讨论，辩论，小组活动。模拟游戏等教学活动都可以产生比较好的效果。

在系统中，我们必须注意环境的变化。可以考虑以立项的形式来加强会计双语课程建设，树立精品意识，以教改立项或者课程建设立项的形式来推行会计双语教学。学校明确建设目标，加大支持力度，严格验收，保证建设效果。并且要注意滚动支持。这样才能使得会计学双语教学具有一定的连贯性和一致性。

在反馈机制中，我们重点要研究教学评价机制，也是考核办法。应该通过合适的考核方式来判断，把平时考核和最后考试有机结合起来。平时考核采用灵活的方式，如课堂提问，小测验，作业，主体发言等。重点考核学生的学习态度，对知识的掌握，理解等。要结合笔试，口试，开卷，闭卷等多种方式，加强对知识应用能力的考查。

除此以外，这个系统有个重要的支持平台，就是师资状况和学生的英语水平。没有这两个基本的平台。其双语教学将面临严重的问题。要加强师资队伍建设，采用各种形式加强对教师的培训，比如将一些双语教师送到国外进修，或者从条件好的院校聘请好的双语专家来进行外语授课，讲学等。同时提高双语教师的待遇，给予一定的工作量补贴等。鼓励年轻教师投身双语教学课程的建设中。

总而言之，会计学双语教学系统必须要结合我国的实际情况来构建，而影响系统的因素以及各个子系统本身都是在处于不断变化之中的，特别是我国处于教育快速发展阶段，可变量会更多也会更加复杂，技术在不断的快速发展，相应的政策法规也会随着形式的需要不断完善。在对外改革开放的浪潮中，传统的文化受到冲击，因此系统本身就是动态变化中，要根据实际情况随时进行调整。使系统紧紧围绕整体总目标来协调发展。同时兼顾处理好与周围环境的关系，系统与环境的互相影响主要依靠有效信息的反馈来争取产生正面影响使整个系统健康协同的发展。

四、会计学双语教学系统的特征

双语教学系统作为一个系统，它应当具有的特征如下：

系统是由一些相互联系和彼此影响的部件所组成，其中的部件及其结构是系统的基本组成部分。系统作为一个整体，其各个子系统有独立的性质和功能。师资力量和学生一定的英语水平作为系统的硬件基础，新的技术水平在大大提高系统效率的同时，也会破坏系统的平衡，破坏系统的常态，对系统提出了适应变革的要求，为了适应这种变化，保持竞争力，必须要通过学习先进文化来增强系统的向心力，同时又需要对系统的教学方式，方法，教学内容等做出新的调整。这些子系统有其各自的独立性，在此基础上所形成的教学系统具有动态整体性，它会在外部环境中不断演化发展，新的管理系统在发展中得到升华，从而有力的推动了双语教学的发展。

系统应当具有一定的目的性，系统的部件及其结构的开发是为了实现管理的目的，不同的子系统有特定的目的。把我国会计学双语教学看作一个系统可以使我们认识到双语教学不仅仅学校的事项，而且同教师，政策的支持，学生的参与程度等存在着密切的联系。因此还必须从宏观上采取一些必要措施才能有效的推动这一个系统工程的健康发展。除此以外，系统作为一个整体，各个子系统之间的相互影响，相互作用决定了各个教学信息资源的开放性和共享性是互利和互补的。各子系统必须在合作中发展，在合作中竞争，共同促进会计学双语教学的发展。

系统必须是一个开放的、包容的、崇尚学习的系统。只有如此才能具有创新，不排斥不同的观点、理念，不失去生存的空间。在我国，高校的竞争已经异常激烈，因此会计学双语教学系统必须是个开放，包容的系统。只有这样才能使得高校在发展的道路上坚持“拿来主义”方针，实现国外的先进科技和理念为我所用，可以少走许多弯路，缩小与国际会计间，国际教育间的差距。增强自己的竞争力。

参考文献:

[1]吴秋明:集成管理经济科学管理出版社,2004

[2]吴向阳:会计专业双语教学的理论和实践探索.教学研究2006,24期

[3]李灿:对我国高校实施会计教学的几个相关问题探讨－以会计学科为例.高等教学研究,2007.01期

[4]龙文彬:会计学专业“双语”教学实践探索.广东技术师范学院学报,2007,08期

[5]宋京津:关于“国际会计学”课程的教学改革问题.管理科学文摘,2007,03期

统计学的特征篇（3）

关键词：大学生心理健康；UPI；特征差异

Key words： college students' mental health；UPI；characteristics differences

中图分类号：G44文献标识码：A文章编号：1006-4311（2010）35-0232-02

0引言

大学生心理健康问题日益严峻，不仅学校等教育部门为此绞尽脑汁，而且理论界也纷纷研讨防范与治理对策。戴梅竞等（1995）以医科大学生15年健康档案资料和1～4年级学生198名（男91人，女107人）为研究对象，调查分析了大学学习阶段各年级学生健康的变化规律，对其死亡、疾病、退学、休学、学习疲劳、视力、吸烟等生活习性和人格类型与特征，采用Bech-H、Scl90、EPQ个性问卷和RRT调查技术，评价大学生健康状况。发现二年级学生的身心健康最差，心理卫生问题最多，是高等学校预防保健工作的重点对象。Allen D. Kanner（1981），周生江等（2009），雒力静等（2009）的研究都表明个体的经济特征与社会特征对个体的心理影响很大。大学生特征差异的客观存在，势必会影响到其方方面面，特别是大学生心理健康方面。

1学生样本特征描述

本文问卷表是从湖南某高校随机抽选5个班级，然后由班级辅导员老师发放问卷，安排专门的时间由学生当场填写，辅导员老师对填表进行了简要的讲解，务必使学生理解。问卷表由三个部分构成：第一部分为学生基本情况调查表；第二部分为大学生健康测量表（UPI，共64个问题）；第三部分为症状自评量表（SCL－90，共90个问题）。共计发放问卷200份，全部收回，最后确认有效问卷162份，即为研究样本，其基本情况如表1所示：

样本涵盖了新生与老生、学生干部与非学生干部、城镇学生与农村学生、贫困学生与非贫困学生，具有较高的代表性。

2基于样本特征差异的大学生心理健康统计分析

首先，我们执行了样本中大学生的基本状况特征差异在UPI的得分上是否具有显著性进行了两独立样本t检验，结果发现UPI的得分在性别差异、入学时间差异、独生与非独生、是否学生干部、出生农村/城镇、贫困与非贫困方面不显著；然后，我们进行了具体问题上的两独立样本t检验，发现在某些问题上特征差异是具有显著性的。同时也采用了两独立样本非参数检验（Mann-Whitney秩和检验法），得到的结论与两独立样本t检验结果完全一致。

2.1 大学生性别差异对UPI影响的显著性检验采用两独立样本t检验方法（显著性水平为0.05）检验了性别在UPI的60个问题上是否具有显著性，结果发现在4、23、56等三个问题上男生与女生存在显著性差异，且满足方差齐性假设，如表2所示：

从表中可以看出：男生比女生更多的“关注心悸和脉搏”；男生比女生更容易“焦躁不安”；女生比男生更在乎“别人在自己背后说坏话”。雒力静等人（2009）的研究表明海南省本岛籍贯大学生与内地籍贯大学生心理健康水平没有显著性差异。男女生之间整体差异不显著,女生与男生相比在抑郁、焦虑、强迫症状、躯体化、精神病性5个因子方面存在显著性差异。这可能与女生人际交往是非多、多愁善感、易紧张、胆小有关与男生考虑问题好偏激、情绪好激动、争强好胜、易激怒有关。本文的研究结论与国内的同类研究基本一致。

2.2 新生与老生差异对UPI影响的显著性检验在UPI的60个问题上是否具有显著性，结果发现在3、15、23、53等四个问题上新生与老生存在显著性差异，且满足方差齐性假设，根据我们的统计结果得出：老生比新生更容易“拉肚子或便秘”；老生比新生“情绪起伏更大”；老生比新生更加“焦躁不安”；但新生比老生更加“对脏很在乎”。大学新生刚开始还很激动，觉得大学还挺漂亮。可是新鲜劲头一过，就觉得食堂太差，“学习上也与中学有很大的不同，老师讲课容量很大，很大知识都需要自己自学，而且学习完全靠自觉，很多大学新生难以适应。但大学老生又面临着学业、社交恋爱、毕业就业等各方面的压力，使老生更易焦躁不安等。

2.3 学生干部与非学生干部差异对UPI影响的显著性检验检验了担任学生干部在UPI的60个问题上是否具有显著性，结果发现在12、13、50、53、54等五个问题上学生干部与非学生干部存在显著性差异，且满足方差齐性假设，如表3所示：

从表中可以看出：学生干部比非学生干部更“热情和积极”；学生干部比非学生干部“人缘好受欢迎”；学生干部比非学生干部更加“对脏很在乎”；但学生干部比非学生干部更“悲观”；学生干部比非学生干部更“摆脱不了毫无意义的想法”。

2.4 城镇学生与农村学生差异对UPI影响的显著性检验检验了城市学生/农村学生在UPI的60个问题上是否具有显著性，结果发现在1、2、5、53等四个问题上存在显著性差异，且满足方差齐性假设，根据统计分析的结果可以得出如下结论：城镇学生比农村学生更“食欲不振”；城镇学生比农村学生更易“恶心、胃口难受、肚子疼”；城镇学生比农村学生更加“对脏很在乎”；但城镇学生比农村学生感觉“身体健康状况良好”。大学生无论是独生子女还是非独生子女的经济压力、生活压力、心理压力都较大，心理易产生焦虑不安等意向。多数农村大学生经济非常紧张，切实感到读书不容易，常常因为家庭经济困难，又不能为家里分忧，还要让家人负担自己上学的费用而负疚感重，易伴有自卑、多疑、焦虑等倾向。大多数农村大学生没什么社会背景，在求职择业上会比城镇大学生更难，对即将走上社会充满恐惧心理。高校对农村大学生应该充分关注。

2.5 贫困生与非贫困生差异对UPI影响的显著性检验检验了贫困生与非贫困生在UPI的60个问题上是否具有显著性，结果发现在24（容易动怒）、29（缺乏判断）等两个问题上存在显著性差异，且满足方差齐性假设，即非贫困生更容易动怒，贫困生更缺乏决断能力。与之相类似的是，周生江等人（2009）研究认为经济压力、学习压力、家庭变故是影响贫困大学生心理健康的三大主要压力。

2.6 大学生特征差异在“是否有过轻生念头”问题上的显著性检验特别需要注意的是，在此项量表的162名大学生测量中，有21人回答“有过轻生念头”，占参加测量学生总数的12.96%，比例较高，需要引起极大的关注。然后我们进行了相应的t值检验，发现了男生与女生、新生与老生在“有过轻生念头”上存在显著性差异，在是否担任学生干部、是否独生子女、是否为贫困生等方面不显著，且满足方差齐性假设。大学生正处在社会的大变革时期，面临的机遇和挑战很多，心理上要承受多方面的压力。文化基础差，学业不顺，学习受挫，失恋、爱情受挫是大学生常见的轻生原因。值得高校注意的是，近期许多大学生甚至硕士博士轻生。

3结论与建议

大学生心理健康状况令人堪忧，而大学生特征差异对大学生心理健康的影响研究具有重要的理论价值与现实意义。本文采用两独立样本t检验统计方法，对UPI心理问题在大学生特征差异上是否具有显著性进行了检验。结果发现一些有意思的结论：学生干部比非学生干部更“热情和积极”；学生干部比非学生干部“人缘好受欢迎”；非贫困生比贫困生更“容易动怒”；但贫困生比非贫困生更“缺乏决断能力”。表明了大学生的特征差异对于其心理健康有显著地影响，而且各个特征对心理健康影响的方面与程度有很显然的不同，这就为大学生心理健康问题研究提供了新的研究视角与有价值的参考建议。本文为此提出了相关的建议：①高校必须建立相应的心理健康预警干预系统；②要针对大学生的特征差异，进行心理预警及心理辅导工作，认识到每一位大学生的心理优势与心理劣势，从而使心理教育工作更具成效；③高校要建立健全大学生心理健康信息库，及时输入相应信息，及时跟踪分析，密切关注大学生心理健康问题，尽早识别心理健康高危群体，采取相应防范措施。本文的研究不足首先是限于财经院校，研究样本都来自经济管理类的文科大学生，缺乏对理工科大学生心理的分析，其次研究样本还不大，这些还有待于将来作进一步深入研究。

参考文献：

统计学的特征篇（4）

中图分类号：S158 文献标识号：A 文章编号：1001-4942（2017）07-0081-05

Abstract In this paper， the spatial variability characteristics of available microelements in farmland soils in Wendeng District of Weihai City were studied by means of geostatistics and ArcGIS. The results of statistical analysis showed that the available B， Fe， Mn， Cu and Zn accorded with the logarithmic normal distribution， and the contents of trace elements were all within the normal range， but the total level was lower. The variation coefficients of soil microelements had greater differences and the distribution was not balanced. The available Fe， Mn， Zn and Cu belonged to moderate degree of variation （10%～100%）， while the available B belonged to low degree of variation （

Keywords Plow layer soil； Trace elements； Spatial variability； Kriging interpolation

微量元素是土壤的重要M成成分，是表征土壤质量的重要因子[1]，虽然在土壤中含量比较低，但对作物正常生长影响广泛，有重要探究意义。近年来，许多国内外学者对土壤微量元素进行了多方面探究，基于地统计学的内插方法能够更好地反映微量元素的空间分布特征，推动对微量元素空间异质性研究探讨，比如徐尚平等[2]用克里格法分析了内蒙地区土壤微量元素的空间结构，发现母质和以土类为代表的表生地球化学作用是影响分布模式的主要因素。张庆利等[3]对城郊蔬菜基地、赵彦峰等[4]对城乡交错区分析耕层土壤有效微量元素空间分布的影响因素认为，有效锌和有效铜的含量主要受人类活动影响。农业生产中施用的氮、磷肥等将导致土壤-植物系统中微量营养元素的失衡，从而引起微量元素的缺乏[5]。

本文在前人对文登区研究的基础上，结合文登区土地类型、地形、利用现状等因素分析了土壤有效态微量元素的空间分布规律，有效弥补了文登区土壤养分分析的不足，以更全面直观地了解文登区微量元素分布现状，有助于精准施肥，因地制宜，对农业生产有重要指导意义。

1 材料与方法

1.1 研究区概况

文登位于山东半岛东部，在北纬36°52′～37°23′、东经121°43′～122°19′之间。西阻于昆嵛山，与烟台市牟平区和乳山市相接，北连威海市环翠区，东邻荣成市，南濒黄海。总面积1 645 km2，海岸线155.88 km。全市土地总面积161 461.77 hm2，农用地占土地总面积的74.90%。文登位于新华夏系第二隆起的东部，总的地质特点是：地质简单，岩浆岩分布广泛，构造不太发育。全境两侧高，中间低，北部高，南部低，像一个簸箕，口向南，伸向黄海。境内地形复杂，丘陵起伏，沟壑纵横，平原沿河谷两岸及滨海地区呈带状展布。山地占总面积19%，丘陵占58.4%，平原占22.6%。文登地处北温带，属大陆性季风气候，四季分明。降水分布不均，夏季较为集中，春秋季降水偏少，常发生干旱。根据全区第二次土壤普查资料，全区土壤有6个土类，10个亚类，14个土属，97个土种，179个变种。棕壤是全区主要土壤类型，分布于各地，可利用土地面积13.15×104 hm2，占可利用总面积的83.59%。

1.2 研究方法

1.2.1 样品采集与分析 2011 年 9 月（作物收割后）进行耕层土壤（0～20 cm）的取样，以威海市文登区土地利用现状图为基础图件，结合研究区实地情况，根据均匀布点原则并进行实地采样，采取多点混合和四分法采集 0～20 cm 耕作层土壤，用手持GPS定位采样点，共布设2 387个土壤采样点，经筛选选取1 086个采样点（图1）。

土壤有效铁的测定采用邻二氮菲分光光度法[6]；有效锌、锰的测定采用DTPA浸提-原子吸收分光光度法[7]；土壤有效硼通常是指以沸水提取的硼，用甲亚胺比色法测定；有效铜采用火焰原子吸收分光光度法测定。

1.2.2 数据处理与统计分析利用 SPSS 19.0 对数据进行K-S检验和一般描述性统计，剔除原始数据中的异常值后，如不符合正态分布，需进行对数转换。利用GS+7.0和ArcGIS10.0软件互相辅助对数据进行半方差分析和拟合，依据变异函数理论模型参数，选取最优拟合方法，在地统计模块中进行普通Kriging插值，生成微量元素空间变异分布图。

半变异函数的理论模型可用来分析土壤理化性质空间变异的随机性和结构性，它是地统计学特有的工具和分析的基础[8]。变异函数是研究空间变异的关键函数[9]，该函数为：

r（h）=12δ2[Z（x+h）-Z（x）]。

式中：h―样本间距；Z（x）―在位置x处的数值；Z（x+h）―在距离x+h处的数值[10]。

实际工作中区域化变量的变异性往往很复杂，它可能在不同的方向上呈现不同的变异性，或者在同一方向上包含着不同尺度的多层次的变异性。

2 结果与分析

2.1 土壤有效态微量元素的统计分析特征

土壤有效态微量元素指标的描述统计结果见表1。按照全国第二次土壤普查养分分级标准，文登区土壤有效态微量元素含量差异较大，有效Fe、Mn、Cu、Zn、B 含量的变化范围分别为2.02～9.32、1.63～8.52、0.03～0.94、0.01～0.72、0.10～0.26 mg/kg，其平均含量分e为4.26、4.35、0.31、0.22、0.24 mg/kg，其中有效Mn的平均含量最高，有效Zn的平均含量最低。按照山东省土壤有效态微量元素分级标准，从平均含量来看，有效态Fe 处于低等水平（2.5～4.5 mg/kg），有效Mn处于低等水平（1～5 mg/kg），有效Cu处于中等水平（0.2～1.0 mg/kg），有效Zn处于低等水平（

2.2 土壤有效态微量元素空间异质性特征分析

块金值也叫块金方差，反映的是最小抽样尺度以下变量的变异性及测量误差，表示随机部分的空间异质性。块金值与基台值的比值为空间相关度，表示可度量空间自相关的变异所占的比例，表明系统变量的空间相关性的程度。如果比值75%说明空间相关性很弱。如表2所示，各个微量元素块金值/基台值均小于25%，说明具有强烈的空间相关性，说明在该研究区内，受人为因素（耕作、施肥、种植制度等）的影响较小。由表2可知，土壤微量元素的半方差函数拟合效果最优，有效Fe、Mn、Cu、Zn用指数模型拟合效果最优，有效B用球状模型拟合效果最优。

2.3 土壤有效态微量元素含量的空间局部插值分析

空间插值分布图可以更直观地体现土壤微量元素含量的变化，为便于全面、直观地揭示土壤微量元素的空间分布规律，在 ArcGIS10.0 中，对各个微量元素采用普通Kriging插值（图2）。中部低山丘陵区有效Fe含量较高，在 6.0 mg/kg 以上，中南部边界地带有效Fe 含量最低，且有区域性特征，基本在小观镇范围内，土地利用类型是菜地和果园。有效Mn的分布特征与有效Fe有一定的相似性，环绕在铁元素密集区周围。有效Cu在北部山区、中北部圣经山以及中南部低山丘陵一带较为集中。有效Zn和有效B地域差异不明显，分布较为细碎化，说明受人类活动、地形和土地利用类型影响比较少。张忠启等[12]研究了江苏省沛县土壤全氮空间变异性，土壤类型对土壤全氮含量有着重要影响，成土母质是影响空间分布的重要因素。微量元素空间分布较为复杂，产生这种现象的原因主要与研究区的成土母质有关，成土母质是影响微量元素含量和空间分布的首要因素[13]，文登区成土母质大部分为酸性岩风化物，土壤代换量平均在6.5 cmol/kg土，保肥能力弱。

3 讨论

通过对文登区土壤有效态微量元素的分析，应从以下两个方面加强研究：

（1）全面统计微量元素的空间信息，利用ArcGIS空间分析功能，结合土地利用现状、类型、地形、气候等相关数据，整合土壤有机质与氮磷钾大量元素信息，进行土壤养分综合分析，提高插值精度，为进一步开展文登区土壤监察与改良提供理论依据。

（2）文登区土壤有效态微量元素含量均在正常范围之内，总体偏低，施肥是土壤养分补给的重要来源，在施肥过程中土壤微量元素也会产生动态变化，应根据不同乡镇农业农村经济发展阶段和科学施肥水平，因地制宜加快配方肥推广，绿色防控，逐步淘汰高毒、高残留化学农药应用，规范化、标准化使用化学投入品，不断改良土壤，使土壤养分达到生态平衡，改善缺乏现状，助力农业生产。

4 结论

本研究运用经典统计学和地统计学的方法，借助GS+软件辅助调参，运用克里格内插的方法分析了威海市文登区耕层土壤微量元素空间变异特征，主要结论如下：

（1）统计分析结果表明，有效B、Fe、Mn、Cu和Zn 符合对数正态分布，土壤中有效态微量元素含量均在正常范之内，总体偏低，有效Cu 处于中等水平，其他元素均处在低等水平，处于普遍缺乏状态。土壤微量元素的变异系数差异较大，分配不均衡，有效Fe、Mn、Zn、Cu均属中等变异程度（10%～100%），而有效B属低等变异程度（

（2）利用普通Kriging插值方法，在半变异函数拟合模型基础上，分析了土壤有效态微量元素的地统计特征，文登区土壤微量元素含量空间变异具有各向异性，块金值/基台值均小于25%，具有强烈的空间相关性，说明在该研究区内，受人为因素的影响较小。有效态元素Fe、Cu、Mn 和 Zn 用指数模型拟合较好，有效B用球状模型拟合较好。

（3）通过制作该区域土壤微量元素含量的空间局部差值图，分析了其空间分布规律。中部低山丘陵区有效Fe 含量较高，中南部边界地带含量最低，且有区域性特征，有效Mn的分布特征与有效Fe有一定的相似性，有效Cu在北部山区、中北部圣经山以及中南部低山丘陵一带较为集中，有效Zn、B地域差异不明显，分布较为细碎化。

参考文献：

[1]王学军，邓宝山，张泽浦.北京东郊污灌区表层土壤微量元素的小尺度空间结构特征[J].环境科学学报，1997，17（4）： 412-416.

[2]徐尚平，陶澍，徐福留，等.内蒙土壤微量元素含量的空间结构特征[J].地理学报，2000，55（3）：337-345.

[3]张庆利，史学正，黄标，等. 南京城郊蔬菜基地土壤有效态铅、锌、铜和镉的空间分异及其驱动因子研究[J]. 土壤，2005，37（1）： 41-47.

[4]赵彦峰，史学正，黄标，等. 工业型城乡交错区农业土壤 Zn 的空间分异及其影响因子探讨――以无锡市为例[J]. 土壤，2006，38（1）： 29-35.

[5]洪松，郑泽厚，陈俊生. 湖北省黄棕壤若干微量元素环境地球化学特征[J]. 土壤学报，2001，38（1）：89-95.

[6]马鄂超. 第三讲土壤养分测定（二）[J]. 新疆农垦科技，2006（1）：59-60.

[7]钟育均. 邻二氮菲分光光度法测定土壤中的铁[J].广东化工，2010，37（3）：184-187.

[8]刘爱丽，王培法，丁园圆.地统计学概论[M].北京：科学出版社，2012：5.

[9]徐国策，李占斌，，等.丹江中游典型小流域土壤总氮的空间分布[J].地理学报，2012，67（11）：1547-1555.

[10]徐建华.现代地理学中的数学方法[M].北京：高等教育出版社，2002：112.

统计学的特征篇（5）

下面，以五年级上册“复式统计表”一课教学为例，谈谈如何遵循学生的心理特征进行数学教学。

一、创设情境，引发学生的学习需要

学习需要是指个体在学习活动中感到有某种欠缺而力求获得满足的心理状态，是学习者的学习愿望或学习意向，包括学习的兴趣、爱好和信念等。情境创设的目的是根据学生的身心发展特点和认知规律，建立利于学生学习的心理环境和认知环境，提高他们学习数学的兴趣，有助于他们理解所学的数学知识。

1．创设情境

师（出示本班的课程表，略）：选修课是学校为培养同学的兴趣而专门开设的课程，很多学校也向我们学习，开设了兴趣班，让我们一起走进青云小学的兴趣小组看一看。（出示下图）从图中，你能获得哪些信息？小组内互相说一说。（学生交流讨论）

师：这些信息还可以用统计表简洁地表示出来，你能把各小组的人数填写到相应的统计表里吗？

2．引发需求

师：我们不但要会填表，还要会看表。下面大家看表抢答问题：（1）航模组男生有多少人？（2）美术组一共有多少人？（3）哪一组的男生最多，哪一组的女生最少？（4）这4个组的男生一共有多少人？

生1：航模组男生有8人。

生2：美术组一共有10人。

生3：航模组男生最多，书法组女生最少。

生4：这4个组的男生一共有18人。

师：为什么前两个问题大家回答得很快，而后两个问题却回答得比较慢？

（引导学生想到前两个问题可以直接在统计表中找到答案，而后两个问题需要从四张统计表中分别找到数据进行比较和计算后才能解答）

师：怎样才能让我们的观察、比较方便些呢？

（使学生产生把四个表格合并成一个表格的需要）

师：那我们就来创造一个这样的统计表。

……

上述教学从学生已有的知识和经验出发，教师先呈现情景图，然后组织学生填写单式统计表。通过这样的复习，既激活学生对已有统计表的认知，又为后继引出复式统计表做好准备。教师接着提出一个挑战性的问题，学生需要对统计表中的数据进行观察比较后才能迅速抢答，从而让学生体会到单式统计表的局限性。“怎样才能让我们的观察、比较方便些呢？”面对这一问题，学生通过思考，想到了合并的方法。课始通过创设问题情境，使学生原有的认知结构产生不平衡，需要寻求一种办法来解决问题，也就从内心产生了学习复式统计表的需求，从而激发了学生学习新知的兴趣。在这一环节中，教师先巧妙地设计了两组问题，让学生感受到单式统计表的局限性，然后在此基础上引导学生想到“有必要把数据放在一起”，从而自然产生将四个表格合并成一个表格的强烈需求，激发了学生的学习兴趣，为学生学习新课形成了积极的学习情感。

认识复式统计表的结构是本课教学的重点，教材给学生提供了结构完整的复式统计表，只要求学生把数据填写在统计表中，而不要求学生自己制作复式统计表，降低了学习的难度。但经历学习探究的过程，远比得到结果要有意义得多。因此，我在教学中没有给学生提供结构完整的复式统计表，而是让学生根据已有的知识与经验，通过小组合作，在空白表格中设计统计表，引导学生在师生的共同交流中逐步对统计表进行创造、完善、修改。学生小组在设计统计表的过程中出现了横栏与纵栏的不同设计，这正是后一个环节要教学的内容，学生的不同设计让这一个环节省略了，真的是太好了。这不是一个封闭的寻找固定答案的过程，也不是亦步亦趋地复制教材的过程，而是学生兴之所至、即兴发挥的灵动过程。在整个探索过程中，复式统计表也由模糊到清晰、从粗略到细密地形成了。“合并”这一过程很有价值与意义，让学生认识到复式统计表的学习是反映更丰富的信息的需要，体会到复式统计表是由单式统计表发展而来的，初步理解复式统计表的结构。同时，这样的学习过程也给学生留出更广阔的探索空间，极大程度地发挥了学生的主动性，加深了他们对复式统计表结构的理解和认识。

二、小组合作，丰富学生的情感体验

本节课共安排了三次学生小组的合作活动。

第一次学生小组合作探究复式统计的结构，共同设计统计表。小组讨论：（1）要把这四个统计表的内容合并在一个统计表中，这个统计表应该反映出哪些信息？这些信息在这个统计表中可以怎样排列呢？（2）根据小组讨论的结果，在空白表格中共同完成统计表的设计。（3）比一比，看哪一组合作得又快又好。在这一合作过程中，各个小组成员都能按照要求先讨论再设计，或边讨论边设计、边设计边改进。表格的形成发挥了小组成员集体的智慧，这也正是小组合作的魅力所在。各个小组的设计大同小异，但学生在全班交流的过程中，都能从别人的设计中有所收获。更可喜的是，学生的设计中出现了横栏、纵横交换位置的不同表格，这是课堂中学生给我的又一次惊喜。在师生的共同交流中，逐步对统计表进行创造、完善、修改，形成了最终的复式统计表。

第二次小组合作活动在学生独立填写统计表之后。小组交流：（1）你先填的那些数据，怎样在统计表中找到它们的位置？（2）“合计”中的每一格是怎样算的？（3）表中的“总计”指什么？怎样算？（4）“总计”与“合计”交叉的那一格表示的是什么？你是怎样算的？还可以怎样算？学生小组讨论交流后，全班汇报。这一次小组合作活动主要是通过小组交流，明确正确的填表方法以及填表的先后顺序，让学生感知到应有序填写，使学生直观明白该怎样填写复式统计表，起加深印象的作用。

第三次学生小组合作活动，我让学生调查统计自己身边的事——最喜欢的球类运动。先在小组内统计，再进行全班统计，这是引导学生经历数据收集的过程，使他们体会统计与现实生活的密切联系，感受到数学学习的乐趣，进一步体验统计的作用与价值。这个环节的教学，使得整节课的教学更趋完整，更贴近生活，使学生真正体会到数学就在自己身边。

在合作过程中，师生、生生之间的交互活动是多边进行的，学生有更多的机会发表自己的看法，并且能充分利用自己的创造性思维，获得解决相同问题的不同答案。同时，这样的合作学习过程也使学生的学习环境更为宽松，自主发挥的空间更为广阔。另外，在小组合作学习中，同伴之间相互帮助，在动手实践中发现、探究科学的奥秘，提高了学习数学的兴趣，既满足学生的各种内在需要，激励他们的参与意识，又使他们在参与学习的活动中得到愉悦的情感体验。

三、联系生活，激发学生的学习兴趣

《数学课程标准》指出：“数学教学活动，特别是数学课堂教学应激发学生兴趣，调动学生积极性，引发学生的数学思考；数学源于生活，生活中又充满数学。”课堂教学中，教师应从学生的实际生活出发，将知识传授和实际生活密切联系起来，激发他们的学习兴趣和求知欲望，有效促进学生对知识的建构。

由于教材受编写时间的限制，教材的部分内容与生活现实存在脱节现象，学生没有真切的体会，自然就没有学习的兴趣。因此，我对本课中的部分习题做了适当改编。如奥运会奖牌情况的统计，教材呈现的是第25～28届奥运会中国代表团获得奖牌的情况，而如今已是第30届奥运会了，如果仅仅是为了完成这道习题，就感觉与时代有一些脱节了。于是我在学生填写表格之后，将数据进行了改动，加入29、30两个奖牌数。这时学生感觉到这个统计表不够用了，由此产生问题：“增加两栏还得填上数据，有数据又得改动，怎样改动呢？”两组数据的加入引发了学生一连串的思考，学生活跃的思维、积极的表达把课堂气氛推向了高潮，这是我课前没有预料到的。可以说，这是学生给我的又一次惊喜。这个环节的教学也进一步激发了学生的学习兴趣，让学生更深刻地体验到数学与生活的密切联系，并通过对数据的整理、分析、交流，培养了学生的爱国情感，有效落实情感与态度方面的教学目标。

统计学的特征篇（6）

[收稿日期] 2013-09-24

[基金项目] 浙江省自然科学基金项目（Y2110991）

[通信作者] *严云良，副教授，从事数理医药学研究，Tel：（0571）86633116，E-mail：

祖国医学治疗血瘀证的历史悠久，经验独到，其中不乏有许多经方、名方沿用至今。桃核承气汤为《伤寒杂病论》中辨治瘀证的重要基础代表方，具逐瘀泄热之功效，现代研究表明，该方及其加减方能降低血黏度、胆固醇、纤维蛋白原和血糖、降低血小板黏附机能而不影响血小板数量[1-2]，并能显著扩张血管、改善微循环[3]。在中医药理论指导下，项目组前期已对桃核承气加减方进行了剂型改良，根据现代制药工艺精制成了祛瘀清热颗粒剂。前期研究显示，祛瘀清热颗粒剂可有效改善血瘀家兔体内血液流变学和抗氧化作用。项目组拟在对其质量控制、制备工艺以及药效研究[4-6]的基础上，进一步开展药代动力学和药效物质的相关研究。

中药复方药代动力学研究常套用基础药代动力学的数学模型，多为房室、非线性以及统计矩模型，然而中药复方成分复杂，各有效成分的作用途径、对机体的影响各不相同，且它们之间也会相互影响[7]。因此，对于中药复方而言，仅以单一活性成分（效应）为指标并采用传统数学模型进行药代动力学研究，尚不能满足中药复方整体效应的体现，不利于进一步研究药物所发挥的整体作用、整体药效的作用机制及物质基础[8]。总量统计矩分析法的原理是根据统计矩学中的多维随机向量求数学期望及方差的思路来寻找药物中多个成分的代谢动力学中心，该法以统计矩分析法为基础，并以药-时曲线下面积为主要计算依据，其不受房室模型等数学模型的限制，适用面广[9-10]，能整合多成分的动力学参数，表达多成分体系的总量药动学行为，可弥补传统药动分析方法仅能实现单一成分分析的不足，在当前缺少中药复方药代动力学多成分信息处理方法的情况下，该方法不失为一种行之有效的分析方法。

大黄酸和大黄酚为祛瘀清热颗粒中君药大黄的主要活性成分，具抗肿瘤、抗炎、抗血栓形成、抑菌以及抗氧化等作用[11-14]，有关此2个成分的研究一直以来较受关注。本文拟以大黄酸和大黄酚为切入点，运用总量统计矩分析方法，对祛瘀清热颗粒中此2个成分在正常与血瘀2种不同机体状态下家兔体内的血药浓度-时间数据进行处理，并计算相应的总量统计矩药动学参数，拟获得相应的总量药动学参数，为进一步评价祛瘀清热颗粒的总量药动学特征提供依据。

1 原理

统计矩分析法属于非房室模型分析方法，其主要有以下几种参数[15]。

零阶矩（AUC）：为血药浓度时间下曲线面积（时间从零到无限大），公式为（1），式中t为时间，C为经时血药浓度，k为消除速率常数，i为采血点数。 AUC=∫∞0Cdt=∑n i=1（Ci+Ci-1）（ti-ti-1） 2（1）

一阶矩（MRT）：为平均滞留时间，可定义为公式（2）。

MRT=∫∞0tCdt/∫∞0Cdt=AUMC AUC（2）

（AUMC=∫∞0tCdt=∑n i=1（tiCi+ti-1Ci-1）（ti-ti-1） 2+tnCn k+Cn k2）

二阶矩（VRT）：为平均滞留时间的方差，其公式为（3）。

VRT=∫∞0t2Cdt/AUC-MRT2=S AUC-（AUMC AUC）2（3）

（S=∑n i=1（ti2Ci+ti-12Ci-1）（ti-ti-1） 2+tn2Cn k+2tnCn k2+2Cn k3）

总量统计矩分析法可根据统计矩学中的多维随机向量求数学期望及方差的思路来寻找药物中多个成分的代谢动力学中心。中药复方属多成分体系，其总量药代动力学可以根据统计矩原理，建立中药复方总量零阶矩、总量一阶矩、总量二阶矩，并由此推导出如总体表观半衰期、总体表观消除平衡常数、总体表观清除率以及总体表观分布容积等总量药代动力学表观参数[16]，整合各单个成分的各药动学参数，从而实现微观各成分药动学参数与宏观总量药动学参数的统一。

总量统计矩分析法可克服传统药代动力学研究受诸多数学模型的局限，可将复方各成分的动力学参数整合，寻找到多成分的动力学总量中心点及离中心点的方差，即为总量一、二阶统计矩。假设中药复方为一个由n个单体成分群构成的体系，其中m个成分服从线性药代动力学，i个成分分别服从一、二、三室模型，N个成分符合非线性药代动力学，S个成分为不规则药动学模型，按照统计矩计算原理，可将各单成分药代动力学研究模型整合起来构成统计矩复合函数模型参数[17]，即复方多成分总量药动学参数，总量零阶矩、总量一阶矩、总量二阶矩等参数公式（4）～（10）如下。

总量零阶矩：AUCt=∑n j=1AUCj（j代表各成分）（4）

总量一阶矩：MRTt=∑n j=1MRTj・AUCj ∑n j=1AUCj（5）

总量二阶矩：VRTt=∑n j=1（MRTj2+VRTj）・AUCj ∑n j=1AUCj-MRT2t（6）

总体表观半衰期：t1/2，t=-ln1 2MRTt（7）

总体表观消除平衡常数：kt=1/MRTt（8）

总量清除率：CLt=Xt ∑n j=1AUCj（Xt为总给药量）（9）

总体表观分布容积：Vt=CLt・MRTt（10）

2 材料

2.1 仪器 Waters-1525-2998高效液相色谱仪（美国沃特斯公司）；0412-1型高速离心机（上海手术器械厂）；BS110S电子分析天平（北京赛多利斯天平有限公司）；WH-861涡旋混合器（苏州欧倍科学仪器有限公司）；HH-S型恒温水浴锅（巩义市英峪予华仪器厂）；DHG-9035 热风循环烘箱（上海林频仪器设备有限公司）。

2.2 样品祛瘀清热颗粒（批号12050502）由浙江中医药大学药学院制剂室提供；大黄酸对照品（批号0757-200206）及大黄酚对照品（批号110796-200716）均购自中国食品药品检定研究院；高分子右旋糖酐（批号091125，相对分子质量20万）购于上海丽臣生物科技有限公司；肝素钠注射液（批号100501）购于上海第一生化药业有限公司；色谱纯甲醇（批号20100401）购于天津四友精细化学品有限公司；分析纯磷酸（批号10015418）购于国药集团化学试剂有限公司；分析纯高氯酸（批号20090702）购于上海金鹿化工有限公司；实验用水均为纯净水。

2.3 动物普通级正常家兔，（2.0±0.2） kg，由浙江中医药大学实验动物中心提供，动物使用许可证号SYXK（浙）2009-0042。购买后由浙江中医药大学实验动物中心严格按照实验动物的饲养要求管理饲养动物。适应环境饲养1周，饲喂营养颗粒饲料，自由饮水，室内温度（22±2） ℃，相对湿度50%～60%。实验前禁食12 h，期间自由饮水。

3 方法与结果

3.1 色谱条件 Hypersil BDS C18色谱柱（4.6 mm×250 mm，5 μm）；流动相为甲醇-0.1%磷酸（79∶21）；流速1.0 mL・min-1；柱温36 ℃；进样量10 μL。

3.2 血瘀家兔造模方法家兔适应性培养后，于耳缘静脉注射10%高分子右旋糖酐注射液（5 mL・kg-1），早晚各注射1次，连续2 d，并于第3日上午再次注射10%右旋糖酐注射液1次，每次注射平均3 min内注完。实验时筛选已成功造成血瘀模型的家兔5只，作为血瘀家兔给药。

3.3 药液的制备与给药称取祛瘀清热颗粒（含大黄酸417.18 μg・g -1，大黄酚823.35 μg・g-1）适量，以纯净水溶解，超声10 min，配制成含浓度0.4 g・mL-1的混悬药液。实验时，家兔预先禁食12 h，以5.00 mL・kg-1的剂量单次灌胃给药。

3.4 家兔全血采集分别于给药后5，10，15，20，30，45，60，75，90，120，240，360，480 min从正常和血瘀家兔的耳中动脉取血3.0 mL，置于肝素化离心管中，摇匀，抗凝后，4 ℃ 4 000 r・min-1离心15 min，取上层血浆，-20 ℃保存。

3.5 血浆样品前处理于5 mL 具塞离心管中加入给药后血浆1 000 μL，再加入3 mol・L-1高氯酸溶液500 μL除蛋白，涡旋30 s后，70 ℃水浴加热水解30 min，冷却，加入乙醚2 mL，涡旋混合3 min，4 000 r・min-1离心15 min，精取乙醚层（最上层）于空离心管，挥干，残渣用50 μL 色谱甲醇溶解，涡旋10 s，4 000 r・min-1离心5 min后取上清液进样。

3.6 药-时曲线采用已建立的HPLC[4-5]测定正常与血瘀模型2组家兔血浆中大黄酸与大黄酚的经时血药浓度，每组家兔各5只。分别以大黄酸和大黄酚的质量浓度X（mg・L-1）为横坐标，以相应峰面积Y为纵坐标绘制标准曲线，得回归方程如下。大黄酸：Y =11 887X-2 355.5 （r=0.999 9）。大黄酚：Y =10 874X +337.53 （r=0.999 1），则血浆中大黄酸在1.313～105.0 mg・L-1，定量下限为1.313 mg・L-1；大黄酚在2.125 4～ 2.5 mg・L-1呈良好线性关系，定量下限为2.125 mg・L-1。两有效成分的平均药-时曲线见图1，HPLC色谱图见图2。

3.7 精密度试验精密吸取适量对照品溶液于5 mL具塞离心管中，挥干甲醇后加入空白血浆500

A.正常家兔；B.血瘀家兔。

图1 灌胃祛瘀清热颗粒后家兔体内大黄酸与大黄酚药-时曲线

Fig.1 Mean concentration versus time profiles of rhein and chrysophanol in rabbits after oral administration of QYQRG

A.空白血浆；B.加大黄酸和大黄酚对照品后的空白血浆；C.灌胃QUQRG后的血浆样品；1.大黄酸；2.大黄酚。

图2 大黄酸，大黄酚HPLC图

Fig.2 HPLC chromatograms of rhein and chrysophanol

μL，按照3.5项方法制备高、中、低3个浓度的质控样品，每个浓度各6份。分别测定高、中、低3个浓度样品中大黄酸与大黄酚的峰面积，并分别计算其日内、日间精密度。结果大黄酸与大黄酚的日内和日间精密度均小于15%，其中大黄酸3个质量浓度（94.50，52.50，2.625 mg・L-1）的日内精密度分别为2.3%，6.7%，9.5%，日间精密度分别为4.6%，6.7%，5.8%；大黄酚3个质量浓度（27.40，25.50，4.250 mg・L-1）的日内精密度分别为4.7%，4.7%，6.6%，日间精密度分别为5.3%，6.6%，6.0%，结果均符合《化学药物非临床药代动力学研究技术指导原则》要求。

3.8 提取回收率试验精密吸取适量对照品溶液于5 mL具塞离心管中，挥干甲醇后加入空白血浆500 μL，按照3.5项方法制备高、中、低3个浓度的质控样品，每个浓度各6份。分别测定高、中、低3个浓度样品中大黄酸与大黄酚的峰面积，并计算其提取回收率（以处理后样品浓度值与处理前样品浓度值的比作为提取回收率）。结果显示大黄酸3个质量浓度（94.54，52.50，2.625 mg・L-1）的提取回收率分别为95.01%，100.3%，104.0%，其RSD分别为2.2%，8.0%，8.5%；大黄酚3个质量浓度（37.40，25.50，4.250 mg・L-1）的提取回收率分别为100.6%，101.2%，110.0%，其RSD分别为8.8%，4.4%，8.7%，结果均符合《化学药物非临床药代动力学研究技术指导原则》要求。

3.9 总量统计矩分析结果根据统计矩的药动学参数（零阶矩AUC、一阶矩MRT、二阶矩VRT）以及总量统计矩的定义，计算祛瘀清热颗粒2个有效成分的总量统计矩药动学参数。具体计算方法为：分别将家兔的各采血点两有效成分的血药浓度代入公式（1）～（3），算得各家兔两成分的零、一及二阶矩参数值后，再将所得零、一及二阶矩参数值分别代入相应公式（4）～（10），即得各总量统计矩的药动学参数值，结果见表1。

如表1所示，血瘀组的VRTt与正常组相比具有显著性差异（P

家兔相比，大黄酸和大黄酚在血瘀家兔体内的入血量高于正常家兔，在体内停留的时间相对变长，吸收相对更好，释放更快。此外，血瘀家兔kt，CLt小于正常组，t1/2t大于正常组，提示两有效成分在血瘀家兔体内的消除速度相对较慢。

4 分析与讨论

建立中药复方成分总量的药代动力学参数体系可将中药复方各成分的药代动力学参数整合起来，寻找到多成分的药动学总量中心点及离中心点的方差，总量统计矩数学模型及其参数，能较客观地描述中药复方整体的量变行为[18-21]，为最终阐明中药复方作用的量-时-效关系，正确指导中药复方临床个性化用药提供理论依据。

根据统计矩的加合性原理可对单成分药代动力学的统计矩参数进行加合计算，获得一系列总量统计矩药动学参数：总量零阶矩AUCt是一个反映量的函数，也是一个常被用于评价药物吸收程度的重要指标；总量一阶矩MRTt为平均滞留时间，是一反映速度的函数，能够反映各药物分子在体内停留的平均时间；总量二阶矩VRTt为平均滞留时间的方差，属于较高阶的矩，可反映各药物分子在体内平均滞留时间的差异；总体表观半衰期t1/2t与总体表观消除平衡常数kt均是反映药物分子在体内消除速度的常数；总体表观分布容积Vt显示药物分子在体内分布的广窄程度；而总体表观清除率CLt则表示药物分子从血中被清除的效率。本文总量统计矩分析结果提示，与正常家兔相比，灌胃祛瘀清热颗粒后大黄酸与大黄酚在血瘀家兔体内的总入血量量更大，吸收和释放的时间变短，体内滞留时间变长，消除相对减慢。

本文运用总量统计矩分析法对祛瘀清热颗粒中大黄酸与大黄酚在正常与血瘀2种不同机体状态下家兔体内的总量药代动力学特征进行了评价，获得了相应的总量药动学参数，表明总量统计矩可整合2个有效成分的药代动力学参数，能表达祛瘀清热颗粒中这2个有效成分整体的药代动力学行为，所得参数能作为该颗粒剂后续开发利用的参考依据。本研究可为进一步研究祛瘀清热颗粒的体内代谢过程及其与药效的相关性提供参考资料，同时也为相关中药复方的药代动力学研究提供参考。

[参考文献]

[1] 唐凯. 抵当汤等对血液流变性异常大鼠模型的影响[J]. 浙江中医杂志，1988，23（7）： 319.

[2] 龚传美，管喜文，周东沈，等. 桃仁承气汤对动物血液系统的影响[J]. 中成药，1997，19（11）： 29.

[3] 李桂芝，龚传美，管喜文. 桃仁承气汤对小白鼠耳廓肠系膜微循环的影响[J]. 医学高等专科学校学报， 1998， 26（4）： 60.

[4] 吴巧凤，戴晓燕，文欣欣. HPLC 法测定祛瘀清热颗粒剂中蒽醌类成分[J]. 中成药，2012，34（5）：857.

[5] 严云良，何昱，余陈欢，等. 基于总量统计矩分析法的祛瘀清热颗粒剂HPLC指纹图谱研究[J]. 中华中医药杂志，2011，26（6）： 1419.

[6] 严云良，张东亮，文欣欣. 祛瘀清热颗粒的吸湿性研究及数据分析[J]. 数理医药学杂志，2011，24（4）： 445.

[7] 周丽娟，许利平，陈慧娟，等. 中药复方药代动力学常用研究方法评价[J]. 中华中医药学刊，2007，25（5）：1041.

[8] 郑世瑞，李俊，宋珏. 中药复方药动学研究的新思路[J]. 安徽医药，2010，14（11）：1243.

[9] 贺福元，邓凯文，刘文龙，等. 中药复方多成分体系群体药物动力学：总量统计矩数学模型及参数计算研究[J]. 中国中药杂志，2011，36（20）：2866.

[10] 黄胜，贺福元，刘文龙. 总量统计矩相似度法对左金缓释片多成分释放相似度的评价研究[J]. 中成药，2009，31（1）：35.

[11] Lee M S， Cha E Y， Sul J Y， et al. Chrysophanic acid blocks proliferation of colon cancer cells by inhibiting EGFR/mTOR pathway[J]. Phytother Res， 2011， 25：833.

[12] Legendre F， Bogdanowicz P， Martin G， et al. Rhein， a diacerhein-derived metabolite， modulates the expression of matrix degrading enzymes and the cell proliferation of articular chondrocytes by inhibiting ERK and JNK-AP-1 dependent pathways[J]. Clin Exp Rheumatol，2007， 25， 546.

[13] Kim S J， Kim M C， Lee B J， et al. Anti-inflammatory activity of chrysophanol through the suppression of NF-κB/caspase-1 activation in vitro and in vivo[J]. Molecules， 2010， 15：6436.

[14] 应卫星，陈华，李荣洲.大黄酸联合吡格列酮对大鼠非酒精性脂肪性肝炎治疗作用机制的探讨[J].中国现代应用药学，2012，29（7）：578.

[15] 王广基. 药物代谢动力学[M]. 北京：化学工业出版社，2005：97.

[16] 贺福元，罗杰英. 中药复方动力学数学模型――总量统计矩法的研究[J]. 世界科学技术――中医药现代化，2006，8（6）：13.

[17] 贺福元. 中药复方药物动力学数学模型的建立及对补阳还五汤的研究[D]. 成都：成都中医药大学，2006.

[18] 贺福元，罗杰英，邓凯文，等. 中药（复方）药动学研究现状及研究方法探讨[J]. 中草药，2005，36（10）： 1582.

[19] 贺福元，邓凯文，石继连，等. 中药多成分体系宏观质量表征的数学模型建立及实验研究[J]. 中国中药杂志，2011，36（22）：3096.

[20] 周晋，邓凯文，段晓鹏，等. 指纹图谱总量统计矩分析法参数的计算及积分条件的确定[J]. 中华中医药学刊，2012，30（3）：505.

[21] 贺福元，邓凯文，刘文龙，等.中药复方药物动力学总量统计矩法的实验验证研究[J].中国中药杂志，2013，38（2）：253.

Total quantity statistical moment analysis on pharmacokinetics of rhein and

chrysophanol after oral administration of Quyu Qingre granules in

normal and acute blood stasis rabbits

YAN Yun-liang， DAI Xiao-yan

（Zhejiang Chinese Medical University， Hangzhou 310053， China）

统计学的特征篇（7）

中图分类号：TP311 文献标识码：A 文章编号：1009-3044（2014）32-7731-03

1 概述

图像分类识别根据图像的不同特征对图像进行分类，有相同特征的对象归为一类。图像分类识别方法随着数学算法的不断进步而不断发展。目前，图像分类识别的主要方法主要有六种：模糊集识别、统计识别、神经网络识别、结构识别、模版匹配和支持向量机。这几种方法各有优缺点，根据具体情况来具体分析和应用，也可以多种方法相结合使用。

图像分类识别系统包括几个步奏[1]，如图 1所示，一是获取原图像的信息，二是对图像预处理，三是图像分割，四是图像特征提取，五是图像分类识别。

1）统计识别法

统计识别的理论基础是数学的决策理论，在决策理论基础上建立统计识别模型，统计识别模型对要分类的图像进行统计分析，统计出图像的各类特征，找出准确反映图像类别的特征，最后进行分类。其主要的技术有聚类分析法、统计法、KNN等。但是，统计识别法不能识别图像空间相互关系（即结构关系）。如要分类图像的结构特征是主要特征，用统计识别就不能识别图像。

在进行分类时需要大量图像样本，先统计图像样本特征，设定图像识别的一系列参数（即统计学习）。

统计识别法流程如图2[1]，输入的图像信息是原始图片；图像处理是对样本图像滤波、分割和特征提取；最后是图像分类，输出结果。

2）结构识别法

结构识别法即是句法识别，是对统计识别法不能识别图像结构特征的补充，因为统计算法不能统计图像的结构信息，只能统计图像的数字特征。结构识别法用符号表现图像的特征。结构识别采用的结构是层次结构，把复杂图像分解成单子图像，而子图像又可以分解为更简单的子模式，一直分解下去，直到分解为最简单的子模式，即模式基元。通过对模式基元的识别，进而识别子模式，最终识别该复杂的模式。结构识别法流程如图3所示。

3）神经网络法

神经网络法是通过我们学习的神经网络算法对图像进行分类。神经网络方法与统计识别方法在很多方面是有联系的，都利用样本数据完成图像的分类识别，并且在有的算法上还可以看作是一定的等价关系。神经网络算法的结构由一个输入层、若干个中间隐含层和一个输出层组成。神经网络法通过学习，能够从原始图像的复杂数据中找到相识的图像特征，对图像进行正确的分类。神经网络法克服了统计识别算法过程中的复杂性，以及模型选择的一些困难，是一种非线性建模过程，不需要分清图像中存在的非线性关系，给图像分类带来的极大方便。

神经网络算法有不同的网络结构，所以构造神经网络时首先要选择合适的网络结构。神经网法图像分类时首先要输入图像的文理特征和结构特征等一系类参数；中间经过图像的预处理和特征提取，最后输出的是图像类别。神经网络分类识别的流程图如图4所示。

4）模糊集识别法

模糊集识别法在模式识别、医学图像识别，车牌识别等方面的应用比较广泛。在图像分类时，有一些图像的特征不是很明显，不能准确的确定图像属于哪一类别时，模糊集识别法能很好地解决这一问题。先模糊地对图像进行判别，这时图像可能属于两个或多个类别，等到再找到另外的特征时再进行精确的判别。模糊数学是模糊集识别法的理论基础，模糊数学在判别事物时一般不是准确的去判断这事物到底属于什么，而是用不太精确的方式来判别事物，用更适合人的思维方式去判别。

模糊集识别法是在模式识别方法的基础上采用模糊逻辑的方法。在图像分类时，采用模糊理论对图像特征模糊化和模糊分类。

模糊集识别法根据一定的模糊化规则将图像的纹理或形状等特征分成多个模糊变量，虽然每个模糊变量不能准确的判别图像，只能判断原图像的一部分特征，但是这能更进一步地判别图像。我们用先前判别出的部分特征去替代原来的特征再进行图像判别，这样我们又能精确的判别图像类别。虽然模糊集识别法识别时图像的特征变多了，但是却使得判别更加，也使分类器设计趋于简单。

5）支持向量机

支持向量机（SVM）是一种新的人工智能学习算法，现在已经成为模式识别领域新的研究热点[3] 。支持向量机有学习效率高、抗噪声性能强和推广性好等优点。支持向量机是在原先统计学习理论的基础上，解决传统统计学习理论不能解决的一些问题（如神经网络结构选择问题，局部极小点问题等）而形成的一种新的学习方法。在图像识别时，支持向量机将图像特征向量映射到一个更高维的空间，在新的空间中重新建立一个最大图想参数阈值。首先判断图像的大类别，在阈值的两边再建立重新建立新的阈值，再进行分类，对图像不断判别。最后相差最大的就是图像属于不同类别。

6）模板匹配法

模板匹配法是对要识别的图像做出一个典型的标准模板，作为将要判别其他图像的标准，然后将要分类的图像与标准模板相比较，从而判断出图像属于哪一类别。其实模版匹配法是一种比较算法，将要识别的图像与标准模版放在一个分类器中做相关运算，根据我们学习的相关运算知识可以知道，如果两个信号出现自相关，就表示出现了主峰值（即阈值），这就表示模版图像和要识别的图像匹配，将这个阈值作为分类器的一个判决规则，即可实现图像的匹配。所以模版匹配法的首要任务就是先进行模版的创建，如果创建的模板很正确精确，那么我们在匹配的时候也会更加的精确。

模版匹配法的流程图如图5所示。

3 图像分类识别算法的优缺点

统计识别法的优点是以数学上的决策理论为基础的，能够比较快的建立出统计识别模型。通过建立出的模型，对图像进行大量的统计分析，能够准确的判断出图像的类别，并且统计出的特征都是数字特征，对计算机的性能要求较小。缺点是统计识别法不能统计图像在空间上的相互关系（即结构关系）。如果图像的结构特征为主要特征时，用统计方法不能进行准确的判别。

结构识别法：对统计识别识别方法的补充，统计识别法不能统计图像的结构信息，统计方法一般统计出来的图像特征都是以数值表示，结构识别法描述图像的特征时则是用符号来表示。

神经网络法优点是神经网络非线性拟合能力很好，可以映射图像的非线性关系；而且神经网络的学习能力强，也方便计算机实现；神经网络还具有很强的非线性映射能力，记忆能力以及自我学习能力。神经网络法的缺点是不能解释自己的推理过程和推理依据；神经网络需要大量的模板数据，并且个模板特征数据要近似相等，当数据不充分或各类别差别很大的时候，神经网络的识别就不太准确；神经网络的输入也是图像的数字特征，不能表示识别图像的结构关系，和统计识别法一样，当结构特征为主要特征时，图象的识别就不准确。

模糊集识别法的优点是模糊识别法虽表现为图像的不确定分类，但是随着更高可靠性的特征能使图像分类越来越准确；采用多级分类，能为下级分类提供分类信息。缺点是模糊识别不能准确确定图像的类别，如果不能找到跟准确的特征，图像的分类将不准确。

支持向量机（SVM）优点：1.对模板样本要求低，如果模板数量少，得到的分类结果是在现有模板信息下的最优解；2.支持向量机通过非线性变换将图像的特征转换到高维的特征空间，然后在高维空间构造线性函数替代原图像的非线性关系，更利于计算机去判别。缺点： SVM是通过二次规划来求解特征向量，里面涉及到m阶矩阵运算，对计算机要求高，并且运算时间长。

模版匹配法的优点是如果模板做的比较准确，匹配不正确的概率就会很小，并且模板不匹配的情况也很少。缺点是因为图像上的每一个点都要进行匹配计算，对计算机配置要求高，并且对噪声比较敏感，如果识别时有很大的噪声，将不利于图像的识别。

4 总结

本文深入分析了统计法、句法识别法、神经网络法、模糊集识别法、支持向量机法和模版匹配法等几种主要图像分类识别方法，并对各种分类识别方法的优势与缺陷做了深入的总结。通过分析各类图像分类识别方法，明确各类识别方法的优势与缺陷，为图像分类识别方法的具体应用奠定基础。

参考文献：

统计学的特征篇（8）

基于动态特征库的电子邮件分类系统框架如图1所示。主要的功能有数据采集、邮件预处理、文本分词、特征提取、特征向量库、相似度阈值比较、邮件分类器等。系统的一般流程为:首先对训练邮件进行分词和特征选取，利用处理之后的邮件对该系统进行特征规则的建立，将特征规则处理为特征向量的形式存入数据库;然后对测试邮件进行分词和特征选取，再利用相似性计算方法与特征向量库中的特征进行相似性比较，其中相似性度量采用向量之间的夹角余弦公式，超过某一个设定的数值(阈值)则对特征规则进行重新生成，调整特征向量库;若小于设定的数值(阈值)，直接送入分类器进行分类。对邮件进行分类，一般需要进行两个步骤:首先利用邮件样本建立分类模型，然后利用分类模型对测试邮件进行分类。由于电子邮件是一种非结构化的文本文件，包括邮件头和正文，所以在对邮件进行分类之前，先要进行邮件的预处理和特征提取。

1．1邮件预处理

邮件预处理就是把邮件内容处理成文本的形式，即去掉对邮件分类无用的结构信息，只提取邮件的主要信息组成文本文件。

1．2文本分词

文本分词是在文本词典的支持下，把一个邮件的文本切分为有意义的文本词条序列。对样本邮件文本切分后获得的所有词条，在通过特征选取后，将其中的一部分词作为对邮件进行分类的特征词，将这些分词作为邮件的特征词保存在特征词库中。本系统采用的分词算法是基于中科院计算所开发的汉语词法分析系统ICTCLAS(InstituteofComputingTechnolo-gy，ChineseLexicalAnalysisSystem)［7］，该系统采用基于N-最短路径的方法对中文文本进行无歧义文本粗切分，然后通过多层隐马尔可夫模型算法进行未登录词识别其分词正确率高达97．58%(最近的973专家组评测结果)，基于角色标注的未登录词识别能取得高于90%召回率，其中中国人名的识别召回率接近98%，分词和词性标注处理速度为31．5kB/s。

1．3特征选择及权重计算

一封待分类邮件的文本经切分后获得的所有词条通过“邮件分类器”，就可以得出该邮件的类属。在实际分类过程中，通过中科院研究的分词工具IC-TCLAS对邮件内容进行分词处理，并统计分词后邮件中出现的常用词及其频度，分别赋予一定的权重值，通过计算出来的权重值进行排序，并选取一定数量的常用词作为特征词加入到特征库中，在邮件分类器进行训练时，可以根据特征库里的特征实现对邮件的分类，并且在以后的使用中，可以提取邮件中出现次数较多的分词计算权重，加入到特征库中，并根据权重进行动态调整，以实现自动学习，自动适应的邮件分类效果。目前用于特征选取比较常用的方法有:词的同现信息［8］、基于文档频率(DocumentFrequen-cy，DF)的特征提取法、信息增益(InformationGain，IG)法［9］、x2统计量(CHI)法和互信息(MutualInfor-mation，MI)方法［10］等。通过对特征进行权重计算来衡量特征项在文档表示中的重要程度或者区分能力的强弱。常用的特征权重计算方法有:布尔权重、绝对词频、TF-IDF［11］(词频反比文本频率法)、熵权重等［12］。本文采用的是一种改进的TF-IDF权重计算方法［13］:Wik=tfik×idfik=tfik×log(N/mk+0．01)(1)其中，tfik———特征词Tk在文本Di中出现的次数;idfik———特征词Tk以及其它文本中与Tk语义相似的特征词在整个文集中的平均分布情况;N—文本集中文本的数目;mk———出现特征词Tk的文本数目与出现其它文本中与Tk语义相似特征词的文本数目之和的平均值。计算公式如下:mk=(nk+∑cj=1pj)/(c+1)(2)其中，nk———出现特征词Tk的文本数目;pj———出现其它文本中与Tk语义相似特征词的文本数目;c———与Tk语义相似的词语数量。

2文本分类器

对文档进行处理，需要将文档用向量空间模型(VectorSpaceModel，VSM)［14］表示，也就是转换为分类算法可以处理的形式，使文档转化为机器学习算法所需的特征向量。本文使用数据挖掘软件WEKA［15］中几种常用的算法来对本邮件系统进行分类仿真，通过综合比较各种算法的仿真结果，验证本系统的可行性。WEKA的全名是怀卡托智能分析环境(WaikatoEnvironmentforKnowledgeAnalysis)，是一款免费的、非商业化的、基于Java环境下开源的机器学习(ma-chinelearning)以及数据挖掘(datamining)软件。WEKA作为一个公开的数据挖掘工作平台，集合了大量能承担数据挖掘任务的机器学习算法，包括对数据进行预处理、分类、回归、聚类、关联规则以及在新的交互式界面上的可视化。开发者可使用Java语言，在WEKA的架构上开发出更多的数据挖掘算法。

3仿真实验及分析

统计学的特征篇（9）

【中图分类号】R735.7 【文献标识码】A 【文章编号】1672-8602（2015）03-0018-01

原发性肝癌是肝细胞或者肝内胆管上皮细胞的恶性肿瘤，在致死性恶性肿瘤中位于第5位。CT是各种影像学检查中能够比较准确反映肝脏病理形态的一种检测方法[1]。弥散性和非弥散性肝脏疾病主要的诊断学区分特征是正常组织是否被破坏，在CT图像上主要体现为图像纹理的变化，而根据不同CT图像纹理特征差异，能够通过计算机进行原发性肝癌和正常肝组织的识别与分析，对于我国肝癌患者数量众多，诊断工作繁重的现状来说，实现计算机诊断是有着重要意义的。本次研究以我院在2008年3月-2013年3月间收治的40例确诊为原发性肝癌患者的CT图像和40例确诊正常肝CT图像为研究对象，对原发性肝癌CT图像纹理进行了研究。

1 资料与方法

1.1 一般资料

选择我院在2008年3月-2013年3月间收治得30例确诊为原发性肝癌患者的CT图像和30例确诊正常肝CT图像为研究样本，全部样本在年龄、受教育程度等方面差异无统计学意义（P>0.05）。

1.2 方法

将选择的80个样本图像采集并存储在计算机上，选择图像兴趣区。由经验丰富的医师指导，选取80个20*20的兴趣区，40个为正常肝，40个属于原发性肝癌。

1.2.1 纹理特征提取

选用一阶统计特征、灰度共生矩阵、灰度行程矩阵三种提取策略提取纹理特征[2]。

1.2.2 特征选择

不是每个特征都能够用于样本图样区分，对于某个特定特征，两个样本差异显著才可记为有效特征，否则为冗余特征。

采用t检验时，首先选择两类类性特征样本值，此时两类特征值方差不等并且未知，建立基本假设：

H0：：μ=μ1-μ2≠0

H1：μ=μ1-μ2≠0

进行t检验，H0成立时可获得统计量。

1.2.3 神经网络识别

采用BP神经网络进行正常肝和原发性肝癌分类，输入层、隐含层和输出层组成分类器，输入层中包含和有效特征数目相等的输入神经元，隐含层有十个，输出层有一个。设置收敛判断值为0.0001，训练步数最大200，如果训练数据和网络输出误差平方低于这两个限度，可认为网络收敛[3]。

1.3统计学处理

在本次研究中采用统计学软件SPSS20.0 对统计的数据进行处理，计量资料采用t检验，计数的资料采用χ2检验，以（P

2 结果

2.1 统计特征

采用上述图像问题采样算法，每个兴趣区都采集28个特征问题，通过t检验选择有效特征，显著性差异水平取0.05，一阶统计特征有15个特征差异显著，其余为冗余特征。特征数目量较大，不便直接列取，为了校验t检验特征值是否准确，在有效特征中选择一阶矩、和困之和冗余特征熵，观察不同特征在不同性质图像上统计分布差异，如表2-1：

一阶矩、和均质在正常肝和原发性肝癌中的差异有统计学意义（P

2.2 神经网络识别

在神经网络分类器中输入经过t检验选择的特征向量，使用MATLAB神经网络工具箱进行分析计算和函数仿真模拟。不同特征量物理意义不同，有着各自的动态范围，这种特征有着明显的不可比性，分类前需要对特征值进行归一化处理，特征值取上限，μ取下限做归一化处理，调整到[0，1]之间：

方案A的识别率达到了100%，但是方案A的全部样本即是训练集又是测试集，样本识别结果失去了客观性，方案B对原发性肝癌的识别率达到了93.45±5.33%，说明应用方案B的神经网络分析方法对肝脏CT图像有着很高识别率，这是符合模式辨识理论规律的，对于未学习过的样本需要根据已学习样本训练结果进行推理，识别率虽然有所下降，但是结果有着较好客观性。

3 讨论

原发性肝癌是世界范围内致死率第五的恶性肿瘤，我国的发病率也很高，严重威胁了患者的生命健康，我国肝癌患者众多，给诊断和普查工作带来了很大困难，长期以来，使用计算机进行肝癌CT图像纹理分析还缺乏高效准确的算法，成为实现原发性肝癌CT图像的计算机辅助诊断的主要技术难题[4]。本次研究选择了一阶统计、灰度共生矩阵和灰度差分矩阵图像纹理取样算法，提高了样本采集的代表性：

①一阶统计特征

是图像灰度的一阶概率分布，是一种比较基本的纹理特征描述。

P（I）=灰度级为1的像素数/区域内总像素数（1-1）

②灰度共生矩阵

通过估计图像二阶组合条件概率密度函数提取特征。描述四个方向上距离为d的一对象元具有灰度i和j的概率，每个元素都有距离、角度、灰度值和概率4个特征值，通过灰度共生矩阵能够计取对比度、相关系数、和方差等共13个特征量，从每个兴趣区中都能够提取13个特征值。

③灰度行程矩阵

是连续、共线，灰度级相同的像素点，通过某个既定图像能够计算获得灰度游程矩阵，表示四个方向上灰度g，长度d灰度串出现的总次数，能够提取短行程优势、长形成优势、灰度不均匀度度量以及行程总数百分率等参数量。

同时应用了神经网络进行原发性肝癌识别，经过两种方案分析准确率的比较，证明1/3样本作为测试样本，2/3作为训练样本的分析方式对原发性肝癌的检出率为93.45±5.33%，说明基于神经网络的原发性肝癌CT图像计算机辅助诊断有着理想的识别能力，有着很高的临床推广价值。

参考文献

[1] 郭堑，农村立，等.图像纹理分析技术在肝纤维化CT图像分析中的应用研究进展[J].实用肝脏病杂质，2009，12（3）：229-230.

统计学的特征篇（10）

DOIDOI：10.11907/rjdk.162058

中图分类号：TP319

文献标识码：A 文章编号文章编号：16727800（2016）011007105

0 引言

社会经济的繁荣促进了民航行业的快速发展，客运量的增加使得托运行李箱的数量也急剧增加，如何有效管理和监控众多行李箱成为各航空公司亟需解决的问题。目前，不正常行李的查找主要依靠对行李箱上所挂条形码进行扫描记录。然而针对一些特殊情况，如条形码丢失、条形码错误等，这种传统的查找方式就无法发挥作用。此时，行李箱的外观特征就成为了找寻不正常行李箱的主要依据。因此有必要将研究方向转移到行李箱的图像内容上，即通过行李箱图像本身的内容如颜色等特征进行检索，输入相似行李箱图像之后，在监控系统中查找对应行李箱的视频截图或与存储在行李库房中的无人认领行李作比对，从而跟踪其去向，完成管理和查找操作。

1 图像特征提取

基于颜色特征的行李箱检索系统，是基于内容的图像检索系统的一种，即通过分析研究图像包含的颜色信息，通过一定的特征方法进行表示，然后设计匹配算法进行相似度匹配的检索系统。只有首先准确地将图像信息提取出来，再设计出精确的匹配算法，才能实现预期的效果。由此可见，图像特征提取算法是本文基于颜色特征的行李箱检索系统的核心技术。

1.1 颜色特征模型

RGB模型是计算机中最常用的颜色模型，由于其简单并且与人眼的结构特性密切相关，所以是目前使用最为广泛的颜色模型[1]。根据人眼的结构特点，所有颜色都可以看作是3个基本颜色即红、绿、蓝的组合。为了建立标准，1931年国际照明委员会（CIE）规定了700nm、546.1nm、435.8nm为红、绿、蓝这3种颜色的标准波长。以 r、g、b 3个参数为三坐标，可以得到如图1所示的一个单位立方体结构描述的RGB 颜色模型（彩图见封三，下同）。

本系统充分利用RGB颜色模型的特点，使用其作为本系统的特征提取模型。

1.2 特征表述方法

对于一副图像，若要得到它所包含的颜色特征，首先要采集它的信息，然后用适当的方法进行表示，颜色特征表示对检索结果有很大的影响。本系统采用循环方式，逐步采集图像每一个点的R、G、B值，然后对R[0]～R[255]，G[0]～G[255]和B[0]～B[255]的点的个数进行统计，再采用适当算法来表示这些统计信息，主要有以下3种方法：统计直方图、累计直方图和分块统计。

1.2.1 统计直方图

图像特征的统计直方图[2]是一个1-D的离散函数，它用来表示一副图像之中，拥有某种特征值的点在整幅图像中所占的比例，很显然所有比例之和应为1。以H向量为例，即有式（1）：

H（k）=nkNk=0，1，255（1）

其中，nk代表具有特征值k的点的个数，N为这幅图像的点的个数。如图2所示，（a）是图像原图，（b）是它所对应的统计直方图。

1.2.2 累计直方图图像特征的累计直方图[2]也是一个1-D的离散函数，表示到这个特征为止的之前所有向量占总数的比例。同样以H向量为例，很显然，H（255）= 1即有式（2）：

式中符号与上文统计直方图公式中的含义一致，图3即为红色行李箱图像特征的累计直方图。

1.2.3 分块统计图像的分块统计方法是在上述两种方法基础上的改进，基于颜色内容的图像检索虽然有较强的抵御旋转、尺寸变换的鲁棒性[3]，但是对于图像色彩的空间分布表示却很差，经常会出现图像的直方图相似而空间分布差别很大的情况，如图4中（a）横向图和（b）交叉图的直方图完全一样而实际图像本身却差别很大。

针对这种情况，研究者提出了分块统计的概念，原理是将一幅图像先进行分割，然后分别统计每一块的直方图进行对比分析，至于如何分块以及每一块赋予的权重，还需特别计算。通过分块统计，一定程度上解决了颜色特征对于空间分布的不足，但是不能从根本上解决问题，这是颜色特征本身的缺陷。

统计直方图比较适合颜色块单一的图像，相比之下，累计直方图则更适合于真彩图像[4]，分块统计弥补了颜色空间分布难以描述的缺点。由于时间有限，本文仅实现了统计直方图和累计直方图两种方法，分块统计是今后研究的方向。

2 特征匹配算法

基于文本的检索方法是通过对文本进行匹配来判断是否相似，而基于内容的图像检索则是通过计算示例图像和数据库中图像在图像特征上的相似度进行判断[5]。目前广泛使用的是对图像特征进行数字化，即用数字表示一幅图像的特征。通过数学公式设计匹配算法，计算出两者之间的距离作为衡量图像特征的相似度。本文在参考前人研究的基础上，实现了以下几种较为经典的匹配算法。

2.1 Hausdorff距离算法

Hausdorff距离的作用是度量模板和目标图像之间边缘的匹配程度。

设两个有限点集A={a1，a2，...，ap}和B={b1，b2，...，bq}，其中p和q分别为点集A与点集B的元素个数。则A、B间的Hausdorff 距离H（A，B）定义如式（3）所示：

2.2 欧氏距离算法

用HQ（k）表示关键图的颜色特征直方图，HD（k）表示已经存储的数据库图像D的颜色特征直方图，则两幅图像之间的匹配值P（Q，D）用欧氏距离方法来计算[5]如式（6）所示：

2.3 加权的欧氏距离

用HQ（k）表示关键图的颜色特征直方图，HD（k）表示已经存储的数据库图像D的颜色特征直方图，则两图像之间的匹配值P（Q，D）用加权的欧氏距离方法来计算如式（7）所示：

2.4 直方图相交法

用HQ（k）表示关键图的颜色特征统计直方图，HD（k）表示已经存储的数据库图像D的颜色特征统计直方图，则两图像之间的匹配值P（Q，D）用直方图相交的方法来计算如式（8）所示：

2.5 绝对值法

用HQ（k）表示关键图的颜色特征直方图，HD（k）表示已经存储的数据库图像D的颜色特征直方图，则两图像之间的匹配值P（Q，D）用绝对值的方法来计算用式（9）所示：

以上几种匹配算法中：Hausdorff用于计算两幅图像边缘之间的距离；欧氏距离计算量大，但是精度较高；加权的欧氏距离适合于颜色丰富的真彩图像，因为当颜色比较单一时，很多为0的点都被赋值为1，这样就与原图像的特征差距很大，如果采用归一化直方图，则Wk

3 系统详细设计

3.1 系统详细结构

系统功能分为3个主要模块，分别为图库管理模块、图像匹配模块和图像存储模块。除了主要模块以外，还设计了中间输出模块、时间统计模块等辅助功能。系统流程如图5所示。

3.2 主要模块实现

3.2.1 图库管理模块设计

图库管理模块提供用户对图像库的操作，包含以下操作：添加新的图像库、修改即有图像库、删除现有图像库、将图像库设置为默认检索的库、将新的图像添加到既有图像库。

本系统实现了上述几种功能，通过自定义的PicDb表来实现管理，图6为“菜单―设置”里面的图库管理。

3.2.2 图像匹配模块

在本系统的设计过程中，考虑到对于真彩图像的检索匹配，特别设计两种不同方式，即可以将所有图像的R、G、B值相加为一个通道进行匹配对比，也可以分别对R、G、B 3个通道进行匹配分析。前者在处理一些较为简单的彩色图像时效果较好，计算量少、耗费时间较短；如果采用后者，匹配精度会提高，但同时大大增加计算量[6]。该选项在用户界面上有所设计，供用户选择。

3.2.3 图像存储模块设计

由于对图像特征的提取和匹配往往涉及大规模的点阵运算，期间耗费较多时间，这往往是用户所不能容忍的，所以应当添加数据库模块以减少时间。本文将重点探讨图像特征的提取技术和存储技术。

本系统设计的数据库模块用来存储库中的图像信息，并非直接存储图像文件，而是将分析过的图像特征值及其所在的路径等相关信息存入数据库。程序启动时，会读取数据库中的用户设置，根据用户设置，系统可以找到默认的图像库，图像库里存储着该图像库中图像的所有信息，包括图像的路径、名称、特征等。随后系统根据图像库中的路径找到此图像库里面所有图像的特征值，通过解压缩函数将信息还原成文中定义的节点结构，直接读取进行匹配，从而节省了大量分析时间。

在存取图像特征时，本文将特定数据结构压缩为字符串格式存储在数据库中，其中的协议由作者自定义，协议采用“#”字符分隔通道之间的数据值，在存储阶段进行打包，读取出来之后解包赋值。经过系统测试发现，在压缩和解压缩图像特征时的用时占很小比例，而真正耗费时间的为颜色特征的提取和特征匹配阶段，因而在实际运行时达到了预期效果。数据库中存取图像特征的表是PicFeature，结构如表2所示。

通过DBOperate的一系列函数，系统可以很方便地实现对数据库的操作，从而为系统运行提供了很大帮助，节省了大量时间。

4 实验结果分析

4.1 性能评价标准

基于颜色特征的行李箱检索系统的性能可以通过查询的准确率来判断，包括查全率和查准率[7]。本文将基于这两种标准对系统进行评价，如式（10）、式（11）描述。式中PR为查全率，P

4.2 系统测试

本系统的检索图库包含50张不同颜色的行李箱图像，按颜色分为5类，每类10幅图像。实验测试阶段综合使用各种图像特征表示方法和匹配算法，得出系统对于不同图库的查全率和查准率。本文以蓝色行李箱为例，测试效果如图8所示。

统计不同颜色行李箱的查全率和查准率，测试结果如表3所示。

通过上表发现，各色行李箱的查全率和查准率均在70%以上，即针对一般查询具有较好效果，未来可以在继续提高查全率和查准率的基础上进一步优化算法。

5 结语

本文针对民航不正常行李箱的管理查找问题，提出了使用基于颜色特征的行李箱检索系统的解决方案。对基于内容的图像检索技术进行了研究和探讨，在分析目前一些基于图像颜色特征的检索算法的基础上，重点分析了算法的优点和不足，实现了一个基于颜色特征的行李箱检索系统。本文对所实现的不同算法进行了实现和测试比较，实验结果证明该系统功能全面、操作简单、查询效果较好，可在实际中进行推广应用。

参考文献：

[1] 王娟，孔兵，贾巧丽.基于颜色特征的图像检索技术[J].计算机系统应用，2011，20（7）：160164.

[2] 刘德龙.基于颜色特征的图像检索系统设计与实现[D].武汉：华中师范大学，2007.

[3] 黄仁，胡敏.综合颜色空间特征和纹理特征的图像检索[J].计算机科学，2014，41（6A）：118121.

[4] 董蕊，王志巍，刘淑娟，等.基于统计直方图的单幅图像去雾算法[J].计算机应用与软件，2016，33（5）：196199.

上一篇: 预算会计记账方法下一篇: 资产证券化的内涵