数据信息论文汇总十篇

时间：2023-03-25 10:26:58

数据信息论文

数据信息论文篇（1）

医院病案记载着各个时间段的患者诊疗状况以及疾病演变状况，其中关键的病案信息包含患者家族史、患者本身的病史、医院诊疗过程、病情检查与病情诊断得出的报告等。

由此可见，医院病案信息牵涉各项日常的医院业务，有关部门对此有必要予以全方位的信息审核、信息收集以及档案存储。但从现状来看，当前仍有某些医院并没能全面关注综合性的病案信息管理，而与之有关的病案管理措施也没能真正实现健全。在此前提下，医院应当尝试在现阶段的病案管理中全面使用大数据模式，以此来全面保障病案信息管理的成效性。

医院对于病案信息管理运用大数据手段的重要意义

第一是提升医院当前利用各类病案信息的整体水准。大数据手段在客观上有助于实现多层次的数据与信息整合，从而显著提升了利用医院病案的水准。医院在全面集成当前现有的病案信息基础上，应当能够妥善划分各项相应的患者信息，确保将其分成收费信息、患者检查信息、患者诊疗信息、门诊信息、报告与检验信息等。在划分上述各类信息以后，运用大数据手段还能创建针对各个患者的识别身份编码，以便于实现多层次的信息关联集成。

第二是全面支撑医疗决策。医院由于具备了大数据手段作为管理病案信息的必要辅助，因此针对实时性的病案信息都能着眼于精确进行搜集。在决策系统的全面支撑下，有关科室就能全面明晰现阶段的患者病情种类、院内患者分布与其他相关要素。相比于传统模式，大数据手段更加有助于汇总信息以及统计信息，对于某些潜在误差也能予以彻底杜绝。除此以外，医院针对当前入院的各科室危重患者应当予以侧重关注，以便于提供日常各项医疗决策必需的信息支撑。

第三是拉近护患关系并且突显以患者为本的宗旨。在集成病案信息的基础上，医护人员针对当前阶段的各项患者信息都能予以全方位的精确掌握，上述措施有助于增强现有的患者满意度，拉近护患关系。例如近些年来，患者已经能够凭借电脑或者手机等工具来随时查找个人诊疗信息，对于实时性的自身健康状态也能全面加以了解。在某些情形下，患者一旦表现为某些危重病情，临床医师对其就要及时进行处理，全面保障患者健康并且提升患者生活水准。

医院当前病案信息管理现状

目前各地已有较多医院正在尝试引进病案信息的大数据管理模式，并且逐步将大数据手段渗透于管理医院病案信息的各个流程中。但是不应忽视，各地医院在现阶段仍然表现为相对较低的病案管理综合水准。探究其中根源，就在于医院及其有关部门针对病案管理仍然欠缺必要的关注度，同时也没能着眼于引进大数据手段作为其中必要的辅助与支撑。

此外，多數医院并没能设置独立性的病案管理专门科室，医院现存的病案管理部门体现为较强的附属性特征。作为管理医院病案信息的专门人员来讲，上述人员本身应当具备优良的病案管理水准。与此同时，上述人员也要掌握涉及到大数据的有关常识，并且将其灵活适用于当前的医院病案管理。但是截至目前，负责管理医院病案信息的专门人员仍然表现为滞后性的专业素养，甚至没能熟悉日常性的病案信息汇总、信息分析以及信息处理操作。除此以外，医院部门针对此类管理人员也没能给予专门性的管理技能培训，甚至聘用某些兼职人员代替专职性的病案管理人员。

探求改进举措

增设专门的病案信息管理机构

医院如果要着眼于优化病案管理的综合效果，那么关键在于设置专门的病案管理部门，有关领导对此也要引发更多的关注。近些年以来，各地医院都在致力于建成病案管理的专门委员会，在此前提下助推信息化的医院建设。与此同时，医院还需结合自身的真实状况来增设病案信息的新科室，确保该科室在整个医院体系内占据独立的位置并且拥有独立职能。

通过运用上述的改进举措，病案管理机构就能全面突显其具备的价值与意义，确保该科室能够覆盖于医院临床管理、制定病案管理规划以及收集病案信息等领域。每隔相应的时间段，管理委员会针对当前的医院病案信息要予以全方位的归纳汇总，此举措有助于保障病案管理能够达到的综合水准。

运用信息化手段来辅助管理

在目前阶段中，各地医院已经能够凭借信息化技术来显著增强病案管理的实效性，在这其中包含自动式的条码识别、微缩光盘技术、数字化的病案管理与其他相关技术。医院通过灵活使用上述大数据手段，就能够着眼于挖掘深层次的患者病案信息，确保现有的病案信息符合准确性与真实性的基本要求。近些年各地医院都在致力于创建资源共享的病案管理网络，在此前提下诞生了新型的电子病案。此外，医院在存储各类患者病案时，也能够借助大数据手段予以完成。这是由于运用电子化存储的方式有助于在线查询各项病案信息，从而服务于现阶段的临床治疗优化与完善。针对出院后的患者来讲，运用大数据手段就能打印并且查询患者现有的各项病历信息。数字化管理应当能够覆盖于医院当前的各项日常管理工作，此项举措在根本上保障了病案信息共享，同时也便于利用与存储病案信息。

全面提升人员素养

从目前现状来看，各地医院针对自身保存的患者病案都给予了更多关注，同时也认识到了病案具备的价值。在此基础上，作为管理医院病案的专门人员而言，应当全面提升自身具备的综合素养，针对医学统计学、外语、计算机与其他学科的有关知识都要予以相应的掌握。

因此可见，病案管理人员是否拥有优良的专业素养，在根本上关乎病案信息管理的整体效果。病案信息管理牵涉多领域以及多层次的学科与专业，因此作为管理人员而言，上述人员应当能够精确检索各项信息，以便于实现全方位的信息获取。在此前提下，医院针对各类临床信息应当予以全方位的传递，确保病案信息能够体现其应有的临床价值、科研教学价值以及其他价值。在目前阶段中，医院针对原有的病案管理思路应当予以相应转变，确保将病案管理的侧重点全面落实于分析收集以及汇总各类病案信息。

结束语

医院病案信息在医院现有的管理系统中占据了重要位置，这是由于病案信息记载着全过程的医疗信息。与此同时，医院如果要给出相应的医疗决策，那么也必须凭借病案信息予以完成。

截至目前，医院及其有关部门正在逐步意识到医院病案管理与大数据手段相互融合的必要性，对于医院当前的各项管理举措也能够予以相应的优化。因此在病案信息管理的有关实践中，医院针对信息化手段有必要着眼于灵活加以运用，在此前提下服务于病案信息管理实效性的提升。

信息管理毕业论文范文模板(二)：信息管理到知识管理过程中档案价值重新发现论文

【摘要】基于信息与知识、信息管理与知识管理之间的关系，分析在知识管理过程中档案价值的新特征。档案价值的实现主要是通过将其主体与客体之间的关系显现化，通过知识管理对档案信息进一步挖掘使档案更好地实现其应有的价值。

【关键词】信息管理；知识管理；价值特征

一、信息管理到知识管理

对于知识管理与信息管理之间的关系，我们可以从信息与知识之间的关系入手。有关知识与信息之间的关系有很多种观点。一种观点持有者们认为，信息存在于自然环境、人类社交活动以及人们思维之中，而知识的存在局限在人们的社交活动范围之中，因而信息包涵了知识。另一种观点持有者认为，信息是可编码化的知识或显性可视的知识，而知识除了显性之外，还包涵隐性知识，即存在于人类大脑之中、不可编码化的知识，因而知识包涵了信息。对于以上两方观点，有学者认为，从本质上来说，信息是一种具有物质属性并以物质存在的方式反映呈现给大众，这种物象化及其存在方式可以广泛地包含人类活动及其成果。而知识是人们对这种反映的一种主观性的认识结果，是一种智力成果。因而，就信息与知识两者之间的关系而言，信息是具有知识属性的，并以知识成果作为其具体的表现形式。知识管理这一概念最早是在企业管理中被提出来的，知识管理的概念可能会因为其所涉及的学科领域的差异而存在各种不同的版本，但是知识管理的目标大抵是相同的，即知识管理想要实现的是在最恰当的时间将信息传递给最需要的人，以便于此人可以利用这一信息做出最恰当的决策并付诸实践活动。然而档案又是如何与知识管理存在联系的呢？档案根据其定义我们可以了解到，其最明显的特征为原始记录性。档案的这种原始记录性的特征奠定了档案不可动摇的地位，也是将档案区别于图书、信息等的重要凭证。因此档案凭借其固有的原始记录性的根本属性无可厚非的可称其是信息的最根本来源。知识是我们依靠自身主观能动性对信息进行筛选的结果，故档案也可以称为是知识的源头。

二、知识管理的档案价值

当今由于知识管理层次的不断深入，档案的使用价值呈现出来了新特征，因此对于知识管理中档案价值的重新发现，笔者认为是必要的。知识可以分为显性知识与隐性知识。档案是一种直接呈现在人们眼前的显性知识，是知识的来源，因此档案也是知识管理的核心部分。

（一）从理论基础角度分析。理論基础角度主要可以从档案后保管范式与档案双元价值理论两个方面。档案后保管范式包括新来源观、宏观价值鉴定论、知识服务三个方面。1.新来源观。新来源观就是对于文件的来源问题进行一种全新的认识，传统意义上，我们是在文件转化为档案之后才开始对档案进行管理，而新来源观理论则强调对于文件的管理工作应该从文件形成之初就着手开始进行，从开始形成时就开始对其管理，即强调的是一种“前端控制”“全过程管理”，通过这种管理方式可以方便人们从文件形成之初的背景，文件形成过程的结构层次以及文件未来可能会涉及的研究发展的方向进行全面系统的管理。2.宏观价值鉴定论。宏观价值鉴定论强调的是对于档案价值的鉴定我们不能仅仅局限于对其本身形成部门、机关所产生的价值作用上来判断是否对其进行保存，而应将价值的鉴定提升到对整个社会层级上来。使更广大的人群可以受益，进而实现档案的第二价值，这也正是谢伦伯格所强调的档案双元价值理论中的第二价值。3.知识服务。知识服务顾名思义主，要是将档案信息上升为知识层次对其进行管理，这一理论主要表现在传统档案保管员身份的变化上，可以说档案保管员的工作并非只局限于对档案的排列、档案、上架等一些基础性的工作。在知识服务中档案保管员的工作主要是将档案中的文字信息加工、提炼出有价值的部分，对这些有价值的部分进行整理，使有价值的信息可以提供给人们利用，即提高了档案信息的质量，也节省了档案利用者筛选档案的时间。以上就是档案后保管范式中所包括的三个方面的基本内容，档案后保管范式是在电子文件不断产生的背景下提出来的，将档案价值鉴定工作与知识服务有机结合起来，从而肯定了档案价值在知识管理中的地位。4.档案双元价值理论主要指档案的工具价值与档案的信息价值。工具价值所指的就是档案产生之初所赋予的价值。正如一个事物的产生是有其原因的，并能在其产生的基础上发挥其应有的价值，为社会提供利用服务。信息价值主要是依据信息接收者，即知识主题与知识客体之间的关系而形成的一种价值关系。这种价值的实现是需要一定的载体对信息进行传递实现的。知识主体的不同对知识的需求自然就会不尽相同。主体带着目的和需求查询接受信息，并且由于每个人的知识素养，知识储备的不同，对同一信息的理解也是大相径庭的。正如每个人读研究生的目的是不同，每个人的人生经历也是不同的，所以对待同样的问题我们会有自己的想法，我们会根据自身的经验分析理解所获取的信息。

（二）从实际理论角度分析。实践基础主要表现在公共档案管提供利用的层面上，主要包括知识获取、知识管理与知识服务三个方面。1.知识获取是实践的前提保障工作。正所谓没有原材料我们就无法进行生产加工一样。所以要想使公共档案真正体现价值，首先我们需要获取到一定的知识。知识管理权主要指的不再是对纸质文件的有序化整理过程，而是对文件上所反映出来的知识内容进行整理加工，对文件上面的信息进行分析，挖掘出更有价值的部分，对其进行管理。2.知识服务体现在政府信息公开这一层面上，档案馆作为政府信息公开查询的场所，具有提供知识服务的合法地位，同时主动提供信息查询等方面的服务也是其应当履行的义务，满足公众的需求是其应当做的。同样也是公共档案管发展的动力所在。在知识服务提供利用方面，公共档案馆可以借鉴公共图书馆的成功措施，如举办展览，提供远程服务，提供电子化检索平台等等。公共档案馆通过提供新的利用服务方式可以吸引更多的公众，进而实现其公共服务的价值。

三、知识管理中档案价值实现的特征

传统档案管理活动中只有有价值的文件才可以转换成档案进行管理、保存。而在知识管理活动过程中，档案的价值与使用价值时同等重要的。档案的价值主要体现在隐性知识层面，档案的使用价值主要体现在显性知识层面。因此对于知识管理中档案的这种价值与实用价值并重的条件下，档案价值也呈现出了新的特征。

（一）集成化与灵活性。传统的档案价值体现在主题对客体的需要，对主体需要的档案进行归档保存以实现其价值。而知识管理中更加注重的则是知识，并且这一管理从文件形成之初就需要开始着手进行了，体现在外在内在结合的全过程中，在整个过程中因可能涉及的不同人提出的不同要求，故灵活性也是必不可少的。

（二）多元化与共享性。公众对于档案的利用可能是间接的，而公众对于知识的获取则不同，这是一种主动性的活动。正如约翰奈斯比特曾经提到的“我们淹没在信心之中，但我们仍处于知识的饥渴中”。作为知识个体的人因其自身处于不断发展中，所以人作为知识个体是渴望获得知识的。知识管理的过程中则强调的是，将档案中的知识以一种共享的方式传播开来，呈现在公众面前，以便于公众根据自身的需要获取知识。这种共享性是多元化的，可以是一对一、一对多、多对一、多对多的方式。正如我们需要完成一项工作可能一份文件就包括了我们所需要获取的全部信息，也有可能我们需要通过搜集不同文件中的部分信息，进行整合后的信息才是我们真正需要的。个体的需求可能是单一的也可以是多元化的。

（三）显性化与增值型。知识管理需要的是主体通过交流的方式将隐形的知识显性化，知识管理中侧重于人力资源管理、成本投入管理、技术管理三个方面，这三点主要是依据企业知识管理所提出的。而当前就档案而言为了实现档案的价值应更加趋于主动性。主动性主要指主动提供服务，知识管理重视的是个体之间，个体与组织之间的知识共享过程，进一步促进知识创新以实现档案信息的增值型。

四、档案价值在知识链中的体现

（一）知识获取。知识获取包括信息采集與信息创造两个方面。采集的过程我们强调的是对于信息的获取要注重其完整性与信息的可靠性。创造则更加侧重于，将隐形信息显性化的过程。档案室信息是一种外在存在形式，因此可以说档案室信息的承载体，也就是知识获取的主要来源，对于有价值的信息获取应该对其加以记录以便日后更多人利用。

（二）知识开发。知识开发的过程是对信息进行分析，加工，处理，存储整合的过程。使信息有序化、体系化。这种信息开发的过程要遵守信息本身的客观性原则，知识开发者不可以根据个人的主观意识对信息进行任意的更改，要保持信息的原貌。知识开发就是档案工具价值和信息价值转换的过程。

（三）知识利用。知识获取与知识开发的过程都是为了知识最终能被有效地利用，利用过程中的个人与组织之间的信息传播、信心交流、信息之间的转移，到最后的信息共享过程都是档案价值实现的体现。

数据信息论文篇（2）

Abstract：DataisveryimportantforLandInformationSystem，AkeytoLandinformationthesystem''''sdevelopmentssuccessiswhetherthedataquantityisaccuracy.ThispaperwillStudythedataquantitytheprobleminLandinformationthesystemestablishtheprocess.

Keywords：LandInformationSystems；DataQuality；Error；Accuracy；RemoteSensing；Digitize；Resolution；CoordinateTransformation；VectorData；RasterData；Topological.

一、前言

土地是人类的宝贵财富，是人类社会进行物质生产所必需的基本条件和自然基础。如何科学、合理地利用有限的土地资源，如何及时了解与掌握土地利用变化数量和空间特点，对于保持耕地总量动态平衡和土地持续利用具有十分重要的意义。

随着社会经济的日趋多样化，土地部门的业务工作及范围也在不断扩大，原有的靠手工操作，图纸管理的模式已经越来越不能满足高效率的需求。为强化土地管理,满足社会对土地资源信息更多、更细、更完善的服务要求，各土地管理部门纷纷加入信息化、数字化的改革大潮。特别是在市场经济条件下，因土地管理部门工作的严肃性、准确性、科学性和规范化要求，管理中任何规定的确定和变更都需要完成大量的信息收集、分析、综合、决策和评估等工作，土地管理也只有强有力的信息技术（IT）的支持下，才能做到真正的科学决策和管理。

土地信息系统（LIS）是地理信息系统的一个分支，是一种基于宗地[以宗地（地块）为单位]的计算机管理信息系统。是一种利用计算机技术及其属性数据进行采集、处理、管理、查询、分析、应用和维护更新的空间信息系统，是土地管理的现代化工具，是土地规划和管理定量化、科学化的方法、手段。但是，在土地信息系统的建设过程中，还存在许多问题，给土地信息系统的建设及发挥带来一定困难。这里仅对土地信息系统建设中的数据质量问题进行探讨。

二、对LIS数据质量的认识

数据是一种未经加工的原始资料，是客观对象的表示，它可以是数字、文字、符号、图像，数据是信息的具体表达形式。一个LIS系统包括空间数据、属性数据、空间数据之间的关系以及空间数据与属性数据之间的关联。

人们往往以为计算机为基础的信息系统的数据质量是可靠的，很少怀疑利用信息系统产生的分析结果在数据质量方面会有问题，但事实远非如此。在某些情况下，由于多种原因，计算机分析的结果甚至会比手工分析的误差更大。这里除软件、硬件的质量问题，计算方法上的问题，以及分类、编码、输入、操作的明显疏忽外，数据本身的质量是重要的原因。

众所周知，数据是LIS的“血液”，是组成系统的重要元素。数据质量的好坏是土地信息系统成功与否的关键所在；数据质量的高低优劣，都直接影响到土地信息系统的经济效益和社会效益，决定了系统应用价值的大小；数据的可靠，质量的好坏将直接影响到整个系统的成败。系统如果不能提供正确、可靠的信息，这个系统也就失去了存在的价值。

数据质量的好坏是一个相对概念，并具有一定的针对性。衡量其好坏主要有以下几个指标：误差、数据的准确度、数据的精度和不确定性[1]。数据质量是数据整体性能的综合体现。

统而言之，数据的质量问题主要表现在两个方面：一是数据是否及时反映了现实世界；二是数据是否保持了一致性和完整性。

土地信息系统的数据量大，数据来源广，数据采集的任务重，在数据库建立过程中会出现许多人为和系统的误差，甚至还有可能产生数据错误，最后采集的数据无法准确反映规划和管理的实际状况，建立在此数据库基础上的系统往往也就达不到管理自动化辅助决策的目的，而只不过是“看看而已”的一种“摆设”罢了。

数据库（包括空间数据库和非空间数据库）是土地信息系统最基本、最重要的组成部分，也是投资比重最大的部分。数据质量的好坏，直接影响系统的功能和应用。不仅要根据技术规程衡量数据质量，还要从数据使用角度分析数据质量问题。数据质量通常是指数据的可靠性和精度，它主要用数据的误差来度量的。现就土地信息系统建立过程中的数据质量问题作进一步的探讨。

三、数据源质量的问题

土地信息系统的数据源指建库中所需要的各种数据类型的来源。它是土地信息系统最基本、最重要的组成部份。土地信息系统的数据源多种多样，主要包括有：地图，地图是系统最主要的数据源，因为地图是地理数据的传统描述形式，是具有共同参考坐标系统的点、线、面的二维平面形式的表示，内容丰富，图上实体间的空间关系直观，而且实体的类别和属性可以用各种不同的符号加以识别和表示。土地信息系统其图形数据大部分都来自地图，土地信息系统的属性数据主要有地籍图、宗地图、土地详查图、土地利用现状图、行政区划图、专题图、乃至地形图等各种图件的矢量化地图数据。二是遥感影像数据,遥感影像数据是一个极其重要的信息源。通过遥感影像可以快速、准确地获得大面积的、综合的各种专题信息，航天遥感影像还可以取得周期性的资料，这些都为土地信息系统提供了丰富的信息。三是统计数据，包括土地的分类、面积、权属、分布及质量、等级状况、利用状况、非法占地等统计资料。四是实测数据，包括GPS点位数据、地籍测量数据等。五是数字数据，包括数字图形数据和属性数据。数字数据主要有地籍号、档案卷宗号、地类号、图号、手簿号、宗地界址点点号及坐标控制点坐标，宗地面积，面积中误差、年代、日期等等。属性数据包括图形、图像以外的各种文字、数字信息。其中文字信息主要是与宗地档案，文件档案组成相关的各种检索和查询信息(如：土地权利人姓名或单位各称、土地座落，文件档案的标题、发文机关、公文字号等等)，以及土地登记、地籍调查、权属审核、登记发证各办公流程中的各种键盘输入信息。六是各种立法文件和文字档案，主要有地籍档案、文件档案等具有法律效力或需要经常查阅的原始文件材料，它们是土地信息的重要组成部分，在土地的规划管理中起着很大的作用。

数据源质量问题指数据的采集和录入中可能产生的误差，建库所需的各种类型的数据的可靠性和精度。

从土地信息系统建立的过程来看，它的主要因素有：各种测量数据，地图和遥感数据等的误差；调查和统计造成的属性数据误差，以及文档数据的错误等，数字化前的预处理、手扶踀自动化的分辨率和矢量化精度。

1、遥感数据

地理信息系统、遥感和计算机辅助制图是现代地理学的重要技术手段。遥感作为一种获取和更新空间数据的强有力手段，能及时地提供准确、综合和大范围进行动态监测的各种资源与环境的信息，因此遥感数据是土地信息系统的一个重要数据源。

所谓遥感（RemoteSensing）就是遥远感知的意思，也就是不直接接触目标物和现象，在距离地物几公里到几百里、甚至上千里的飞机、飞船、卫星上，使用光学或电子仪器接受地面物体或发射的电磁波信号，并从图像胶片或数据磁带形式记录下来，传送到地面，经过信息处理，判读分析和野外实地验证，最终服务于有关部门的规划决策[2]。土地管理部门可以运用遥感技术快速获取现状空间的信息。

尽管遥感技术有很多好处，但因其自身特性，获取的遥感数据可能存在一些误差。如：不同的高度引起的问题，由于传感器的结构及稳定性产生的问题，对信号进行数字化产生的误差。传感器在航线、航向上出现的误差，大气辐射产生的误差，地形和地貌等因素产生的误差等等。在遥感资料的获取时，有些误差是可以控制的，有些则不可控。因此必须对原始数据进行预处理，包括利用地面控制对原始数据进行几何校正，图像增强和分类。对获取的遥感数据进行光谱校正，特征提取，自动识别分类、自动成图等处理[3]。

2、测量数据

各种原始的测量数据是土地信息系统的主要来源之一。包括宗地的权属界线、位置、形状、数量、面积、各级行政界线、地形图测量等。由于人和环境的因素，测量数据不可避免地受到人为误差（对中、读数、平分等误差）、仪器、环境的影响。来源于地面测量的数字数据中含有控制测量和碎部测量误差。其中控制点误差又受控制网的参考基准、网形和观测精度以及观测费用等因素的影响。碎部点误差除了继承了控制点的误差外，还受自身观测方法，观测精度和地界的人为判断，以及地物地貌的取舍等因素的影响。当然原始数据误差受观测仪器、观测者和外界环境三种因素影响。除此之外，还有测量数据的实时性以及数据老化，采集数据的密度不合理，或概括取舍不合理，选取测量规范标准不一致或精度等级不一致造成测量数据的不一致的影响。

地籍要素是构建土地信息系统极为关键的一步，其测量数据的精度高低决定了系统功能能否得到正确和充分发挥。

从地籍测量成果的有效性和土地管理的可能性来考虑，为了保证各权属单元之间的界线清晰，边界无争议，并且双方都能接受而不损害他人和国家的利益,地籍测量要达到一定精度。因此，必须要有相应的数据采集方法作为保证。地籍要素的采集方法目前主要有两种，一种是传统的模拟式外业测图方法，另一种是野外全数字化数据采集方法。传统方法的主要作法是在地籍控制测量的基础上，用解析法测量出权属界址点坐标，以控制点或以界址点为基础施测成地籍图，要形成入库数据信息，则要通过对原图数字化来实现。用传统数据采集方法形成地籍要素数字信息其误差影响因素较多，主要误差来源为：测站点误差m1，量距误差m2，在测图板上描绘方向线误差为m3，刺点误差m4，数字化仪采点误差m5等。按有关专著论述，一般情况下，m1≈±0.12mm,m2≈±0.2,m3≈±0.1mm,m4≈±0.14mm,这四项误差为野外采集误差。数字化m5的影响因素比较复杂，误差产生首先与图形要素有关，要素本身的复杂程度对数字化精度有显著影响，数字化仪本身的精度更应引起重视。正常情况下，用常规数字化仪进行数字化时，精度一般可达到±0.13mm。综合上述得，地籍要素采集精度m采为：

m采=±

=±

=±0.02mm

按1：500比例尺来考虑，实地误差将达到±10cm，由此可见，按传统方法施测，则拟入库的地籍要素信息很难达到规定的±5cm的精度标准[4]。

采用野外全数字化方法，界址点野外数据采集一般采用直接测定坐标法，即将全站仪或测距仪置于测站点上，对界址点上的移动棱镜进行水平角和距离测定，电子手薄记录计算。此种方法的主要误差来源为水平角测角误差mβ和测距误差mD，测角中误差角保守为±5″，测距误差主要来自移动棱镜偏离界址点位置误差，其偏离值按2cm考虑。测距平均边长取100m，按点位误差精度估算公式m2=来计算，则m≈±2cm,即便考虑测站误差和其他偶然的联合影响，点位精度也肯定在规定范围内，所以地籍要素信息数据的野外全数字化有利于提高界址点精度，从而保证地籍数据的质量。

3、调查、统计、文档数据问题

土地信息系统的建设过程中，涉及大量的调查统计数据，这些资料尚存在许多不足之处，为土地信息系统的建设带来了一定困难。

建立土地信息系统，必须首先进行土地基本信息的搜集，开展地籍调查工作，核实宗地权属，掌握土地利用状况，获得宗地位置、形状及其面积的准确数据，为建库奠定基础。

现就地籍调查工作加以探讨，众所周知，权属调查的工作之一是填写地籍调查表。由于权属调查技术性强，工作量大，参与人员多且水平不同等原因，填写后的地籍调查表或多或少会出现下面一些问题。在填土地使用者名称时，单位本应填写全称，可出现了类似这样的情况：某林业局有3宗地，而在3份地籍调查表上出现了xx林业局、县林业局、林业局等名称。按这样的名称录入建立信息系统，将导致不能正确地自动的归户。在填写土地使用者性质时，本应该写“全民”或“集体”或“个体”或“个人”，而出现了“国营”或“国有”或“私营”这样的名词。在填写宗地四至时应说明权属界线所经地物名称及归属、位置、与誰接壤。但出现了东（南、西、北）至xx，而未填出接xx。且有的四至填写错误，如两宗地共用一堵墙时，则只能出现两宗都至墙中，或一宗至墙内另一宗至墙外，但填出了两宗都至墙外或墙内等情况。在填写界址标示处的界址线位置时也有类似错误，有的表填写字迹潦草，或使用简化字，让人难以辨认。有的内容还可以猜出，但户主的姓名、调查员、勘丈员的签名等内容实在难辩；有的表中该填的内容而未填，任意涂改。

共用宗的处理，一个地块被几个权属单位共同使用，而其间又难以划清权属界线，这样的地块称为共用宗[5]。不少县（市）是这样处理的：有多少土地使用者就填多少份地籍调查表，表上的内容按各分宗填写。这样做的好处是所填的内容详细，调查表和土地登记申请书、审批表形成一一对应的关系。但其弊端也是显而易见的，其一较大地增大了填表的工作量，其二增大了复杂程度，在填写四至时，如遇一个土地使用者使用几个地块则不得不写清几个地块的四至；为填清界址指标，又得设置内部界址点，增加了宗地草图和地籍图的负荷量，填表时如不小心还会造成表与表之间的相互矛盾。为了和地调表统一，有的在形成宗地界址点成果表时，除了有宗地界址点成果表外，还有分宗的界址点成果表。如果内部界址点是在纸图上图解的，则将该宗地的宗地界址点和内部界址点和计算机展点后，会出现界址线混乱的情况。在土地信息系统建库时，这些内部点是不能当界址点录入进库的。如进库则在面积统计时，这种内部界址点所围成的区域的面积就被多统计了一次。

建立完备的信息系统，必须具备这样的条件：大比例的地形图或地籍图；野外测量的界址点数据；宗地的属性数据（土地登记申请书、地籍调查表、审批表等）。全省在进行大大规模的城镇地籍时，由于受当时的条件限制，自动化程度低，各作业单位作业水平的不同，或多或少出现一些问题。在建库时所发现的问题主要是界址点的坐标成果与地籍上的位置不吻合；相邻宗的同一界址点坐标不同；界址边长、宗地面积计算有误。某些县（市）为了进行土地登记，由于多方面的原因，在进行初始地籍调查时，只作权属调查，不作规范的地籍测量。为了计算面积，用皮尺或钢尺丈量界址边长及相关尺寸，用几何图形法计算出宗地面积，而不测址点坐标和地籍图。这样做不利于信息化的管理。

4、图形数字化

影响数据质量的因素是多方面的，有相当一部分来自于建库过程中的数字化过程。建库过程中的数据质量，包括数字化前的预处理，纸张变形、手扶跟踪数字化精度或扫描数字化的分辨率和矢量化精度。

(1)数字化前的预处理

用于数字化作业的地形图（工作底图）一般采用聚酯薄膜图，其变形一般小于0.2‰。采用纸质图纸时，图纸的尺寸随湿度和温度的变化而变化，温度不变的情况下，温度由0%增至25%，则纸的尺寸可能改变1.6%[6]。因为纸的膨胀率和收缩率不相同，即使温度回到原来的大小，图纸也不能恢复原来的尺寸。因此在数字化时要适当的比例因子，通过仿射变换进行几何纠正，以减小工作底图变形产生的位置误差，达到相应的精度。

对不同种类和比例的工作底图进行数字化时，应注意它的投影方式是否一致，比例是否匹配。对于不同投影方式应在数字化后及时变换为系统要求的投影方式。对于不同比例应将比例尺和精度记录到元数据中，以便估记由此可能产生的误差。

(2)跟踪数字化

手扶跟踪数字是一种自动化精度较低的数字化方式，其数字化精度也因操作员及其工作的疲劳程度而异，操作员的劳动强度较高。随着大幅面扫描仪的成本不断降低，扫描和矢量化技术不断完善，这种数字化方式可能成为自动扫描数字化的一种补充。

手扶数字化是从地形图输入空间数据的最广泛采用的输入方法。把地形图放置于数字化桌上，用手持设备，跟踪每一个地图特征、数字化设备精确量测鼠标的位置，产生数据形式的坐标数据。

影响跟踪数字化数据质量的因素很多；主要有：数字化底图中地理要素的宽度、密度和复杂程度对数字化结果的质量有着显著影响。数字化仪的分辨率和精度对数字化数据质量有着直接的决定性的影响。《地形图数字化规范》规定，数字化仪的分辨率不能小于每厘米394线(约1000dpi)，精度不低于0.127mm（0.005英寸）。常见数字化仪在分辨率方面通常能满足要求，而在精度方面却有相当一部分不能达到要求。在选择数字化仪时要特别注意其精度指标，以满足LIS工程的需要。数字化操作员的技能与经验不同而引入的人为因素误差是不同的，由于操作员视力、操作习惯，熟练程度和疲劳程度的不同，最佳采样点位值判断，十字丝与目标点重合程度的判断会有一定程度的差异，影响数字化的质量。操作方式（如曲线采点方式和采点数目）也会影响数字化数据的质量。

假定各种误差影响符合误差传播规律，手扶跟踪数字化的综合精度应按下式求得：[7]

m数＝±

其中：m数表示手扶跟踪数字化的综合精度；m定表示工作底图定向误差，m仪表示数字化仪精度，m人表示人为因素误差。

(3)、扫描数字化

扫描数字化用高精度扫描仪将图像等扫描并形成栅格数据文件进行处理，将之转化矢量图形数据。规范规定：图形定位控制点扫描误差不大于0.1mm，相对于工作底图，矢量化后的扫描点误差不大于0.15mm，线划误差不大于0.2mm。影响扫描数字化质量的因素除原图质量外，还包括：扫描精度、定向精度、矢量化精度损失等。

①扫描仪的分辨率和精度

扫描仪的分辨率和精度对扫描数字化质量的影响是至关重要的。因此，要根据具体情况选择适当的扫描仪。目前，大幅面扫描仪大致有，滚筒式（drum），平板式（flatebed），直进式（directfeed）3种。这些扫描仪能够输出一种或多种形式栅格数据文件（二值、灰度和彩色）。

滚筒式扫描仪精度较高价格较贵，能以较高的分辨率扫描AO或更大的图纸。

平板式扫描仪与滚筒式一样精度高、价格贵、分辨率很高，但一般幅面不会超过A1幅面。由于平板式扫描仪幅面小，扫描后多需进行拼接，从而增加了工作难度，引入了更多的误差源。LIS工程一般不选用这种扫描仪。

直接式扫描仪精度较低，价格也较便宜。通常能够满足一般LIS工程的需要。

目前，需要的大幅面扫描仪品牌有：CONTEX、VIDER、ANATECH等。

在选择扫描仪时，应注意其是否采用硬件消蓝。光学分辨率代表了扫描仪的分辨率能力，而经销商往往只是给出插值分辨。同时，应注意扫描仪的歪斜失真，歪斜失真的大小与扫描仪的走纸方式有关。

②栅格数据矢量化的精度损失

在土地信息系统中，栅格数据与矢量数据各具特点与适用性，为了在一个系统中可以兼容这两种数据，以便有利于进一步分析处理，常常需要实现两种结构的转换。

栅格的矢量转换处理的目的，是为了将栅格数据分析的结果，通过矢量绘图装置输出，或者为了数据压缩的需要，将大量的面状栅格数据转换为由少量数据表示的多边形边界，但是主要目的是为了能将自动扫描仪获取的栅格数据加入矢量形式的数据库。

在栅格数据矢量的过程中的细化、跟踪等均可能引入一些误差。复杂图形全自动化矢量化效果极差，会产生众多的交叉线，导致多边形跟踪错误。对此，应采用交互式矢量化方法。因此在选择矢量化软件时不应仅仅关心自动化程度（全自动矢量化软件价格往往很高）。还要特别注意是否具有以下功能：智能去斑，裁剪，扭曲较正，比例控制，水平校正，光栅编辑和交互式矢量化等。

③扫描数字化方法误差

扫描数字化的几何分辨率是扫描数字化方法误差中最重要的误差源，减小这种误差的唯一方法就是提高扫描仪的几何分辨率。但是，随着分辨率的提高，栅格数据量以平方级速度增长。这往往造成计算机存储资源耗尽，数据处理时间平方级延长。以300dpi（约每mm12个点）的分辨率扫描时，独立点间距离的相对精度为1.4／1000左右。全自动矢量化细化过程所产生的点位误差为1～2个像素点，而交互跟踪矢量化最大点位误差可以控制在一个像素点。按300dpi计，每个像素点相当于图上0.01mm。扫描数字化综合精度可按下式计算：

M扫＝±

其中：M扫表示扫描数字化的综合精度；M定表示底图定向误差；M仪表示扫描仪精度；M矢表示矢量化误差。这里，M定取±0.12mm，按300dpi计算M仪取±0.09mm，M矢取±0.1mm。则M扫=±0.180[8]。

四、数据处理质量

土地信息系统的数据库建立后，其中已经包含了数据源和数据库建库所引入的误差。数据库中的多源数据，经过系统的各种分析处理后，在形成新的数据和最后产品的过程中还会产生新的数据质量问题。这些问题包括：几何改正，坐标变换和比例变换，几何数据的编辑、属性数据的编辑、空间分析，数据格式的转换等。

1、空间分析

空间分析是对分析空间数据的技术的通称。从客观上区分，可归纳为：空间的图形数据的拓扑运算；非空间属性数据的运算；空间和非空间属性的联合运算等[9]。空间分析赖以进行的基础是空间数据库，土地信息系统的空间数据分析，是实现土地资源信息系统的实际运用的重点途径。

空间分析中的叠加分析是土地信息系统中十分常用的一种分析方法，是用户经常用以提取数据的手段之一。通过同一地区不同内容的多幅地图的叠加组合，产生新的图形和属性信息。在这个过程中往往产生拓扑匹配、位置和属性方面的数据质量问题。由于叠加时多边形的边界可能不完全重合，从而产生若干无意义多边形。对这些无意义多边形进行处理的结果往往会改变界线的位置，叠加后形成的新的多边形的属性值也可能存在由于属性组合带来的误差。

2、坐标变换

土地信息系统数据来源较多，各种数据输入信息系统应便于系统对数据进行图形显示，叠加查询，统计分析处理。LIS要实现这些功能，一个首要和基本的前提就是各种不同来源的数据在系统内必须在一致的地形图坐标系下。但是，在实际的数据采集过程中，大量的数据坐标并不一定属于系统用户所要求的坐标系，原始数据为一种坐标系，系统要求的数据为另一种地图坐标系，有的数据坐标根本没有地理意义，对此情况，必须提供从一种地图坐标系到另一中坐标系的坐标变换。

在具体的操作过程中，有可能产生新的误差。在不同比例尺下对坐标数据的重新设立产生误差，进行投影变换和／或基准面变换时产生的误差。生产实践中为提高数据质量，确保系统的数据精度和可靠性，通常用仿射变换和相似变换等模型来进行数据处理，以减小或消除误差。

坐标变换的实质是建立两个平面点之间的一一对应关系，现有一般GIS（LIS是GIS的专题）软件大都提供了以下两种模型实现坐标变换。

一是仿射变换：仿射变换也称六参数变换，其变换公式为：[10]

x´=Ax+By+C(Ⅰ)

y´=Dx+Ey+F(Ⅱ)

其中，x´、y´为地图输出坐标系中的坐标点对；x、y为输入坐标中的坐标点时；A,B,C,D,E,F为方程参数。参数在坐标系空间上的几何意义为：A和A分别确定点（x,y）在输出坐标中x方面和y方向上的缩放尺度。B和D确定旋转角度，C和F分别确定在x方向和y方向上的水平移尺寸。

二是相似变换：当式（Ⅰ）、（Ⅱ）中的参数满足条件A=E=Scos@,B=-D=Ssin@时，则得到四参数的相似变换公式：

x´=Ax+By+B（Ⅲ）

y´=-Bx+Ay+D（Ⅳ）

式中，x´、y´为输出地图坐标系中的坐标点对；x、y为输入地图坐标中的坐标点对；A、B、C、D为方程参数，相似变换实质上也是坐标系间的平移，旋转和缩放尺度的变换，式中C和D分别为坐标在x轴和y轴上的平移大小，为缩放比例，＠＝arctg(B/A)为旋转角度。

为了求出以上公式中的参数，建立两种坐标之间的仿射（或相似）转换关系，至少需要三个（或两个）已知的控制点坐标。而实际上，应选择多于三个（或两个）控制点，方能按照最小二乘法原理进行平差，得出系数值，代入上述方程即建立输入和输出坐标系之间的仿射（或相似）变换数学模型。

可以看出，仿射变换和相似变换都为线性函数变换模型，可实现对原图形的平移、旋转和缩放，相比较而言，相似变换不能进行x轴、y轴不均匀缩放的变换，而仿射变换能保证更高的数据精度。

3、数据变换

(1)CAD向GIS的转换

目前我国土地管理中存在一个较为普遍的问题是土地信息系统的构建与图形数据采集较少作用一个整体来通盘考虑，地籍测绘大大超前于信息管理系统构建。中小城市这种问题表现得更为突出。为满足土地确权发证，土地定级估价等需要，1995年前测绘的地籍图等图件因受技术条件的限制绝大部分是采用传统白纸测图方法完成的。随着计算机技术的发展和在测绘工作中的普及应用，1995年之后数字地图逐渐取代传统测绘。但一个不容忽视的事实是，绝大多数测绘图软件是在AUTOCAD上进行二次开发完成的。有些甚至是采用低版本的CAD，有些测绘图软件虽然测的是数字图，但只有非编码的图形文件，不保留信息，或者图形编辑以后，返不成信息。这种数字图说到底仅仅是从传统的白纸图过渡到计算机驱动绘制的白纸图。本质上与传统测绘没有什么区别。有些虽然采用了较高版本的CAD基础软件二次开发成数字测图软件并采用了数字编码技术，但由于较少考虑CAD与GIS的数据共享问题(土地信息系统属于专题GIS)。在着手考虑构建土地信息系统时，遇到的突出问题则是如何充分，有效利用已有数字信息资料，并确保数据转换质量。

对于传统模拟图或难以返成信息的所谓数字图只能采用原图数字化，形成数字信息后方可加以利用，但其精度丢失是不可避免的。

对于采用了编码技术，也能返成信息的数字图，其数字信息可以通过数据转换来实现数据共享，但由于CAD与GIS图形数据之间其数据格式，数据内容甚至数据概念都有很大差异，数据转换时应注意以下三个方面：[11]①数据格式转换。不同的软件有不同的数据格式，有些可以通过通用数据格式如DXF实现转换，但转换过程中的数据丢失也的确令人烦恼。②数据元素转换。CAD与GIS两者之间的图形元素不是一一对应关系，CAD图形中的图形元素种类要比GIS图形文件中的图形元素种类多，GIS中只有点、线、面三类基本图形元素，而CAD中包括有点、线、面、注记、矩形等多种图形元素，在具体转换中，CAD的图形元素哪些转换成GIS的点，哪些元素转换面面，什么元素需要转换成GIS的属性数据，什么元素则不需要转换到GIS中去等。CAD与GIS图形元素之间的对应关系，都需要认真细致地加以技术处理，使空间数据和属性数据在输入系统后正确地连接起来。③拓扑关系的形成。因为CAD的图形元素之间没有拓扑关系，实现CAD向GIS数据转换的一个重要内容就是要将转换后的图形数据按照一定的技术要求经过编辑，在GIS环境下建立几何元素的拓扑关系。

在实际转换中，还会出现许多意想不到的技术问题，会影响数据转换质量，有待进一步解决。

(2)矢量数据结构向栅格数据结构的转换

土地信息系统的建设中，许多数据如行政边界，交通干线，土地利用类型、土壤类型等都是用矢量数字化的方法输入计算机或以矢量的方式存在计算机中，表现为点、线、多边形数据。然而，矢量数据直接用于多种数据的复合分析等处理将比较复杂，特别是不同数据要在位置上一一配准，寻找交点并进行分析。相比之下利用栅格数据模式进行处理则容易得多。加之土地覆盖的叠置复合分析更需要把其从矢量数据的形式转变为栅格数据的形式。

矢量数据的基本坐标是直角坐标(x，y)，其坐标原点一般取图的左下角。网格数据的基本坐标是行和列(i，j)，其坐标原点一般取图的左上角。两种数据变换时，令直角坐标x和y分别与行与列平行。由于矢量数据的基本要素是点、线、面，因而只要实现点、线、面的转换，各种线划图形的变换问题基本上都可以解决[12]。

矢量数据变成栅格数据的原理与方法并不困难，但由于矢量数据的记录方式各不相同，也会产生一些问题。如多边形之间公共边原来只有一条交界线，转变成网格后成为有一定宽度的界线，产生了一定的近似性。特别是几条线交叉处，一个网格元素中包括了相邻的几种类别，转换时只能用其中的一种类别作为交叉点所在的元素的类别，这种误差应在允许的范围以内。而减小网格尺寸，虽提高了精度，但大大提高了数据的冗余量。

栅格数据结构需要大量的计算机内存来存贮和处理数据，才能达到与矢量数据结构相同的空间分辨率，而矢量结构在某些特定形式的处理中，如象多边形叠置，空间均值处理等尚有大量的技术问题来解决。值得注意的是，无论采用哪种转换方法，转换的结果都会不同程度地引起原始信息的损失。

通过矢量数字化或扫描数字化所获取的原始空间数据，都不能避免地存在错误或误差。属性数据在建库时，也难免会存在错误。诸如：空间数据的不完整或重复，空间点、线、面数据的丢失或重复，区域中心点的遗漏，栅格数据矢量化时引起的断线等，空间数据位置的不准确、线段过长或过短，线段的断裂、相邻多边形结点的不重合及空间数据的变形等。因此，必须对图形数据和属性数据进行一定的编辑。

土地信息系统数据编辑是消耗时间的交互处理工作，对空间数据不完整或位置的误差，主要是利用LIS图形编辑功能，如删除(目标、属性、坐标)，修改(平移、拷贝、连接、分裂、合并、装饰)、插入等进行处理。对空间数据比例尺的不准确和变形，可以通过比例尺变换和纠正来处理。

在数据的编辑过程中，由可能产生一些新的问题。如：线段的相关与延伸出现的问题，图形的平移与旋转出现的问题，删除“细部多边形”时产生的误差，数值计算与变化的误差；文件的合并以及形成新文件的问题；属性数据的重新定义和更新的问题。有的问题时可能避免的，有的问题则无法避免。因此，必须进行检核。通过耐心细致的检查，主要误差都能从数据中寻找出来，并有效消除误差。一般采用叠合比较法，目视检查法和逻辑法。

叠合比较法是空间数字化正确与否的最佳检核方法，按与原图相同的比例尺把数字化的内容绘在透明材料上，此后与原图叠合在一起，在透光桌上仔细的观察和比较。一般。对于空间数据的比例尺不准确和空间数据的变形马上就可以观察出来，对于空间数据的位置不完整和不准确则须把遗漏、位置错误的地方明显地标注出来。目视检查指在屏幕上用目视检查的方法，检查一些明显的数字化误差与错误，包括线段过长或过短，多边形的重叠和裂口、线段的断裂等。

5、由计算机引起的问题

在计算机中，数据是由一定字长的编辑数码表示的，由计算机字长可能引起一种误差。这种误差出现在各种数值运算和模型分析中，由这种误差引起的问题很多[13]，例如LIS空间数据库中整数编码对面积和周长计算的影响，比例尺变换和旋转变换对拓扑关系的影响等。削弱误差影响的主要方法有：改变数据在计算机中的表示方式,采用合适的算法等。

除了数据处理精度外，数据存储精度也与计算机字长有关。16位的计算机在存储低分辨率的栅格图像时不会出现问题，但存储高精度的控制点坐标或点位精度要求高的地理数据时，则不能胜任。

五、数据应用质量

土地信息数据在使用过程中往往出现一些质量问题，这些问题包括数据的完备程度，时间的有效性，拓扑关系的正确等。

1、数据的完备程度

数据的完备程度指地理数据在范围、内容、及结构方面满足所有要求的完整程度。包括数据范围、空间实体类型、空间关系分类、属性特征分类等方面的完整性。

一般来说，空间范围越大，数据的完整性就越差。在土地信息系统的建库过程中，数据不完整最简单的例子是缺少数据。如计算机从GPS接收机传输位置数据时，由于软件受干扰或其它因素的缘故，只记录下经度而丢失纬度，以至造成数据不完整。另外由于GPS接收机无法收到四颗或更多的卫星信号而无法计算高程数据也会造成数据的不完整。又如某个应用项目需要1:5000的基础底图，但现在的地图数据只覆盖项目区的一部分，底图数据便不完整。

在土地信息系统底建库中，涉及大量的地籍档案。地籍档案来源于土管机关的地籍部门，数量大、形式多、浩繁、零乱，随着时间地推移，以及人为和自然的各种因素地影响，有可能遭到损坏。如档案老化，书写材料低劣、地籍档案变到污染，变色、虫蛀等现象，进而影响到整个系统的质量。

2、数据的现势性

数据的现势指数据反映客观现象目前状况的程度。数据的现势差，反映的客观现象就可能不准确。不同现象的变化频率是不同的。如地形的变化一般来说比人类建设要缓慢，地形可能会由于山崩、雪崩、泥石流、人工挖掘及填海等原因而在局部区域改变。但由于地图制作周期较长，局部的变化往往不能及时地反映在地形图上，对那些变化较快的地区，地形图就失去了现势性。城市地区土地覆盖变化较快，这类地区土地覆盖图的现势性就比发展较慢的农村地区会差些。地形图上记录着所用航空像片获得的年代。若又用其他数据进行过修改(一般是较新的航空像片)，也应记录于上。

在土地信息系统建库中，要求地籍信息和地籍图必须具有现势性。地籍信息变更比较频繁，如土地利用类型，权属或宗地的重划，合并等。由于受自然因素和人为作用的影响，土地资源的数量、质量、分布和使用情况都处在经常变化之中。基于这一特点，土地管理部门提供的数据很难保证现势性，这也是影响数据质量的一个重要方面。

3、拓扑关系

在LIS中，为了真实地反映地理实体，不仅要包括实体的位置、形状、大小和属性，还包括必须反映实体之间的相互关系，这些关系就是指它们之间的邻接关系，关联关系和包含关系，拓扑关系。拓扑关系的核心是建立点、线、面的关联关系。通常有以下几种空间关系：点-点关系、点-线关系、点-面关系、线-线关系、线-面关系、面-面关系。空间数据的拓扑关系，对数据处理和空间分析具有非常重要的意义[14]。

利用拓扑关系，可以确定一种空间实体相对于另一种空间实体的位置关系。利用拓扑关系，可以确定某县有多少耕地，分析土地利用类型及对土地适宜性做出评价等。

在拓扑关系的建立中，拓扑过程中伴随有数据所表达的空间特征的位置坐标的变化，拓扑关系的不正确等情况，导致空间分析的结果错误，给土地管理决策带来一定的影响。

六、结论

数据是LIS最基本和最重要的组成部分，同时也是一个LIS项目中投资比重最大的一个部分。数据质量的好坏，会直接影响到LIS的系统功能和应用质量问题的三个方面(数据源的质量问题、数据处理质量问题、数据应用质量问题)着手，对LIS的数据质量问题进行了一定的归纳总结和初步的探讨。众所周知，LIS的数据质量是影响LIS的一个瓶颈环节，LIS数据量大、数据种类多、数据结构复杂。因此，在LIS的建设过程中，如何在数据采集与建库中实施质量控制，保证数据质量对土地信息系统建设来说显得尤为关键。

七、总结与体会

毕业论文的撰写是一次再学习和锻炼的机会，是对所学知识的一个融会贯通的过程。通过毕业论文的撰写，我对所学的知识有了更深层次领悟和掌握，对自己所学的土地管理专业有了一个整体认识。毕业论文不仅是对所学知识的总结，也是运用所学知识探求新知的方法、手段。既是一次再学习的过程，也是一次深入学习的机会。同时，毕业论文写作，为今后的学习工作奠定了一定的基础。通过毕业论文的写作，我真正懂得理论联系实际的重要性。在撰写毕业论文中，我运用所掌握的基本知识、方法和技能，研究探讨了土地信息系统建立过程中数据质量的有关问题。通过毕业论文的撰写，我进一步完善了自己的知识结构，学习了更多的知识。不仅如此，我对土地信息系统数据质量控制措施与方法方面有了更进一步的认识。

通过毕业论文的写作，不仅强化了我的学习素质、研究素质和创业素质，而且培养了我的创新意识，激发了我探求新知的欲望。认真写作毕业论文，不仅能进一步巩固所学的理论知识，而且还能进一步提高自己的各项基本技能，实践能力和解决问题的能力。

八、谢辞

在论文的写作过程中，玉文龙老师给予了很大的支持和帮助，为论文的写作提出了许多宝贵性的意见和建议；在他的指导下，这篇论文得以顺利完成。在资料的搜集过程中，图书馆工作人员为我们提供了很大帮助，本组同学也给予了很多支持，在此表示衷心感谢。

参考文献

[1]钱乐祥,余明全.土地信息系统的几个基本问题.测绘通报,1999(10).

[2]张超等.地理信息系统.北京：高等教育出版社，1995.

[3]阎正等.城市地理信息系统标准化指南.北京：科学出版社，1998.

[4]范爱民,景海涛.地图数字化质量问题.测绘通报，2000(4).

[5]严星,林增杰.地籍管理.北京：中国人民大学出版社，1999

[6]-[7]郝向阳等.地图扫描数字化点位精度分析.测绘学报，1995,25(1).

[8]毛锋等.地理信息系统建库技术及应用.北京：科学出版社，1999.

[9]汤国安,赵牡丹.地理信息系统.北京：科学出版社，2000.

[10]徐建刚.城市规划信息技术开发及应用.南京：南京大学出版社，2000.

[11]司少先.地籍信息系统源数据质量问题探讨.测绘通报,1999(4).

数据信息论文篇（3）

二、大数据环境中对民族地区高校信息素养教育提出更高要求

在大数据环境中图书馆提升服务质量，做到创新服务到位并非一件容易的事情。如何借助正在到来的数据技术去从事真正的知识服务是图书情报行业人士正在思考和实践应用的问题。王世伟认为:大数据为图书馆数据库的重组再造以及相应的数据应用和读者咨询提出了新的挑战和新的发展机遇，成为图书馆库库相联的重点。复杂数据的产生与保存、分析等将对图书馆的服务、图书馆馆员以及大学生信息素养教育等等也面临着新的挑战和影响，如何利用大数据技术去挖掘、识别、组织和分析在服务过程中所遇到的用户行为中的结构化数据、半结构化数据与非结构化数据等信息，这对拓宽图书馆服务、创新图书馆服务都是必不可少的重要内容。由于大数据时代的到来对图书馆创新服务提出了更高的要求，随之而来用户要求也在提高，这必将对信息传播者的素质要求也越来越高。因此，在大数据环境中对民族地区高校大学生信息素养教育也提出了更高的要求。但从实际情况看，大数据概念及基础理论知识信息在民族地区高校还是显得较为陌生，因此，充分发挥图书馆的教育职能，重视提高大学生读者的信息素养，加强对当今信息的获取、信息的安全、信息的利用认识和教育迫在眉睫。

三、大数据环境中民族地区高校信息素养教育的几点思考

(一)加强对民族地区高校大学生对大数据环境诸多信息知识的认识在大数据环境中，“图书馆的传统业务将向数据分析、数据挖掘方向转移，对大量数据的分析与处理将成为图书馆的主要业务”［8］120－122，同时，“大数据给图书馆知识咨询服务带来机遇，知识咨询服务是大数据时代图书馆知识服务的主要方式与手段，是一种有别于传统咨询服务的创新型服务”。图书馆知识咨询服务也应当包括信息素养教育的内容。大数据时代图书馆对庞大的各类数据的挖掘与提高数据分析能力是图书馆发展战略的关键，大数据的管理与应用涵盖了图书馆创新服务模式、读者借阅习惯、信息捕捉能力、数据挖掘与分析以及加强读者信息素养提高有效利用信息等，因此，图书馆通过信息知识教育、文献检索课教学讲座、提供多媒体课件等多种方法对大学生进行大数据概念等基础理论的认识，如认识大数据概念及4V特征、结构化数据、半结构化数据与非结构化数据;哪些是结构化数据?哪些是半结构化数据和非结构化数据?大数据是如何进行高速获取和应用等等信息知识，这些较为陌生的信息知识是图书馆馆员以及大学生都需要学习和了解的。

(二)加强高校大学生的信息安全教育美国高等教育信息素养能力五大标准其中一条就有:“具有信息素养能力的学生懂得有关信息技术的使用所产生的经济、法律和社会问题，并能在获取和使用信息中遵守公德和法律”。它要求图书馆在网络信息资源的开发与利用的服务过程中，怎样建立一个符合信息时代的信息伦理机制，使传播者和用户懂得如何自由获取信息的权利，尊重信息知识产权、保护信息隐私、防止信息垃圾及信息污染，不传播不良信息等，这表明对传播者也必须有一个统一的行为规范［11］。大数据环境中面临着读者隐私安全和隐私保护的问题较为突出，如何维护用户的个人隐私权是面临的一个新的要求。图书馆在利用大数据分析用户过程中，将会遇到用户隐私保护或泄露等问题，因此，在对读者个人数据的采集、管理、挖掘、分析提供个性化服务的同时，也要注重用户个人隐私的维护。要加强高校大学生信息安全教育，引导大学生在获取和利用信息中遵纪守法。

数据信息论文篇（4）

1）空间数据生产、使用的协调和管理

1994年4月13日，美国颁布了12906号总统行政令，实施国家空间数据基础设施（NationalSpatialDataInfrustructure，NSDI）计划，正式在美国政府和非政府部门中开展直接协调地理空间数据收集和管理的活动。

英国政府在认识和分析美国NSDI成功和问题的基础上，提出了国家地理空间数据框架（NGDF）发展计划。

澳大利亚联邦空间数据委员会制定了空间数据管理机构与领导机构的权利与责任、联邦公益空间数据转让等政策。

2）空间数据框架建设

美国FGDC于1995年4月提出了NDGDF实施计划，开始建立包括大地测量控制、数字正射影像、数字高程模型、交通、水文、行政单元以及公用地块地籍数据在内的数据框架。

加拿大GeomaticsCanada负责全加拿大国家地形数据库（NTDB），已经完成1：25万地形数据库和南部人口稠密地区的1：5万地形数据库。

欧洲大多数国家版图较小，数字地理空间数据生产基础较好。英国陆军测量局从1970年开始从事数字化制图，已正式向社会提供数字化地图。

法国地理院从1985年起建立1：5万全国地形数据库（BDTOPO），x、y精度为2.5m，z精度为1.0m。

德国内务部原大地测量研究所（IFAG）负责完成全国1：20万DLM和1：100万DKM，各州测量局负责完成1:2.5万DLM和1:2.5万DKM，其地物精度要求为3m。

荷兰于1990年建立了地籍信息（非图形）的联网查询，有2500注册用户，1997年完成全国地籍图数字化。

日本是亚洲地区最早开展地理信息化工作的国家。目前已能向社会提供DEM数字地图等系列产品。

3）空间数据标准建设

发达国家的地理信息管理采用国家和地方两级管理体系，在“数字城市”空间数据基础平台的建设中,通常采用自上而下的组织形式，即由中央政府组织相关机构共同推动全国范围统一数据平台的建设。政府在其中主要起到协调政策性事务、组织研究发展、统一数据标准和行业规范等作用。

2、国内“数字城市”基础平台建设的现状分析

我国“十五”计划明确提出：“大力推进国民经济和社会信息化，是覆盖现代化建设全局的战略举措。以信息化带动工业化，发挥后发优势，实现社会生产力的跨越式发展”。作为推进信息化工作的一个重要方面，党和政府的各级领导对“数字地球”给予了高度重视。

1999年11月在首届“数字地球”国际会议上，北京市市长刘淇正式提出了启动“数字北京工程”。2000年初，北京市信息化办公室制定了“‘数字北京’工程总体框架及发展规划”，这份规划对数字北京的概念、内容、目标、重点项目等作了详细的阐述。

山西正处在经济结构调整的重要时期，为加快国民经济和社会信息化，抓住“数字地球”带来的历史性机遇，充分利用现有的信息化基础和优势，确立建设“数字山西”战略目标，建设空间数据基础设施。2000年12月在太原市召开“可持续发展研讨暨空间数据基础设施项目论证会”，通过了《“数字山西”空间数据基础设施项目建议书》及其总体设计方案。

2001年2月陕西省第九届人民代表大会第四次会议审议通过的《陕西省国民经济和社会发展第十个五年计划纲要》明确提出，要加强基础测绘工作，基本建成“数字陕西”地理空间基础框架。

《福建省国民经济和社会发展“十五”计划纲要》把建设“数字福建”作为“十五”的重点建设项目，并成立了以省长为组长的“数字福建”建设领导小组。

湖南省发展计划委员会于2000年11月，在长沙召开了“数字湖南”框架工程专家论证会，与会专家和代表提出将“数字湖南”基础框架工程纳入省国民经济和社会发展“十五”计划，以利尽快实施。

吉林省计委于2001年4月邀请国内30位专家、学者在长春就“数字吉林”建设问题召开了研讨论证会，专家一致建议政府尽快立项实施。

海南省、湖北省、浙江省、河南省、重庆市、厦门市等地区也通过了数字区域的论证，开展了“数字区域”、“数字城市”空间信息基础设施建设。

3、上海在国内外“数字城市”建设中所处的水平综述

1）上海在“数字城市”领域中相关工作的现状

形成了全国领先的信息化基础设施规模和能力；完成了所有基本比例尺地形图的数字化；进行了城市遥感影像系统应用；探索了数据共享机制和应用标准；开发了多领域的地理信息应用系统。

2）上海在“数字地球”、“数字城市”领域中的优势和差距

主要优势：一是城市信息化基础设施的规模和能力处于全国领先的地位。二是信息技术普及程度比较高。三是具备比较优厚的经济基础和综合实力。四是具有丰富的人才和技术资源。

主要差距：一是作为“数字城市”核心技术的地理信息系统应用面过窄。二是信息共享困难、行业基础数据库之间互访性差。三是具有“上海特点”的自主技术研发实力尚不突出。

二、“数字上海”空间信息基础数据平台的界定

1、关于“数字城市”概念的定义

广义“数字城市”概念：“数字城市”即城市信息化，涉及到城市信息化建设的方方面面，不仅包括各种信息化基础设施的建设，还将涉及信息化过程中所产生的社会经济关系和文化伦理观念的变化与调整。

狭义“数字城市”概念：“数字城市”工程是指利用“数字城市”概念，基于地理信息系统GIS、全球定位系统GPS、遥感系统RS等关键技术，深入开发和应用空间信息资源，建设服务于城市规划、建设和管理，服务于政府、企业、公众，服务于人口、资源环境、经济社会的可持续发展的信息基础设施和应用体系。其本质就是建设空间信息基础设施并在此基础上深度开发、整合、应用、交流和共享城市的各种信息资源。

2、关于“数字上海”空间信息基础数据平台研究范围的界定

1）“数字上海”空间信息基础数据平台的定义

“数字上海”空间信息基础数据平台，是指在上海开展信息化进程中，用以满足各个行业进行与地理空间相关信息的采集、应用、交互、共享，并能提供标准参照数据及运行环境的集合。

2）“数字上海”空间信息基础数据平台的主要内容

“数字上海”空间信息基础数据平台所涉及的基础设施，主要将借助于上海城市信息化基础设施，因此，未列为本课题研究的内容。根据在地理信息系统、遥感信息系统等方面的应用实践。

三、空间信息基础数据平台在

“数字上海”中的关系和地位

“数字上海”所涉及的内容、覆盖的领域及对信息交互、共享的要求，比起现有任何信息应用系统都有过之而无不及。空间信息基础数据平台作为“数字上海”的核心数据内容，同其它部分的关系可用下图来描述：

图中：信息化基础设施就是构架宽带、多媒体信息网络的硬件环境。上海信息网络硬件环境是上海地区信息化公共基础设施，是各类信息应用所依赖的基础运行环境，也是支撑“数字上海”空间信息基础数据平台的基础设施。支撑软件主要包括网络操作系统、开发工具、专业软件等，这里的开发工具和专业软件都与所运行的信息系统有关，相对于其他现有的应用系统，“数字上海”空间信息基础数据平台有其特殊的要求，如地理信息系统、遥感信息系统、分布式数据库系统等。空间信息基础数据是构筑在信息化基础设施、支撑软件环境之上的空间框架性基础数据，它主要包括多种比例尺的数字化地形图、数字化遥感影像图、城市基本地理统计单元、行政区划图以及反映人口状况等数据，是“数字上海”的核心内容之一。政府、企业、公众等应用系统是建立在公共信息基础设施和运行环境上的信息系统，就应用对象来看可分为两大类，一是建立在空间信息基础数据平台之上，为满足各类应用需求的专业信息应用系统，如房地产信息系统、规划管理系统等，以及要求与地理位置相关的其他信息系统；二是建立在空间信息基础数据和各类专业数据基础之上的综合性应用系统，如指标统计、资料整合、预测分析等，是比前一类层次更高的、可为政府管理部门、咨询服务机构等提供科学依据和辅助决策的信息系统。空间信息基础数据平台在“数字上海”建设中的作用和地位主要表现在3个方面：

（1）空间信息基础数据平台是数字城市的空间参照体系，作为定位参考基准，可供各类用户添加其他与空间位置有关的专题信息。更由于平台是一个统一的、独立的、开放的运行系统，能为各类城市应用系统提供所需的公共基础信息，因此，它是实现全市空间信息共享的地理空间框架公共平台。

（2）以平台中空间基础数据为背景建立的各类专业信息应用系统，在地理位置上不会存在人为的差异，因此，它是行业、专业间应用系统进行数据交换的具有高效率、高精度特点的公共的交换平台，可成为全市基于空间框架的信息交换枢纽。

（3）由于空间基础数据平台既具有“数字上海”的空间地理参照体系，又包含了与城市空间地理相关的基础数据，因此，建立在这同一基础数据源之上的各类专业应用系统，在进行相关的专业统计分析时，其结果将比较公正，可比性也较强，信息的应用价值也会由此得到提高。

如今，上海信息化基础设施的建设已经取得了很大成绩，面向公众的社会信息服务的“中国上海”门户网站已经建成并投入使用，连接上海市各级政府机关的公务网络工程也在建设中，应该说，在硬件设施、网络环境上的建设已经走在了全国的前面。另一方面，经过“八五”和“九五”，管理部门、企事业机构也相继建成了一批具有GIS和RS特点的应用系统，推进了全市信息化、数字化的发展。上海已到了需要建立一个全市统一的空间信息基础数据平台，来解决公共数据重复建设、行业间数据不能交互、共享这一当前突出问题的关键时刻，我们认为，加紧建立地理空间框架性基础数据平台，是“数字上海”的重要核心内容，是全面启动“数字上海”的突破口。有了这个数据平台，信息化应用能力必然会获得大幅度的提升，“数字上海”才会真正深入到政府、企业、公众的日常工作和生活中，更好地为其服务。

四、“数字上海”空间信息基础数据平台

建设的目标和指导原则

从进一步提高上海城市信息化水平来实现跨世纪发展的大目标出发，提出实施“数字上海”空间信息基础数据平台建设的目标和原则。

1、“数字上海”空间信息基础数据平台建设的基本目标

作为上海城市信息化重要组成部分的“数字上海”空间信息基础数据平台，要建成一个“信息内容丰富、更新维护及时、共享交换便捷”的公共基础平台，这个平台将是支撑上海各类管理信息系统的公共服务平台。

“信息内容丰富”是指该平台数据丰富，具有较强的信息承载能力。

“更新维护及时”是指平台的信息资源具有明确的时效范围、切实的更新、维护周期，以保证其现势意义。

“共享交换便捷”是指数据的共享和交换简单易行。平台具有丰富的应用功能、友好的人机界面和有效的提交、分发服务。

2、“数字上海”空间信息基础数据平台建设的指导原则

遵循国家空间信息基础设施建设“加强统筹规划，促进综合利用，避免盲目发展”的指导思想，“数字上海”空间信息基础数据平台的建设的指导原则是“统一、通用、科学、标准、共享”。

“统一”就是必须在统一领导的前提下，以政府主导来规划、实施、推进，避免低水平盲目重复开发，提高运行环境、信息资源等方面的综合利用率。

“通用”就是在建设、运行、应用“数字上海”空间信息基础数据平台中，尽可能采用比较常用的、普通的操作系统、工具软件，促进成熟技术的普及应用，同时坚持不断创新，开发通用性强的技术，以满足不同需求。

“科学”就是面对空间技术、信息技术的快速发展和应用领域的不断扩大的趋势，平台的建设要适应可持续发展的要求，与上海的经济建设和信息产业的发展保持同步。

“标准”就是在国内外已有标准、规范的基础上，兼顾各种数据格式和技术特征，建立“数字上海”空间信息数据格式、编码、协议等标准体系。

“共享”就是在标准体系框架的条件下，实现不同系统的数据交换、共享和各项功能的使用。

五、“数字上海”空间信息基础数据平台

建设的主要任务

根据“数字上海”空间信息基础数据平台的建设目标，着眼基础数据平台的共享应用，提出如图所示的“数字上海”空间信息基础数据平台框架模型和由此构成的主要建设任务。整个框架由四个部分组成：空间数据交换网络、空间数据框架、空间数据服务体系及空间数据平台运行环境（标准、政策、法规等）。

1、空间信息基础数据框架建设

空间信息基础数据框架是“数字上海”空间信息数据基础平台的核心。空间信息基础数据框架包括地理空间基础数据和专题基础数据，对每一种数据又可以是多比例尺和多时相。

地理空间基础数据是具有普遍应用意义的基础数据，美国对地理空间数据的应用研究结果表明：大多数用户所需要的基础空间数据有7种，即大地测量控制、正射影像、数字高程交通、水文、行政单元和地籍数据。

大地测量控制数据--大地测量控制点坐标是获得其它地理特征的精确空间位置的基础，大地测量控制数据包括大地测量控制点的名称、标识码、经纬度和高程。

数字正射影像数据--经过几何校正和正射处理后的数字遥感影像（包括航空和航天影像），数字正射影像是信息提取和制作影像地图的基础。

高程数据--包括陆地高程数据和水深数据。

交通数据--包括各级公路、铁路、水运中心线、机场、港口、桥梁和隧道。

水文数据--包括河流、湖泊和海岸线数据。

行政单元--包括国家、省和县以及乡的行政边界和代码。

地籍数据--土地利用、地籍管理数据。

应用部门在地理空间数据基础上开发专业信息，附加和编辑属性信息。一个部门可以把本部门专题基础数据提供给平台，作为平台的一个专题基础信息，还可从平台中获得其它部门提供的专题基础信息。专题基础数据将包括城市规划数据、环保数据、市政建设数据、人口数据等。

空间信息基础数据平台是建立在分布式网络基础上，空间信息基础数据交换网络把各机构的地理空间数据库连接成松耦合系统，即在物理上是分散的，而在逻辑上是一个整体。空间信息基础数据可以在网络中心节点存储，而各种专题数据可以在远程节点存储，如城市规划数据存放在规划局，环保数据存放在环保局，市政建设数据存放在市政局等，各节点地理空间信息的融合是以共同的几何参照系统、数据模型和标准接口为基础的（图）。

“数字上海”空间信息基础数据基础平台近期将重点建立：上海地形框架要素库、1：5万数字化遥感信息库、上海行政区划图库、数字化城市基本地理统计单元信息、人口统计分布信息。

2、空间信息基础数据交换网络建设

空间信息基础数据交换网络是“数字上海”空间信息数据基础平台的物质基础，它由客户端、通信网络和服务器节点组成，是一个由网络上服务器组成的、连接地理空间数据生产者、管理者和用户的、非集中的分布式网络数据系统。

上海已经建成的ATM宽带信息主干网和骨干网络由8个核心节点、90个边缘节点组成的宽带、高速ATM+IP城域网，覆盖全市90%以上的大楼和小区，已具备“千兆到社区、百兆到大楼、十兆到用户”的服务能力，国际出口带宽从几十兆提高到1000兆以上，国内出口带宽已形成两个2500兆的高速通道，实现了大量信息资源的同城异构交互，由此形成了一个在国际也称得上先进的宽带、高速率、大容量的信息网网络平台。上海互联网交换中心（SHNAP）实现了各类ISP和ICP的本地交换，并采用动态路由战略消除了网络传输瓶颈，大大提高了资源的使用效率，为“数字上海”提供了良好的网络环境。此外，作为我国商用计算速度最快的神威计算机在上海超级计算中心的应用更是为“数字上海”提供了更为便利的条件。最近，上海市公务网正在紧张实施，主干千兆、局端百兆、桌面十兆的网络能力，将是空间信息基础数据交换网络的又一途径。我们认为“数字上海”的建设应当而且必须利用上海现有的网络资源，并在此基础上建立具有大容量存储、强交换能力的“数字上海”空间信息基础数据交互中心（IDC），提高数据的互访性和共享性。同时，应研究如何充分发挥超级计算机在“数字上海”建设过程中海量数据的处理过程的作用。

3、空间信息基础数据服务体系建设

空间信息基础数据的服务体系包括：空间数据协调管理、更新与应用保障、提交与处理服务。空间数据服务体系需要设立专门的机构来执行。

空间信息基础数据的协调包括：建立空间数据框架开发的计划、建立优先次序、开发协议和应用实践、协调数据访问方法、标准上的一致性以及提供拓展和教育。空间数据管理是为了保证框架数据的可靠性、完整性和安全性；因此，需要开发和演进数据的定义、设计模型以及其它的技术规范，提供数据档案、备份、检索和灾害恢复。

空间框架基础数据需要保持数据的现势性。数据的更新一般是由数据提供者来完成，但空间数据服务机构要根据城市的实际情况和有效需求确定数据更新的周期，更新的方法（必要时也可以组织力量采集），最终建立起合理、健全、符合市场经济规则的数据更新机制，并对数据生产进行监理和督促。

空间信息基础数据的服务包括：地理空间领域的访问服务、地理空间坐标转换服务、地理注记服务、图像操作处理服务、地理特征操作处理服务、图像开发服务、地理特征分析服务、特征综合服务、影像地图生成服务、地理信息提取服务、图像解析服务等。

空间信息基础数据平台的服务体系如图所示。

4、空间信息基础数据运行环境

空间信息基础数据运行软环境包括：标准、政策、法规等，是“数字上海”空间信息基础数据平台运作的外部保障。

1）标准

空间信息基础数据标准的制订有利于实现空间数据的共享和互操作，在“数字上海”空间信息数据基础平台建设中，需要调研已有的和正在制定的与城市空间信息基础数据平台有关的国家标准、行业标准、地方标准以及国际标准。作为“数字上海”的空间信息基础数据平台标准，目前主要内容应包括地理要素分类系统和编码、数据格式、空间坐标系统、元数据等。

（1）地理要素分类系统和编码标准，国家测绘局以及其它相关部门建立并已实施的分类系统与编码标准包括：GB12409-90《地理格网》、GB14804-93《1：500、1：1000、1：2000地形要素分类与代码》、GB2260-1995《中华人民共和国行政区划代码》、GBJ137-90《城市用地分类与规划建设用地标准》、GB/T16831-1997《地理点位置纬度、经度和高度的标准表示方法》、GB/T13923-92《国土基础信息数据分类与代码》、GB/T14395-93《城市地理要素-城市道路、道路交叉口、街坊、市政工程管线编码结构规则》等等。上海市也根据城市地理要素编码的国家标准编制了全市道路和街坊的编码。建议近期尽快制定、“上海城市地理信息系统标准编码体系结构”、“上海城市地理信息系统行业分类编码标准”等文件。

（2）数据格式标准，就“数字上海”空间信息基础数据平台来讲，涉及的数据类型、格式有许多种，最主要的是关于地理空间框架的图形和属性数据，而图形数据是其中的关键。目前上海常用的地理空间图形数据的类型和格式如：ESRI公司的Coverage和Shapefile、Intergraph公司的DGN、Autodesk公司的DWG/DXF，可以作为“数字上海”空间信息基础数据中图形数据的标准格式。由于不同的GIS软件往往都不能直接操纵其它GIS软件的数据，从实现地理空间基础数据共享出发，数据格式可以通过三种方式：数据格式转换、制定空间互操作协议、建立地理空间基础数据共享平台来实现图形数据格式标准的一致。

数据格式转换。为了规范和统一起见，许多国家和行业部门制定了自己的数据格式和文件交换标准，要求在一个国家或一个部门采用公共的数据交换格式。空间数据格式转换需要耗费大量人力物力，据统计，发达国家GIS空间数据转换的费用已达30%，即使如此，通过数据转换还是难以做到空间数据的实时更新，保持数据的一致性。建议近期尽快组织制定基于基础数据平台的图形、影像、文字、数字等数据的数据格式标准文件及实施办法。

建立开放性空间数据互操作协议（OGIS）。它的主要目的是制定出一套各方能接受的空间数据操纵函数API。遵循这一标准，各厂商提供一个与这一API函数一致的驱动软件，不同的软件就可以操纵对方的数据，这种协议类似于关系数据库的ODBC。如Intergraph公司推出的GeoMedia可以直接调用ARC/INFO的数据。虽然这种方式比数据转换方式方便得多，但也存在一些问题。一是由于各种GIS软件存储的空间信息不尽相同，所定义API函数提供的信息可能是最小的；二是各种软件之间虽然可以相互操纵数据，但各个软件都是以它自己的方式进行管理，这样仍然会出现数据的不一致性和影响现势性的问题。建议组织有关管理部门尽快研究制定基于共享的包括方式、协议等内容的数据交换规范性指导文件和实施办法。

建立地理空间基础数据共享平台。即采用Client/Server体系结构，所有的数据都存在Server上，各个应用软件都是一个Client端的程序，通过这一平台向Server中存、取数据。这种结构的优点是：任何一个应用系统所做的数据更新都能及时地反映在数据库中，避免了数据的不一致性问题。这种方式目前实现起来比较困难。只有发展到底层的Server绝对优于其它系统，而这一Server又管理着大量的基础地理数据时才有可能做到共享平台。

（3）空间坐标系统标准，地球上的任何一点都有其相应的空间坐标。空间坐标有两种，一是大地坐标（也称地理坐标），用经纬度坐标进行定位；二是投影坐标，即地球表面上的点投影到平面后的直角坐标（X、Y）。一个国家或地区在建立大地坐标系时，为使地球椭球面更切合本国或本地区的自然地球表面，往往需要选择合适的椭球参数、确定一个大地原点的起始数据，并进行椭球的定位和定向。我国采用了两种不同的大地坐标系，即1954年北京坐标系和1980年国家大地坐标系。美国国防部在1984年建立了世界大地测量坐标系统（WorldGeodeticSystem，WGS-84），目前GPS定位所得出的结果都属于WGS-84坐标系统。工程中实用的大多是国家坐标系，因此要建立WGS-84和国家坐标系之间的转换模型，目前已有坐标转换模型可求得WGS-84和国家坐标系之间的转换参数，进而得到国家坐标系成果。

在我国，地形图系列的比例尺为1:100万、1:50万、1:25万、1:10万、1:5万、1:2.5万、1:1万，城市图（及地籍图）系列比例尺为1:500至1:5000。其中大于1:5000的可视情况采用城市局域平面投影（矩形分幅）或城市局部坐标系的高斯-克吕格投影，1:1万至1:50万均采用全球统一分带的高斯-克吕格投影，1:100万地图则采用了与国际1:100万地图相一致的正轴等角割圆锥投影（Lambert投影）。

美国数字制图数据标准特别工作组（DCDSTF）于1988年发表的《美国国家数字制图数据标准》中规定，美国的各种地理信息系统和数字制图系统所允许的地理定位系统是在美国应用最广泛的三种系统中的任何一种：经纬度坐标系统、通用横轴墨卡托投影（即UTM投影）系统和州平面坐标系统（SPCS）。不同于地理坐标系统和UTM投影坐标系统，州平面坐标系统属于区域坐标系统，美国的50个州各自都拥有自己的一个或多个州平面坐标系统。

建议：经纬度坐标系统、高斯-克吕格投影坐标系统和上海地方平面坐标系统均为“数字上海”空间信息基础数据平台的标准坐标系统，以上海地方平面坐标系统作为平台应用主要的坐标系统，其他坐标系统与上海地方平面坐标系统的转换由平台统一处理。

2）政策

为了更好地实现地理信息共享，必须建立相关的政策，大致需以下几种类型：

（1）鼓励提供地理信息并保护数据拥有者数据拥有权的政策；

（2）确保元数据集信息完整性和精确性的政策；

（3）避免数据重新采集、处理以减少数据维护费用的政策；

（4）有效划分信息共享权利和数据获取者合理权益的政策；

（5）制定有偿信息价格的政策；

（6）促进数据的可使用性和改进数据质量的政策；

（7）提供信息获取能力和改进信息查询性能的政策；

（8）促进数据拥有者和数据获取者之间协调的政策；

（9）其他。

3）法规

作为上海城市信息化的重要组成部分的空间信息基础数据平台，在积极推进应用的同时必然会遇到涉及法律方面各种各样的问题，如：计算机犯罪、软件和数据的版权、网络法律等。这些问题一般都可以参照有关计算机、信息等方面的法律条款，但与通常的信息系统、数据相比，空间信息基础数据有其特殊性。

（1）数据版权。与一般的数据相比，地理空间数据可以有多种获得途径，包括纸质地图数字化、遥感图像解译、测量仪器以及现有数据的模型运算等都可以生成新的空间数据；数据处理的复杂程度也有很大差别，既有简单的坐标变换，又有复杂的专业模型运算；空间数据的应用可以在教学、科研、商业、公共服务、管理等多个领域。因此，在制订空间数据版权保护的法规时，需要综合考虑上述因素。

（2）数据保密。对于空间信息基础数据的保密有两种类型，一是信息本身，如有些比例尺的地形图、有些遥感中的影象图等国家已有明确的密级规定，必须遵守。随着技术手段的提高，获取空间信息的内容、精度等都可能变化，已有的保密法规也需作相应的调整和完善。二是信息操作，如空间信息上网进行交换、共享是必然趋势，但在具体操作过程中应有配套的法规加以保障，否则信息在传输、交换、共享过程中的失密现象将堵不胜堵。对此需要法律专家和地理信息领域方面专家共同努力来制订。

对于标准、政策、法规应该采取：凡是国家已有相应标准、政策、法规的，一律贯彻国家的；凡已列入国家有关标准、政策、法规制定规划的，不再另行制定，急需情况下可先提出有关过渡性文件；对于标准凡是需要制定但一时未纳入制定规划的标准（含规范、指南、约定等），若有相应的国际标准，则应按国家“酌情选用等同、等效、参照三种级别中的一种方式进行制定”的规定办，若无相应的国际标准，则在可能的情况下，参照类似的国外先进标准制定，制定中必须遵守GB/T1.x系列《标准化工作导则》的具体规定。根据上海的实际情况，建议有关管理部门可先制定一些地方性规章，如“空间信息基础数据平台的应用办法”、“关于空间信息基础数据平台共享的若干规定”、“关于实施空间信息基础数据平台的若干意见”等文件。

5、空间信息基础数据平台的应用趋向

根据空间信息基础数据平台所包含的内容、运行环境，其应用趋向可由以下几个方面来体现：

1）成为城市其他信息平台和专业信息系统建设的共享平台。

目前，上海市许多部门都在建设信息系统，其中，大多数系统都以上海地理空间为背景和参照。由于空间信息基础数据平台包含了上海地理空间框架数据，因此，使这些系统能直接在此地理空间框架数据的基础上进行开发、应用，避免了系统开发过程中数据采集重复，从而可大幅度减少系统开发的成本，也避免了因系统中信息定位不一致，造成各应用系统的数据不能相互调用。特别是一些综合性的分析应用，如商业网点合理性布局分析；人口、居住与城市交通设施能力的相关分析；城市基础设施资源的合理配置和科学管理；巡警、银行运钞、公交、出租等车辆动态调度系统及用于城市地面沉降监测、精确定位等GPS应用，更能体现空间信息基础数据平台所具备的共享性优势。

2）城市政府及各部门、企业及社会公众提供基于空间信息的专业信息与交换服务

人类活动所涉及到的信息80%以上是与空间分布有关。“数字上海”空间信息基础数据平台将依托城市宽带网络提供空间信息网络查询、交换和互操作等服务，政府部门、企业及社会公众既可以从空间信息基础数据平台中获得他们所需的多要素、多层次、多时态的空间信息，也可以向需要的用户提供自身所具有的数据信息。在进行数据交换时，不必连同背景信息一起传输，只要进行相关数据的从传输，就能使接受方直接进行数据的迭加或融入自己的应用系统中，从而可提高网络的运行效率，并产生积极的社会效益和经济效益。尤其在城市建设和管理领域中规划、市政、环保、环卫、房地资源、城市绿化、水务、公共交通、煤气等行业间的数据交换将很频繁，效益将更显著。

3）为城市规划、建设和管理提供决策支持

在城市规划、建设和管理中，经常需要对各种数据进行综合分析，如重大工程的建设、城市交通监察管理、城市防灾救灾等综合类应用，要分析区域性的自然、经济、环境等数据，并进行预测和评价。空间信息基础数据平台不仅是各种空间数据的集合，同时还提供空间数据的集成、融合和处理服务。基于平台建立的各种基础数据和数据处理模型及各类应用系统，将成为城市规划、建设和管理决策中最有力的支持。

六、“数字上海”空间信息基础数据平台

分阶段建设的实施步骤

结合上海“十五”期间全面推进城市信息化建设的总体目标，平台建设将按“突出重点、有序推进”的策略，分三阶段进行。

1、第一阶段：建设“数字上海”空间信息基础数据平台的空间信息基础数据库

（1）建立上海地形框架要素库和1：5万遥感影像数据可叠合的基础数据库。

（2）初步制定并试行“数字上海”空间信息基础数据库管理、分发、使用若干办法。

（3）选择一到二个示范区域进行“数字上海”空间信息基础数据库应用的试点工作。

2、第二阶段：基本建成和实现“数字上海”空间信息基础数据平台的网络交换及其共享功能。

（1）以“数字上海”空间信息基础数据库为核心，增加人口、绿地、环境、城市基础设施、土地利用等基础信息，逐步完善“数字上海”空间信息基础数据平台。

（2）制定基础数据平台数据交换、资源共享、网络通信、质量控制等标准和规范，实现行业间基础信息共享，建立行业间数据交换的标准和操作规范。

（3）确定“数字上海”空间信息基础数据平台基础数据维护机制和数据现势性要求，筹建空间信息应用行业协会，探索并筹建“数字上海”空间信息基础数据平台运作机构。

3、第三阶段：使“数字上海”空间信息基础数据平台成为支撑各类城市管理信息系统的基础，并为社会各行各业服务，推进上海信息化进程。

（1）组建“数字上海”空间信息基础数据平台运作机构，探索市场化运作的方式。

（2）探索、建立“数字上海”空间信息基础数据平台基础数据市场化维护机制，制定数据现势性的指标，扩充、完善“数字上海”空间信息基础数据平台基础数据类型和内容。

（3）增强“数字上海”空间信息基础数据平台信息处理能力，通过信息加工实现增值，促进地理空间信息服务、咨询产业。

七、“数字上海”空间信息基础数据平台

建设所涉及的关键技术

1、海量数据的处理技术

“数字上海”空间信息基础数据平台的数据是多时相动态数据，包含着网络环境下数以万计的数据，处理技术包括数据压缩、存储、检索、备份、转换等。“数字上海”空间信息基础数据平台建设应采用一种有效的系统安全和数据安全策略，主要包括下列三个方面：

1）海量数据压缩方法：主要针对大容量影像数据的高效压缩，要求具有压缩比大、速度快、失真小的特点。

2）海量数据快速检索方法：海量数据必须有先进快速的检索和数据提取方法，这是海量数据有效应用的前提。目前基于MrSID、ERMap等影像数据的压缩检索技术具有先进的水平。

3）数据的安全存储、管理和备份技术：海量数据的管理是涉及系统平台稳定运行的关键，必须具有安全、可靠的存储、备份技术。

2、元数据库建设和元数据

元数据是关于数据的数据。在地理空间数据中，元数据是说明数据内容、质量、状况和其他有关特征的背景信息，可用于包括数据文档建立、数据、数据浏览、数据转换等。根据地理空间信息系统应用特点，元数据库建设应针对基础数据平台包含的空间信息基础资料，建立详细的数据背景、内容、质量、状态等档案资料，元数据的动态维护与基础数据的动态维护保持同步。元数据库建设内容可包括元数据内容定义、元数据动态维护机制、元数据规则三个方面。

3、空间信息基础数据平台的可视化应用技术

“数字上海”空间信息基础数据平台必须在具备空间数据互操作标准化的基础上，建立可视化应用环境，充分利用现有的软、硬件成熟技术来集成、显示、分析、输出空间信息基础数据。当前需要研究的可视化技术主要有：

（1）矢量数据动态符号可视化技术；

（2）影像数据动态缩放、检索、叠加、像元分析计算显示技术；

（3）三维（包括DEM和建筑模型等）或四维数据叠加显示、模拟显示分析技术；

4、空间数据互操作标准化技术

空间数据互操作就是确定基于数据获取、数据递交、网络支持等技术标准，对多种信息源（跟踪矢量化数据、扫描栅格化数据、遥感栅格图像及GPS数据等）、不同比例尺空间数据及不同的投影方式、不规则空间图形，在平台中复合显示、叠加查询等操作规范，主要工作在于确定使用统一的协议，保持信息不丢失的前提下，具有从一个系统到另一个系统的信息交换并实现不同应用系统（包括软、硬件）之间动态地相互调用的能力。

1）基于单位或个人用于内部应用或管理系统开发的应用。与基础数据平台进行数据交换，包括不同系统间基础空间矢量数据的图形基本要素支持和转换、属性数据的有效转换、影像数据格式的转换、三维（包括DEM和建筑模型等）的支持和转换等，平台可提供市场上通用的GIS格式数据。这种模式下的互操作仅仅涉及数据库的格式转换，应做到系统数据达到无损或尽量减小数据失真，所有数据空间参考坐标系统采用平台的空间坐标系统，便于今后数据库的更新维护和管理。

2）基于利用城域网资源建立Intranet的多部门或单位多源数据的共享和应用开发。这种模式适用于政府和企事业单位范围内虚拟专用网的应用，提供的数据应属于内部资源，要在严格的数据保密安全控制之下进行互操作。数据的安全保密和有效访问权限设置是必要条件，并还需要建立有效的用户管理机制和认证系统，防止非法用户访问内部数据资源。同时建立在Intranet上的空间数据互操作，是利用WebGIS技术来达到多源数据的共享和应用目的，因此还必须有相应的公共数据接口和数据结构协议和防病毒安全措施。

3）基于面向公众和社会开放式浏览的多源数据应用开发。适用于在互联网上面向公众和社会化浏览可公开的数据资源，主要应用WebGIS技术。这种模式也必须保证数据和系统的安全，特别是源数据库和WEB数据库应严格的物理分开。对于公开的数据资源必须要有相应安全措施和数据备份要求，由于是Web方式的数据访问，还应对信息内容的数据量、网上访问速度、表现形式有一定限制。

5、基于现行的城域网资源实现“数字上海”基础数据网络通讯的安全技术。

“数字上海”将充分利用上海的城域网资源，在一定范围、以多种形式构建专用网络系统，从技术上主要考虑分布式操作及跨平台应用时，多源数据间互操作过程中的信息安全和完整性问题。空间信息基础数据网络交换的安全技术，应根据基础数据平台运行的实际情况和技术要求，可采用多种安全技术结合的方式来实现，主要包括：

（1）防火墙技术，包括硬件和软件放火墙技术；

（2）数据加密技术；

（3）用户认证技术；

“数字上海”涉及的关键技术中，有些是平台的建设者必须通过自己的努力来解决。有些是可以通过业界提供的产品、技术来解决，对此应及时跟踪最新的技术和产品或解决方案。还有一些则需要通过产、学、研的攻关来解决。建议：在“数字上海”空间信息基础数据平台的建设中，能用成熟技术和产品的尽量采用成熟技术和产品，同时采取引进消化国际先进技术与自主创新相结合的策略。

八、关于组建空间信息建设和共享的协调及

应用的机构设想

为使空间信息基础数据平台顺利发挥作用，有效承载起“数字上海”各类应用数据，在设想机构设置时，应考虑建立“政府监管、行业自律、实体运作”三者的关系。就现状而言，政府是最大的信息资源的权属所有者，绝大多数信息资源来自政府机关及其管理部门，信息系统最主要的应用对象也是政府管理部门，因此，政府及管理部门的监管力度将直接影响到空间信息基础数据平台的发展与推进。世界各国为实现信息共享都成立了专门的组织机构，并且多数以政府授权委员会、中心、协调局等特设机构形式，负责空间数据采集、管理、等事项。为保证上海空间信息建设和共享的顺利实现，也应建立相应的空间信息共享管理机构，以保证协调工作的顺利进行，并建立相应的组织体系。结合国家及上海的实际情况提出下列设想：

1、组建“上海市地理空间信息协调管理办公室”

组建具有政府管理职能的“上海市地理空间信息协调管理办公室”（以下简称“协调管理办公室”），业务范畴上与“国家地理空间信息协调委员会”相衔接，职能上统筹“数字上海”的规划、建设和应用推进，主要负责:

（1）制定“数字上海”的长远规划和近期实施计划；

（2）筹措、管理和使用“数字上海”过程中需国家投入的相关经费；

（3）负责制定、颁布关于空间信息基础数据平台建设、应用的有关规定和政策；

（4）协调解决建设、维护、共享、应用中出现的困难和问题；

（5）推进“数字上海”空间信息基础数据平台面向社会的应用、更新机制的建立和发展。

政府的监管行为主要体现在制定投资、定价、产权保护等方面的政策、措施，通过这些政策措施来调控、规范提供者、使用者在信息共享、交换及应用中的操作行为，既不要让信息在公益、共享的“旗帜”下随意复制、翻版，造成信息资源浪费、数据质量下降、平台的权威性无保障，也不容许数据持有者在利益驱动下，形成部门垄断、数据壁垒及价格高涨，造成数据重复采集、系统重复投资和重复建设的割据局面。

2、组建“上海市地理空间信息应用协会”

“上海地理空间信息应用协会”（以下简称“应用协会”）是在协调管理办公室指导下，由全市各地理空间信息提供、应用单位自愿参加组成。应用协会的工作任务是推进和实施政府的有关规定和政策，协助协调管理办公室规范用户在信息交换及共享中的操作行为。具体为：

（1）组织研究、起草与地理空间信息应用相关的法规、政策文本；

（2）组织起草、制定和贯彻、推行空间地理信息共享的标准；

（3）组织解决空间地理信息共享的技术问题，提出解决方案；

（4）组织会员开展信息与技术协作的交流，推广先进技术；

（5）组织有关的软硬件厂商、系统应用开发商与用户间技术与需求的交流。

应用协会可以成为政府与企业间的桥梁和纽带，在“数字上海”空间信息基础数据平台的建设和发展中，应用协会可以协助政府部门做好上述政策、措施的普及、研讨、推进等工作，逐步在行业内形成自律、规范的应用氛围。

3、组织建立相应的运作机构。

为保证空间信息基础数据平台健康、持续、有效地发展，应该配备相应的运作实体，暂称之为“基础数据处理中心”。“基础数据处理中心”的目标主体是受协调管理办公室的委托，完成指定的任务，保证基础数据平台内容的现势性和准确性。在相当的时间段内工作经费主要由政府投入，初期主要工作任务是：

（1）数据采集、处理；

（2）数据整合、转换；

（3）数据、分发。

“基础数据处理中心”作为一个完整的自我发展的机构，应在完成主要工作目标的前提下，充分利用数据优势，加强同社会各行业的技术联合，进行新的数据产品开发，以逐渐减少国家的投资和扶持。随着“数字上海”空间信息基础数据平台应用的发展，可以考虑数据、信息采集、处理等操作性层面的工作逐步走向社会、走向市场，以形成竞争，从而达到降低平台运行管理成本的目的。

九、关于“数字上海”空间信息基础数据

平台运作机构的设想

相对“数字上海”空间信息基础数据平台建设的艰难程度，“数字上海”空间信息基础数据平台的运作将更是有过之而无不及。本课题从现行的运作情况出发，探索平台建成后的运作实体及运作方式。

1、现行运作机制的三个问题

1）对信息资源的权属关系理解的不准确，造成了行业间“壁垒”和信息“孤岛”。较为普遍的是：工作是本单位做的，由此而形成的信息资源自然就是本单位的，只有本单位才拥有对它的开发权和应用权，其他单位、部门、个人要利用这些信息资源，理所当然地要有偿使用。目前信息资源价格体系还不健全，基本上呈无序状态。为了自身利益，信息资源被严密地保护着。这种“孤岛”效应深深地阻碍了信息资源的利用和共享。

2）管理和运作两位一体，造成了政、事（企）不分，职责不明。普遍存在的现象是：对各类信息资源的管理，既未完整体现政府的管理意志，又无适应实际需要的操作办法，基本“听命”于本单位的业务开展习惯。管理和运作合为一体，往往对信息资源的开发、应用、共享缺乏在全局高度上的考虑与规划，无法满足实际应用的多种要求，无法通过市场化的操作来降低运作成本，提高运作效率。

3）信息资源的建设、管理和维护未被作为本单位的“主业”来抓，人、财投入不到位。就现状而言，具有信息资源的机构、单位，往往都有十分明确的本行业、本单位主要业务，一般不会把在其业务过程中所产生信息的采集、维护等工作，像主要业务那样来对待，也不会在人力、财力和精力等方面给予足够的重视。从根本上说，要让上述机构、单位把本单位的信息资源建设、管理和维护作为主要业务来对待也不现实，我们需要专业性的数据、信息开发和维护企业来完成这项工作。

2、“数字上海”空间信息基础数据平台运作需要四个特性和三个要素

“数字上海”空间信息基础数据平台要能持续发展和共享应用，必须具备下述四个特性：

（1）平台所具有的统一、标准的地理空间框架信息决定了它的基础性；

（2）平台所起的基础作用又决定了它的公益性；

（3）平台所包含的内容决定了它的专业性；

（4）作为支撑平台它还应表现出必须具有的权威性。

目前基础平台建设已具备了一定的优势，要保持并扩大这种优势，必须通过自身良好的运作来实现，要在运作中把握三个要素：

1）要保持基础数据平台的内容最新的现势程度。以目前的条件，基础数据平台还做不到“实时”反映，但必须达到它所提供的数据的现势程度和更新速度在上海是最好的，否则就会失去用户和用户的信任，一旦失去了使用者的信任，也就失去它作为基础数据平台的基础性和权威性，更是失去了它的公益性和专业性，最终将失去的是自身的生命力。

2）要适应社会对基础数据平台多样化的服务要求。作为各类城市管理信息系统的支撑和服务平台，基础数据平台所面对的必然是多种类型、多种用途、多种形式的使用对象，其实质是基础数据平台的服务质量。基础数据平台的服务不能是“卖方市场”，应是“买方市场”。良好的服务质量一能增加用户的数量，二能提高用户使用基础数据的水平，三能收集基础数据平台自身建设所需的反馈信息，从而保持基础数据平台应有的特性。

3）要提供简便、规范、畅通的基础数据输入/出手段。在基础数据平台的实际运作中，输入/出是最频繁的操作之一，也是最难处理好的环节。简便易行的操作方式和过程，不仅体现了基础数据平台与使用者之间友好的界面与亲和的接口，也能反映出基础数据平台自身良好的兼容性能和运行功能，使基础数据平台具备与国内、外的相关应用系统或信息平台相互兼容和交流的条件和能力。

3、关于“数字上海”空间信息基础数据平台运作机构的设想：

1）行政事业性机构

在现有的相关单位的基础上组建一个事业性机构，该机构可以隶属于政府主管部门（如市信息办、市建委等）。平台运作所需经费主要依靠政府行政拨款，信息提供的价格由政府有关部门来定，不以赢利为目的，突出信息资源的公益性，类似于一般的“信息中心”这样的单位。其主要职责为：

（1）负责空间信息基础数据平台自身的运行和维护。

（2）负责向政府及相关单位提供信息及服务，逐步面向社会服务。

（3）建立与信息资源持有单位的信息交换渠道和交流方式。

（4）主要依靠信息资源提供单位来维护、更新基础数据平台的内容。

2）企业性机构（开放式股份制企业或具有投资主体的股份制企业）

以信息资源的维护、应用、升值服务为主营业务（信息资源的权属关系还在政府）的企业型机构，可以是开放式股份制企业，股东主要是数据资源持有单位，每一行业类信息为一股，数据资源持有单位可以随时加入，企业的股东也随之不断扩大。或以某投资主体单位为主组建股份制企业，投资主体单位可以是政府主管部门或由其指定的单位。股东单位或投资主体单位只参加董事会，不参与企业运作，企业是向董事会负责的独立的运作机构，赢利部分目前主要用于空间信息基础数据平台再建设和扩充（由董事会决定）。其主要职责为：

（1）负责空间信息基础数据平台自身的运行和维护。

（2）数据资源的更新维护，除了信息资源持有单位外，采集、更新数据的工作将逐步走向市场化操作。

（3）建立与信息资源持有单位的信息交换渠道和交流方式（买卖数据资源方式）。

（4）负责向政府及相关单位提供信息及服务，在保证空间信息基础数据平台正常运行前提下逐步面向市场提供服务，如：信息增值服务、综合性咨询服务等。

（5）逐步扩大股东,增加“本金”实力，视条件走上市公司的道路。

3）建立信息产品交易市场

基于信息资源或经“加工”的信息资源也可以视为产品的认识，可以参照其他有形市场的运作模式，建立地理信息系统的信息产品交易市场。从某种角度讲，通过信息产品交易市场的交易，可以促进信息的流通，而且在流通的过程中，使信息资源的持有单位得到利益上的平衡。但这不能代替信息共享的目标，只是提高了信息交流的频度，当然也有利于信息化的推进。建立信息产品交易市场须注意以下有关事情：

（1）应由政府主管部门或行业组建类似金属、建材等交易市场的机构。

（2）由政府主管部门或行业制定信息产品的和交易规则，指导性价格，如建筑业的定额等。

（3）由产品的供、需双方根据各自的需求协商信息产品的价格、介质（如：网络、软硬盘等）、使用范围、使用权归属等问题。

（4）应由政府主管部门或行业指定建立产品交易的仲裁机构、质量检测机构等。

结语

当戈尔向听众描绘“数字地球”美好前景时，就提出：“当今，我们同样面临这一问题，一边是对知识的饥渴，一边却是大量的数据闲置在那里未被使用。”其实这也是“数字上海”所面临和要解决的主要问题，我们的研究也正是沿着这条主线来展开的，研究中提出的诸如地理空间框架、基础数据平台框架模型、数据和技术标准规范、涉及的关键技术、协调及运作机构设想等一些观点，其中有些是我们多年实践的经验或教训，有些则是我们还在摸索过程中的体会，还有一些是我们想望实现的目标。我们力争从上海的实际能力、条件和基础出发，试图来回答这个问题。然而，“数字上海”毕竟是一项复杂和庞大的系统工程，在推进和实施这项工作的过程中，必然会遇到各种问题：如何打破部门壁垒，消除信息孤岛，在统一、标准的基础数据平台上，实现全社会信息资源共享；如何创建相适应的建设机制、投融资机制以及市场竞争机制，形成全社会共建合力；如何充分利用建设“数字上海”的契机，加快推进产业化发展，壮大信息技术和信息服务业的规模，吸纳优秀人才，制定配套政策，营造良好的氛围……。“数字上海”决不是一朝一夕、一个工程、一项计划就能完成的工作，而是一种真正体现全社会意志的集体行动。

路漫漫其修远兮，吾将上下而求索。我们正在走前人没有走过的路，我们愿和所有致力于“数字上海”的国内外同行、专家、政府工作人员、企业人士、普通市民共同探索如何数字上海，如何通过“数字上海”的实施来发展上海的信息产业，推进上海城市信息化，在新世纪里切实抓住在“数字地球”建设中实现跨越式发展的机遇。

明天，上海人将在数字化环境中生存。

参考文献

李德仁，对地观测与地理信息系统，地球科学进展，2001，16（5）。

陈军，多尺度空间数据基础设施的建设和发展，数字地球（崔伟宏主编），中国环境科学出版社，北京，1999年。

承继成、李琦、易善桢，数字地球与国家空间信息基础设施，清华大学出版社，北京，1999年。

FGDCClearinghouse

TheOpenGISConsortium

钟耳顺等，GIS多源数据集成模式评价，地理信息世界，2000，（1）

DavidA.,DavidH.,GeorgeT.,etc,Issuesandprospectsforthenextgeneration

ofthespatialdatatransferstandard(SDTS),GeographicalInformationScience,1998,12(4).

阎正主编，城市地理信息系统标准化指南，科学出版社，北京，1998年。

乔继明，地理信息系统标准研究的回顾，地理信息世界，1996，（3）。

[10]ClintonW.J.,CoordinatingGeographicDataAcquisitionandAccess,TheNationalSpatial

dataInfrastructure,federalRegister,April13,1994,Vol.59,No.71,Executiveorder

12906,pp17671-17674.

[11]StrandE.J.,1994,FederalGISStandards:ThinkGlobally,ActLocally,GISWorld,Vol.7,

No.9,pp38-40.

[12]何建邦等，对制订我国地理信息共享政策的建议，地理信息世界，1999，（3）。

[13]李京文、龚建雅，1:5万数据库建库设计中若干问题的探讨，地理信息世界，2000，（4）。

[14]蒋景瞳、刘若梅，城市地理信息系统标准化问题，地理信息世界，1998，（4）。

[15]孔云峰、林珲，中国地理信息系统发展状况的初步调查，地球信息科学，2000，（6）。

[16]，数字城市空间数据获取与应用服务的几个问题，数字城市的理论与实践（赖明、王蒙徽主编），世界图书出版公司，2001，pp591-595。

[17]李根洪，关于城市地理空间基础框架建设问题，数字城市的理论与实践（赖明、王蒙徽主编），世界图书出版公司，2001，pp605-607。

数据信息论文篇（5）

（一）必要性

根据IDC在2011年6月的《数字宇宙》（DigitalUniverse）研究报告，2011年全球新建和复制的信息量超过1.9ZB（1.8万亿GB），五年时间增加了近九倍。随着数据量的指数级增长、数据源种类（包括结构化数据源和非结构化数据源，如社交媒体、富媒体文件以及地理空间信息）的飞速增加，以及数据产生速度的加快（如实时传感器数据），传统的数据库和架构无法处理、管理和分析如此庞大的数据集。政府、金融、电信、互联网等大数据应用的行业先锋目前均面临大数据的问题。不仅如此，随着物联网、云计算、移动互联网、车联网、智能手机、平板电脑的飞速发展，大数据技术拥有了更为广泛的数据资源。因此，IT产业界及行业用户都亟需针对大数据设计和优化大数据存储、管理和查询平台，来替代传统关系型数据库平台。在技术发展的前沿阶段进行实验平台建设对我学院师生具有重要意义。该实验平台能够为学生提供一个了解最前沿技术的机会，不仅能够提高学生学习兴趣、自学能力，还为学生就业、更好地规划未来的职业发展提供了机会。大数据技术的机遇与挑战带来了很大的人才缺口，目前大数据技术平台开发、方案实施人才紧缺；由于云存储、大数据技术带来的信息安全问题，也亟需大量信息安全领域的人才；由于大数据技术在物联网、电子商务、移动互联方面的应用，对了解大数据技术的电子商务专业人才也更青睐。通过本实验平台的培养，感兴趣的优秀学生还可以尝试考取与大数据技术密切相关的Hadoop专业认证———ClouderaCertifiedDeveloper/AdministratorforApacheHadoop，为学校、学院在该领域带来正面影响，增加更多合作和就业的机会。该实验平台能够为信息系统专业试点班培养计划的很多核心课程（包括管理统计学中的业务报表与分析、商务智能方法与应用、商务智能实践、数据挖掘和BA综合实训等）形成较好的前后衔接关系，能够丰富实践教学环节，深化教学大纲的内容，从建设更合理的课程建设体系来说具有很大的必要性。近几年学生就业压力越来越大，迫切需要对教学内容和实践环节不断突破创新，才能具备持续发展能力。因此在原有课程体系和实践教学环境的基础上增设本实验平台非常必要。

（二）可行性

教学计划中的相关程序设计课程为学生学习云存储技术、熟悉大数据开发平台、了解最新大数据技术的发展、进行大数据平台基础上的开发、实现对大数据的分析、可视化演示打好了基础。英特尔ApacheHadoop平台是目前大多数大数据处理的技术基础，目前该技术已经发展成熟，并随之产生很多基于该平台的大数据处理工具，可供实验室建设实验平台使用。

二、建立大数据实验平台的基本构想

（一）实验平台人员

实验平台人员负责实验平台的建设、维护，实验设计与指导人员由在大数据相关领域、课程建设以及实践教学方面都有着丰富的经验的教师与实验室工作人员构成，同时与大数据企业进行合作，获得其核心技术人员的支持、培训和大力配合，可以共同组成一个经验丰富、精炼实干的建设团队。

（二）软件调研

大数据的特点为4个“V”：第一，“Volume”，指的数据量大，包括大的数据块，或数据总量巨大，从TB跃升到PB；第二，“Variety”，指的是数据种类繁多，包含大量非结构化数据，例如网络日志、音频、视频、地理信息等；第三，“Value”，价值稀疏性，大量数据中有价值数据很少；第四，“Velocity”，指的是处理速度快，这与传统数据挖掘有很大区别。选择有数据分析基础、在业内发展领先的企业进行调研并选择适合高校规模的合作企业是建立实验平台的重要工作。很多公司给出了可供使用的大数据平台：IBM誖InfoSphere誖BigInsightsTMBasicEdition是一款基于开放源码ApacheHadoop的分析平台，用于分析大量本机格式的非常规数据，支持结构化、半结构化和非结构化内容，以实现最大程度的灵活性；IBM誖InfoSphere誖Streams是一个高级计算平台，帮助用户开发的应用程序快速摄取、分析和关联来自数千个实时源的信息；惠普公司Vertica分析平台6.1，能够通过Hadoop分布式文件系统连接器来优化大数据；ClearStoryData大数据分析新创公司，通过Clearstory，公司客户可以将自身的数据与行业的公共数据融合，寻找统计上的新视角，目标是取代目前市场上的主流数据可视化工具，包括QlikView和Tableau等老牌工具；Informatica9.1提供首款Hadoop编译器Hparse，这是一种针对Hadoop而优化的数据转换环境，该软件支持灵活高效地处理Hadoop里面的任何文件格式，为Hadoop开发人员提供了即开即用的解析功能，以便处理复杂而多样的数据源；Datameer：Hadoop海量数据分析平台允许用户在缺乏技术知识的情况下能够分析大量数据；Infochimps平台以其完备的基础设施和专业知识，为客户提供端到端的大数据解决方案，Infochimps是一家位于美国德克萨斯州奥斯丁的创业公司，2012年2月从数据市场转型为大数据平台提供商后获得谷歌投资；甲骨文大数据机———OracleBigDataAppliance集成系统融入了Cloudera的DistributionIncludingApacheHadoop、ClouderaManager和一个开源R；微软SQLServer新增PDW功能，可以帮助客户扩展部属数百TB级别数据的分析解决方案；亚马逊将MapReduce作为一项服务，其弹性MapReduce编程是一项能够迅速扩展的Web服务，运行在aws的亚马逊弹性计算云和亚马逊简单存储服务上；Teradata是企业级数据仓库（EDW）的领导者，在结构化数据、半结构化数据和大部分非结构化数据领域几乎没有很大成果，因此收购了AsterDa-ta———一家提供SQL-MapReduce框架的公司。AsterData是高级分析和管理各种非结构化数据领域的市场领导者和开拓者，为Teradata带来了大数据分析市场商机。

（三）方案实施

实验平台的设计同时立足于大数据技术的发展的前沿性与本学院学生专业特点，与学生前序的理论、实践课程均有良好的衔接，符合人才培养计划，深化了教学大纲的内容，并针对不同专业学生设计实践学时、内容和难度。本实验平台可以同大数据行业中的公司科研部门共同合作建设，双方确定在人才培养、师资培训、共建实验室和实训基地、推动大学生校外实习和社会实践活动的开展等方面开展全面、广泛、长期、深入的合作。该实验室建设将丰富实践教学体系，也可推动学院科研项目立项、新课题研究、专项基金申请和联合开展商用项目开发等；该实验室使师生能接触高新大数据开发平台，了解最新大数据技术的发展，进行大数据平台的开发，实现对大数据的分析、可视化演示，增强学生的动手能力并提升就业质量；与此同时，提升了教师的项目管理能力和教学能力。

数据信息论文篇（6）

随着现代商业经济和信息技术的发展，商业信息的增长速度呈现指数上升，积累了海量的、以不同形式存储的商业数据资料，原有的决策支持系统（DSS）和领导执行系统（EIS）已不能满足需要，这时出现数据挖掘技术，它能够去粗存精、去伪存真，从海量的商业信息中提取知识和有用信息的技术。现代信息技术处理商业信息经过一定的发展，逐步形成现在的商业数据挖掘技术。

1．数据挖掘方法在商业信息中应用的规则

数据挖掘技术在商业中的应用主要基于AI、机器学习、统计学等技术，高度自动化地分析商业原始数据，做出归纳性的推理，从中挖掘出潜在的模式，预测客户的行为，帮助商业决策者调整市场策略，减少风险，做出正确的决策，体现一种决策支持过程。

1.1商业信息泛化、简约和特征提取规则。商业信息泛化是为了商业数据更好的理解和掌握，将其具体一般的数据信息抽象到较高层次的过程；商业信息简约是为了采用一定的手段对信息进行描述；商业信息特征是找出这些信息的共同特征，寻找信息的通用性特征式。

1.2商业信息分类技术规则。商业信息分类是按照一组商业信息对象的特征给出信息对象划分的过程。其目的是学会一个分类函数或分类模型，该模型能把数据库的数据信息项映射到给定类别中的某一个。

1.3商业信息的聚类规则。聚类规则是识别一组信息对象的内在规则，从而将对象分组，构成相似的对象类，从而找出数据信息的分布规律，并进一步去发现隐含在一组混杂的数据信息集里的分类规则。聚类是把一组个体按照相似性归类，即"物以类聚"。使属于同一类别的个体之间的距离尽可能小，而不同类别的个体间的距离尽可能大。

1.4商业信息的关联规则。关联规则的商业数据挖掘已经从单一概念层次的关联规则发展到多概念层次的关联规则的发现。关联规则是如下的一种规则："我们在研究大型商场的顾客在购买上衣和裤子的时候，发现其中在这些顾客中有10%的顾客同时买了帽子(上衣+裤子+帽子)，这就形成简单的关联规则。除了具有上述关联规律，还有时间或序列上的规律，在不同的时间（春夏秋冬）所购的衣服、裤子以及帽子是不相同的，并且不同层次或者不同年龄的人所购商品又有一定的规律性。

2．数据挖掘技术在商业信息中的应用

数据挖掘技术是目前在商业信息处理中应用的比较多的一项技术，为了在商业领域中对海量数据库和大量复杂信息中提取有价值的知识，进一步提高信息的利用率，对公司及时制定相应的对策有非常重要的意义，在这里，讨论几个主要商业行业中的商业信息处理。

2.1数据挖掘技术在电子商务网站数据中的应用

随着Web技术的发展，电子商务网站正在成为现在商家的必争之地。如何让电子商务网站有效益要想有效益就必须吸引客户，增加能带来效益的客户忠诚度。电子商务网站每天都可能有上百万次的在线交易，生成大量的记录文件和登记表，如何对这些数据进行分析和挖掘，充分了解客户的喜好、购买模式，甚至是客户一时的冲动，设计出满足于不同客户群体需要的个性化网站，进而增加其竞争力，几乎变得势在必行。若想在竞争中生存进而获胜，就要比您的竞争对手更了解客户。

在对网站进行数据挖掘时，所需要的数据主要来自于两个方面：一方面是客户的背景信息，此部分信息主要来自于客户的登记表；而另外一部分数据主要来自浏览者的点击流，此部分数据主要用于考察客户的行为表现。但有的时候，客户对自己的背景信息十分珍重，不肯把这部分信息填写在登记表上，这就会给数据分析和挖掘带来不便。在这种情况之下，就不得不从浏览者的表现数据中来推测客户的背景信息，进而再加以利用。就分析和建立模型的技术和算法而言，网站的数据挖掘和原来的数据挖掘差别并不是特别大，很多方法和分析思想都可以运用。所不同的是网站的数据格式有很大一部分来自于点击流，和传统的数据库格式有区别。因而对电子商务网站进行数据挖掘所做的主要工作是数据准备。

2.2数据挖掘技术可以用在金融领域的应用

金融事务需要搜集和处理大量数据，对这些数据进行分析，发现其数据模式及特征，然后可能发现某个客户、消费群体或组织的金融和商业兴趣，并可观察金融市场的变化趋势。

数据挖掘在银行信息中的应用。商业银行业务的利润和风险是共存的。为了保证最大的利润和最小的风险，必须对账户进行科学的分析和归类，并进行信用评估，利用数据挖掘工具，可以根据客户的消费模式预测何时为客户提供何种产品。银行如何让一家新开的银行网点实现快速赢利呢？银行结合了GPS推理信息系统和商业智能应用系统，在银行的客户信息中，详细记录有客户的常驻地，并且，当银行客户到该银行网点办理业务时，银行商业智能系统将自动记录客户的操作信息，以及银行网点地址信息。经过大量的记录，客户的常驻地到银行网点的行动路线，将被通过数据分析而得出。大量的客户路线得出后，我们可能会发现，某个地区进行银行业务操作的客户特别多，但他们附近没有银行网点，而是要到离他们较远的地方去办理，于是银行就决定在这个地区开办一个银行网点。

数据挖掘在证券信息中的应用。上市公司定期公布的财务报告具有很强的信息含量，但是当期会计盈余数据的信息会在披露前后在股票市价中迅速得以体现。因此对于中长期投资者来说，重要的是预见未来。质地优良且未来具有较高盈利增长能力的公司是中长期投资者(包括普通投资者，证券投资基金和券商)普遍关注的对象，因为只有这类公司才能给投资者带来持续的回报。而财务报告包含了大量描述公司经营状况的数据。这些数据应能为投资者提供关于公司未来盈利能力的信息。对于中长期投资者而言，需要做的就是利用这些信息挖掘出未来能够具有较高盈利水平同时又具有较好的成长性公司。采用数据挖掘技术来发掘这些财务报告中是否包含关于公司未来盈利情况的信息，获得较精确的预测效果，选出的投资组合能否获得超额收益，这对于投资者来说是非常重要的。

2.3数据挖掘技术在企业市场营销中的应用

数据挖掘技术在企业市场营销中得到了比较普遍的应用，它是以市场营销学的市场细分原理为基础，其基本假定是"消费者过去的行为是其今后消费倾向的最好说明"。通过收集、加工和处理涉及消费者消费行为的大量信息，确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求，进而推断出相应消费群体或个体下一步的消费行为，然后以此为基础，对所识别出来的消费群体进行特定内容的定向营销，这与传统的不区分消费者对象特征的大规模营销手段相比，大大节省了营销成本，提高了营销效果，从而为企业带来更多的利润。这些来自各种渠道的数据信息被组合，应用超级计算机、并行处理、神经元网络、模型化算法和其他信息处理技术手段进行处理，从中得到商家用于向特定消费群体或个体进行定向营销的决策信息。4数据挖掘技术在民用通信部门中的应用

数据信息论文篇（7）

在整个工程建设过程中，人力资源的需求是不均衡的，而且每个阶段所需要的工种也不尽相同。因此常常会出现有些项目某一时期人员相对过剩，而有些项目却苦于找不到人。在企业发展规模快速扩张时期，人力资源的集约化管理已是迫在眉睫。物资集中采购是大型企业的通常做法，这也是企业“以量换价”降低成本的有效方法。大量物资从对外采购到对内各个项目的供应，期间还要实现大批材料间的合理串换以及设备间的合理调配等资源管理工作，仅仅依靠精密的计划是不够的，建设工程受施工环境、政策等多种因素影响，有时一拖就是几年（例如一个拆迁问题就可能影响一个工程多年）。因而充分集约企业有效资源，提高资源的利用率，降低企业成本，已成为企业管理创新的主要方向。基于“大数据”信息化平台的工程管理体系可为解决这一问题提供正确、可行的方法。

1.2适应企业流程化和标准化管理的需要

传统的施工企业技术管理强调技术创新、工法研究、论文编写以及对工程现场技术问题的处理等。相对而言对技术的传承、积累、技术人才的培训工作做得不够，很难形成具有企业特点的技术资源库。新员工常常连基本的表格填写都弄不明白，更无法谈及熟练掌握核心技术要点。同时随着企业规模的迅速扩张，企业的管理人员数量增长远远不及规模的增长。为了加强控制、保障效益，企业不得不提高流程化、标准化管理要求。但随之而来的问题却是由于数据不能共享，员工的重复工作大幅增加，且数据错漏频多。以大数据技术思维创新技术体系的管理方式和内容，变革施工企业的管理模式，是适应互联网时代企业管理革命的迫切需要。

2基于“大数据”的工程管理体系建设的主要思路和框架

2.1基于“大数据”的工程管理体系建设的思路

基于大数据的工程管理体系构建的思路是：用大数据的思维构建工程管理体系，是将工程管理全过程数据（并非只是样本数据）进行归集、分类，然后通过互联网在系统内进行共享和处理，实现思维共享，实现工程管理的系统化、系统运行的流程化、流程控制节点的表单化。用数据驱动系统建设，用数据应用的新要求推动数据积累，数据流动推动管理流程化运行，数据的变异推动监管系统的完善。

2.2基于“大数据”信息化平台的主体框架

基于“大数据”的信息化平台主要包括“大数据”库与工程管理系统两部分，相对于现有的工程管理软件，其核心是集成了企业管理经验的数据库，信息平台的开发是工程技术人员主导开发，强化了现场管理的主要控制点，适用性强。“大数据”库收集了工程管理过程中所形成的诸如技术、质量、安全、成本等方面的各类基础数据，为了便于数据归类及查询，分别建立了技术质量数据、成本管理数据、安全管理数据三个子数据库。工程管理系统是针对项目而建立，实现对项目进度、质量、成本、安全的过程管控。它包括四个子系统：项目综合管理、技术质量管理、成本过程管理及安全生产管理。

3工程管理系统建设的基本要求、主体功能及主要特点

3.1基本要求

（1）便于访问和查询

“大数据”库不仅应满足对企业全过程、全方位所形成的数据信息进行及时收集、分类储存，便于分析处理，而且应能与工程管理系统实现有效链接，便于对信息数据的访问及查询。

（2）实现对工程项目的高效管控

该系统能够对工程项目全过程、全方位进行远程管控，实现项目质量、安全、成本、进度等子系统的无缝对接，使管控指令及时下达，并迅速获得反馈信息，实时对项目执行效果进行评价。

（3）硬件设施能满足系统运行以及扩展的需要

企业中心服务器、网络传输带宽及数据采集终端必须满足系统运行，并且应预留出足够的扩展空间以适应系统持续改进的需要。

3.2主体功能

（1）实现项目的动态管理

该系统通过“大数据”库与管理系统的互动功能，从项目合同签订伊始到项目竣工结束，建立项目质量、安全、进度、成本的动态数据库，实现项目质量、安全、成本、进度等子系统的无缝对接和远程管控。

（2）实现标准化和系统化管理

该系统为资料编写流程、收集要求、操作人员行为规范、样表和示范文本等资料的标准化管理提供了依据，管理过程中所形成的资料实时归集、分类存储，确保资料的完整性、准确性和系统性。

（3）提供咨询服务和培训指导功能

数据库中的样本、范本、各种说明要求按照国家及行业现行规范进行编制，管理过程中形成的经验数据、方法等经过提炼与总结达到行业先进水平。企业管理人员通过便捷的查询和借鉴，能够快速了解和熟悉自身业务，从而不断提高综合管理素质。

（4）提供即时交流互动平台

该系统搭设了网上沟通交流互动平台，提供了企业员工相互间进行经验交流、问题探讨的通道，并能借助企业内、外专家库链接窗口，实现对各专业疑难问题（如技术难题、成本组价）的实时快速处理，并与手机联动，确保沟通的及时性、有效性。

3.3主要特点

（1）总结经验形成技术核心竞争力

将企业历年来在工程管理中所形成的各类数据（包括技术方案、质量管控技术方法、工法、成本参数等），根据新的管理系统要求，重新进行收集、分析、整理，数据库与管理系统之间统一协调。同时通过系统运行，将外部先进知识和企业不断发展形成的新知识充实到数据库中，实现对现有数据的更新，确保数据的先进性。

（2）简化管理工作

数据库中存储了各类工作表格、表单、样本，包括记录工程实体质量的资料表格、进行安全管理的台帐表格、收集进度数据的统计表格、控制成本的消耗表格等，并且每种表格在何时进行填报，如何进行填报，数据库中均有模板及说明，工程管理人员只需要结合工程实际进行填报，数据交由信息化管理中心进行处理、反馈，大大减少管理中的重复劳动，分工更加明确，管理工作得以简化。

（3）样本模板标准化和信息的集中处理降低对一线员工的要求

系统中的每个管理节点，其具体工作的相关要求均按照国家、地方、行业的管理标准，结合企业的管理流程，编制了大量的样本文件和模板，并对每项工作要录入的数据作出明确规定。对一线每个岗位的要求就是做到数据录入的及时性与正确性，而信息处理则集中在公司各职能部门或外包单位。弱化了对一线员工的技术要求，使其将更多精力投入到现场生产及管理中。

（4）通过平台数据流动实现资源的集约化管理

通过运用“大数据”信息化平台进行工程管理是对原有管理思路及管理路径的突破。原有的管理路径是点对点的单线程管理，例如：技术问题→技术部→总工程师，成本问题→成控部→总经济师，技术数据与成本数据在总工程师与总经济师之间发生交互，降低了管理效率，采用信息化的管理后，由于信息化平台的介入，使得多个职能部门间能够并行管理，数据交互可发生在任何时间及地点，提高了数据利用率。利用互联网及信息化平台使管理路径中存在了共享机制，平台及时了各类资源信息，包括设备、人力资源、材料、劳动力等，管理人员可通过平台调用、查询各类数据（人员、物资、技术资源等），实现资源共享。例如某个工地刚进场一台设备，这台设备的各类参数就会即时在内网上公布，设备资源库为设备管理人员提供全公司所有设备资源性能参数及其分布。同样对于材料资源，优秀的分供商信息随时都会公布在内网上，资源利用充分而有效。

（5）建立交互式平台系统及时纠偏

通过系统建设再造了企业决策层和管理层、管理层之间、管理层与执行层的运行流程。以流程运行为主线路，各管理节点将数据处理信息到交互式平台，使执行部门的数据及时传递到相应的监督和管理部门，例如材料部门是依据成控部和项目部在工程开工前提供的材料计划进行供应，而当项目的材料供应需求偏离计划时，材料部门会及时对项目部提出预警，及时纠偏，进一步规范流程运行。

数据信息论文篇（8）

二、个人信息与隐私的含义，区别与联系

个人信息是指与自然人个人或家庭密切相关数据或者资料，有些能够定位或者识别个人身份，有些虽然不能定位或者确定身份，但与个人特征、信仰、健康状况、行为习惯、联络方式等有关。隐私在我国是历史上是早已有之的概念，但1949年以后至今，新中国法律意义上的隐私最早是1956年《全国人大常委会关于不公开审理案件的决定》首次在立法中使用的“阴私”提法：“人民法院审理有关国家机密的案件，有关当事人阴私的案件和未满十八周岁少年人犯罪的案件，可以不公开进行。”此后，1979年刑事诉讼法，人民法院组织法，最高法院在批复中也使用的是“阴私”这个提法，并界定了阴私案件的范围。从1982年《民事诉讼法(试行)》开始，1991年实行的《未成年人保护法》39条规定“任何组织和个人不得侵犯未成年人隐私”，从此我国法律和司法解释开始使用“隐私”而不再用“阴私”的提法。隐私的含义主要是指当事人不愿意他人知晓或者他人不便知晓的个人信息，事宜或不愿意或者不便他人介入的领域。《现代汉语词典》第五版对阴私的解释是不可告人之事，多指不好的事情，1998年重印的修订本解释则为“不可告人的坏事”，隐私：“不愿意告人或者不愿公开的个人的事”。可见，即使从非法律的普通人理解来看，隐私范畴大于阴私，隐私概念更为中性，没有贬义，除了阴私还有个人信息的内容可以构成隐私。

个人信息与隐私有区别也有联系：个人信息的内涵和外延都较大，与隐私有一部分交集，也有不完全相同之处。通常个人的信息包括：姓名，性别，年龄，婚姻家庭情况，联络方式(特别是手机等通讯设备号码，或者其他用户身份识别标识，包括码号，电子邮箱，即时通讯账户ID，家庭住址，可用以判断用户地理位置的移动或者其他设备的地理位置信息，等)，健康状况，病史，基因信息，生物识别信息(指纹，脚印，血型，等)，行为信息，包括个人活动信息，因使用移动计算机终端设备产生的浏览，搜索，交易，支付等信息。个人信息的概念比较中性，原来不是法律术语，2003年《居民身份证法》开始对警察泄露个人信息行为予以法律约束，2009年刑法修正案七规定非法提供、获取个人信息定为犯罪，此后，此概念成为法律用语，换言之，刑法先于民法对个人信息进行了保护。但目前还没有法律对个人信息的含义与范围作出规定或者限定，根据目前技术发展迅速的特点，个人信息的概念可能还会随着技术和商业发展有所变化。

目前正在从个人计算机为主的互联网走向移动互联网时代，隐私主要有：与性有关的行为或者其他信息，不宜公开的照片及音视频资料，财产、个人金融信息，生理情况，个人卫生和排泄等行为，不便公开的健康和疾病信息，等，在网络时代比较突出的网络隐私主要有：个人计算机终端设备产生、访问的敏感信息，用户通讯内容，用户的各类账户密码信息，等。

目前开始崭露头角的可穿戴设备，以及具备检测人体各项指标的手环，手表等各种设备，其对人体各种数据的采集即使个人信息也属于隐私。因而，如何确定个人信息的使用将平衡个人隐私保护与新技术给人类带来的福音。

三、中外个人信息与隐私的案例比较与分析

我国已经发生的个人信息泄露与滥用的案件很多都与隐私受到侵犯密切相关，比较典型的案例有“海运女”案件，“微博开房门”事件，“郭美美”事件，王菲诉张乐奕“北飞的候鸟”侵犯隐私案，等。美国发生过的有较大影响的个人信息案例包括2012年FTC调查谷歌隐私案，因safari浏览器隐私问题而对谷歌处以2250万美元的罚款。

在海运女案件中，法院判决搜索引擎因未履行《互联网信息服务管理办法》规定的监管责任，“百度公司在知道或应当知道网络用户利用其服务传播侵权内容的情况下，未采取合理的必要措施，应当承担责任”。本案判赔金额仅仅为2.2万元。在另外一个影响甚广的王菲诉张乐奕“北飞的候鸟”案件中，法院经公开召开研讨会，后判决侵权成立，赔偿人民币5000元。如果说后案因为存在道德上的争议，法院判决赔偿较低可以理解的话，前者的赔偿金额较低，就是我国目前常见的“赢了官司输了钱”现象的反映了。相比较而言，2001年Double Click公司就设立了首席隐私官职位，2007年该公司并入谷歌，2012年谷歌还是发生safari浏览器隐私问题罚款2250万美元。可见网络个人信息和隐私保护必须从长计议，不是简单某个措施就可以解决的。

四、个人信息保护的法律途径：

刑法修正案七，非法获取个人信息罪，这是对于新兴网络现象刑法再一次走在民事立法之前，刑法率先对个人信息的贩卖等行为采取严厉刑事制裁措施。

2011年修订的《居民身份证法》第6条规定：“公安机关及其人民警察对因制作、发放、查验、扣押居民身份证而知悉的公民的个人信息，应当予以保密。”第13条规定：“有关单位及其工作人员对履行职责或者提供服务过程中获得的居民身份证记载的公民个人信息，应当予以保密。”第19条规定：“国家机关或者金融、电信、交通、教育、医疗等单位的工作人员泄露在履行职责或者提供服务过程中获得的居民身份证记载的公民个人信息，构成犯罪的，依法追究刑事责任；尚不构成犯罪的，由公安机关处十日以上十五日以下拘留，并处五千元罚款，有违法所得的，没收违法所得”。

2012年底通过的《全国人大常委会关于加强网络信息保护的决定》，明确提出保护能够识别个人身份和涉及隐私的电子信息。2014年3月15日实施的《消费者权益保护法(修正案)》规定，个人信息依法得到保护，确立了工商行政机关可以对侵犯个人信息进行行政处罚的职能，确认了公民可以向法院起诉。但这两部法律都没有解决如何赔偿问题。因而，在法律实施到现在，还没有发生有影响力的个人信息方面的民事案件。日常生活经验表明，个人信息广泛被贩卖和滥用的情况没有取得明显的好转。仍需要思考如何从制度上确立预防和制止个人信息泄露与滥用的有效机制。

国外关于个人信息的保护，主要立法经验有：美国有《隐私权法》《电子通讯隐私法》等多部法律，主要是隐私保护，在美国隐私观念深入人心，用户有较强的隐私保护意识。欧盟以《个人数据保护指令》确立的个人数据保护模式，德国于1976年颁布《联邦资料保护法》，法国于1978年通过《法国自由、档案、信息法》，1984年英国制订《数据保护法》。根据笔者与来华的这些国家国籍的朋友交流情况来看，这些国家个人信息滥用远不如中国严重，笔者分析认为主要原因还在于较强的隐私意识文化传统及其成熟的法治，一旦侵犯个人隐私会承担较为严重的法律后果。

笔者认为，根据目前已经能看到的个人信息在移动互联网时代的广泛采集和应用，原有隐私权不能满足对个人信息应用和保护的需要，有必要在民法上创设个人信息权概念，是一种人身权(人格权)兼具财产权性质，类似知识产权的一种复合型民事权利。具体权能为：知情权(对采集、应用、存储、管理和销毁个人信息有知情了解的权利)，处分权(允许采集、应用、存储、销毁个人信息)，受益权(对个人信息的商业性使用获得收益的权利)，不作为请求权(对不符合个人意愿的个人信息采集使用行为有拒绝、请求停止、消除的权利，此权能可以包含美欧目前已经被广泛讨论的“被遗忘权”)。隐私权的生活安宁权虽能涵盖一部分前述的权能内容，但个人信息可以许可他人使用，并从从获取经济收益，这些行为与传统的隐私权人格权特征有较大出入，因而单独确立个人信息权可以成立。

五、个人信息民事立法的基本制度构建

虽然我国已经在个人信息保护上进行了若干立法，但仍然存在明显的缺陷，即没有惩罚性的民事制裁措施，无法从制度上预防个人信息滥采滥用，也无法斩断个人信息的灰色利益链条。由于行政处罚需要证据，刑事处罚需要一定门槛，法律规定的行政惩罚措施和刑事打击在日常生活中罕见使用，因而在经济利益驱动下，几乎每个人在生活中都仍然难免经常性遭遇个人信息泄露与滥用的危害。借鉴博弈论的经济学理论，笔者建议在个人信息保护立法中建立以下基本民事制度，以引导企业遵守保护个人信息的法律规范：

首先是设立个人信息使用者和收益者对个人信息来源进行合法性审查的合理谨慎义务。即要求使用个人信息进行商业宣传或者其他推广的机构和个人应当对信息来源合法性进行合理谨慎的注意，为避免企业通过子公司或者第三方规避此义务，因而有必要加上受益人也负有此责任，包括广告主和实际受益人，不限于广告经营者或者直接者。只有建立了此制度，才能杜绝正规企业采购营销服务不审查个人信息的合法性，从而在客观上助长个人信息泄露与滥用的现象。同时，如果能够较好执行本制度，等于打击和消灭了非法采集和滥用个人信息的销售、变现渠道，使其失去违法的经济驱动力。

因而，在个人信息侵权行为的民事赔偿方面，有必要继承前述法律已经有的成果。鉴于个人信息侵权行为往往难以证明损害后果，如果法律不规定法定赔偿标准或者计算方法，由于我国法院坚持填平式赔偿原则，实际诉讼中赔偿将延续目前较低局面而不会具有威慑力，仍然无法改变在利益驱使下泄露滥用个人信息的局面。因而，比较现实可行的是建立递进式的惩罚性赔偿制度，即对于三次以上侵犯个人信息权，或者经行政处罚或者诉讼判决侵权成立，仍然拒不改正的，法律应设定较大的法定赔偿责任，或者在按照普通民事侵权三倍以下予以赔偿，或者经由消费者保护组织起诉的，可以设定较大额赔偿，由消费者组织在受害者中予以分配。只有违法行为人了解一旦实施违法行为其法律责任将超过其获得的收益时，才可能根本上扭转个人信息过度收集，随意泄露和普遍滥用的混乱局面。

第三是建立个人信息规范、合理使用的制度。在大数据应用前景极为广阔的今天，应该为企业大数据应用留下空间，引导企业规范使用，而不能因噎废食，因限制过严导致企业无法开展大数据应用，公众也无法享受网络技术发展带来的便捷与进步。因而，建议确立在满足下面三个条件的前提下，允许企业采集、应用、存储、管理并销毁个人信息：

1、经公示或者告知信息收集目的，收集、应用、存储和销毁规则，并且采取合理措施履行保护个人信息避免泄露和滥用；

2、不披露具体个人的信息，也不能根据数据应用的结果反向联系或者确定到具体个人；

3、不违反隐私保护的强制性规定。

个人信息的合理使用，是指为履行与用户所订立合同目的，或者为保护用户之合法权益，按照最低必要限度原则收集个人信息，并诚实信用使用个人信用使用个人信息，包括身份验证，通知联络，履行合同订立的先合同义务以及履行合同后的附随义务等。合理使用应当是非商业目的，并且不得违反法律的强制性规定。

数据信息论文篇（9）

一、汉字识别技术的应用价值

汉字识别技术的应用价值主要体现在两个方面：

一方面，把纸质档案上的固定信息变成可以被检索利用的活信息，为文本数据管理技术提供丰富的数据源。

首先，从库存档案的情况来看，近几十年来形成的大量印刷汉字档案记载了我们党和国家的重要历史，对我国现代化事业的发展，对精神文明和物质文明的建设都有着非常重要的利用价值。但这部分档案的内容都没有文本数据，或者说都只是固定在纸质载体上的死信息。既使通过扫描以图像方式存储于计算机中，检索利用也有不便之处，难于满足现代社会对档案信息的多种利用需求。其次，从办公自动化的发展情况来看，每年接收的档案中仍然会有相当数量的档案没有文本文件，或为外单位来文，或为丢失损坏等。汉字识别技术的应用价值就是使这两大部分纸质档案上的固定信息变成可以被检索利用的活信息，为全文检索提供数据，使深层次的开发利用成为可能，更好地为现代化建设事业服务。

另一方面，提供了一种新的档案目录数据的录入方式。

应用计算机以来，汉字录入只有一种方式，即健盘录入。虽然目前汉字键盘录入的方法有许多种，而且日趋简便快捷，已是年轻人必备的职业技能，但是它毕竟属于一种技能，不仅需要反应灵敏，手指灵活，而且要熟记录入的原则、方法和要领。这对于在档案部门占有相当比例的中老年同志来说，掌握起来确有难度。因此，键盘录入方式仍然是影响一些档案部门建立档案目录信息数据库的因素之一。OCR软件为我们提供了一条新的途径。它通过“拖拉”的方式，将屏幕上文件的目录项如标题、文号、责任者等直接移植到档案目录数据库的相应字段中去，简单易学，一看就会。遗憾的是手工“拖拉”速度较慢，而且需要即时扫描或调用图像数据，所以单一利用这种方式录入档案目录，速度不及熟练录入员的键入速度。但它毕竟是一种新的录入方式，为建立档案目录信息数据库提供了一条前所未有的途径。而且，如果利用OCR软件同时建立新型的综合档案信息数据库，例如包括档案的文件目录、图像和文本等，效果就此较理想了。

二、汉字识别后生成的文本数据的属性问题。

原始性是档案的基本属性。汉字识别后生成的文本数据是根据档案的本源信息，即固定在纸质载体上的汉字信息进行加工处理：扫描、识别、校对、修改等工序后形成的复制加工品，因此不具有档案的原始性。

知识性是档案的又一个属性。汉字识别后生成的文本数据如果不计算人工校对后仍然可能存在的微小误差，应该说具有与档案原件同等的内容，因此具有档案的知识性。

汉字识别后生成的文本数据是将档案的内容以特殊的物理方式重新记录在特殊的载体之上，比以文字的方式记录在纸质载体之上更具有便于传递、接收、存储、利用以及不磨损、不丢失等属性。因此具有更强的信息性。

汉字识别后生成的文本数据应该说，它是一种新型的档案一次信息的复制品或编研开发成果。但作为一种新型的复制品或编研开发成果，因其生成的目的不同，又具有两种不同的属性：当以提供利用为目的通过汉字识别建立文本数据库时，其文本数据具有类似于汇编类档案编研成果的属性；当以编辑出版纸质的档案编研材料如大事记、组织机构沿革、文件汇编等为目的进行汉字识别时，其文本数据不仅具有类似于档案编研成果的属性，而且具有档案原始性的基本属性，因为它们是印刷品或出版物的本源信息。

由此可见，汉字识别后生成的文本数据是一种不同于传统档案属性的新型档案信息。

三、汉字识别技术的应用方式

汉字识别技术在档案管理工作中的应用，根据其目前的技术水平主要适用于近几十年来印刷汉字档案内容的识别，图像、文本数据的形成、存储和目录数据的录入等项工作。主要的应用方式有：

(一)利用者阅读纸质档案的内容之后，对其所需要的内容进行扫描和汉字识别，或打印出统一格式的利用摘录，或直接提供文本拷贝。

这种利用方式的优点主要有：

1方便用户，可减少信息利用过程中的重复劳动；

2不给档案人员增加建库的工作负担；

3节省建库所需的经费开支。其缺点主要有：

1不能为全文检索提供数据，实现深层次开发档案信息资源的目的；

2存在对同一档案内容重复进行扫描和汉字识别的可能性。

(二)建立文本数据库。这种方式也应在已有文件目录的条件下使用。其优点主要有：

1节省存储空间和存储成本。仍以一页B5型纸约500汉字的文件为例，以文本方式存储约需1000字节；以图像方式存储约需25000字节。因此，同量汉字的文本方式存储比图像方式存储成本低得多。

2为全文检索提供数据，能够实现深层次开发利用档案信息资源的目的。

其缺点主要有：

1建立文本数据库的工作量较大。

2不能满足用户阅读档案原件的需求。

3由于没有图像随时提供依据，不便于对文本数据的准确性进行核实。

(三)扫描、保存图像并提供利用，只针对利用者需要的图像内容进行汉字识别等利用服务。

这种方式必须在已有文件目录的前提下使用。其优点主要有：1具有提供原件和提高信息利用效率的双重优势；2档案人员不承担汉字识别后生成的文本数据的维护工作。其缺点主要有：1同第一种利用方式的缺点。2汉字识别技术要求图像的光学分辨率较高，一般为3000dpi，而一般图像的分辨率仅为150dpi，因此所需的存储空间较大，约是一般图像的2、3倍，那么，所需的存储成本也要高得多。这种高代价的图像存储仅用来满足用户利用识别的需要似乎有点得不偿失。因此低分辨率的图像也能进行汉字识别，只是识别率相对较低而已。我们也曾做过对比实验，同一页印刷质量良好的B5纸型文件约500字，以300dpi进行扫描，识别率为100%；以150dpi进行扫描，识别率为99.4%(误识3字)。这对于一般用户而言无所谓的。

(四)输入档案目录。这是加快档案目录信息数据库建设的一条新路，能够使更多的人员从事输入工作，但输入速度不甚理想，而且成本费用相对较高。

(五)输入目录并保存图像。

(六)输入目录、建立文本数据库。

(七)保存图像、建立文本件数据。

数据信息论文篇（10）

二、个人信息与隐私的含义，区别与联系

三、中外个人信息与隐私的案例比较与分析

四、个人信息保护的法律途径

五、个人信息民事立法的基本制度构建

其次是建立递进式惩罚性赔偿制度。我国立法已经确立了企业对个人信息和隐私的保护义务，可以在此基础上扩展为企业对个人信息的安全保障义务。对于违反企业信息安全保障义务的，确立递进式惩罚性赔偿制度。我国侵权责任法已经有惩罚性赔偿制度的规定，但由于法院在确定赔偿时过于审慎，迄今为止没有看到有影响力的适用侵权责任法关于惩罚性赔偿的民事判决案件。消费者权益保护法自立法之初即确立了对欺诈的惩罚性赔偿制度，二十年来，通过典型案例的媒体报道，在社会上有广泛的影响，是我国民事法律中发挥了较好引导作用的法律规范。而且，我国的惩罚性赔偿限于欺诈或者主观恶意，消法修改后，欺诈的惩罚性赔偿额限于实际损失三倍以下，也规避了美国司法制度中赔偿过于庞大的负面作用。因而，在个人信息侵权行为的民事赔偿方面，有必要继承前述法律已经有的成果。鉴于个人信息侵权行为往往难以证明损害后果，如果法律不规定法定赔偿标准或者计算方法，由于我国法院坚持填平式赔偿原则，实际诉讼中赔偿将延续目前较低局面而不会具有威慑力，仍然无法改变在利益驱使下泄露滥用个人信息的局面。因而，比较现实可行的是建立递进式的惩罚性赔偿制度，即对于三次以上侵犯个人信息权，或者经行政处罚或者诉讼判决侵权成立，仍然拒不改正的，法律应设定较大的法定赔偿责任，或者在按照普通民事侵权三倍以下予以赔偿，或者经由消费者保护组织起诉的，可以设定较大额赔偿，由消费者组织在受害者中予以分配。只有违法行为人了解一旦实施违法行为其法律责任将超过其获得的收益时，才可能根本上扭转个人信息过度收集，随意泄露和普遍滥用的混乱局面。

1、经公示或者告知信息收集目的，收集、应用、存储和销毁规则，并且采取合理措施履行保护个人信息避免泄露和滥用；

2、不披露具体个人的信息，也不能根据数据应用的结果反向联系或者确定到具体个人；

3、不违反隐私保护的强制性规定。

第四、建立个人信息举证责任倒置。网络时代信息由企业收集，存储于企业的服务器，用户往往难以举证，因而，在个人信息收集、存储、管理、应用和销毁相关事实发生争议时，应由服务器所有人的企业进行举证，否则维权人将因为举证不能而无法获得保护。有必要说明的是，鉴于可能泄露信息的环节可能很多，为避免企业承担过重的举证责任以及被滥用，因而举证责任倒置应该是指企业提供存储的个人信息，以及举证证明自己按照法律和相关行业标准履行了个人信息保护的软件和硬件、管理等相关标准和要求，即履行了信息安全保障的法定合理谨慎义务。

上一篇: 职工安全教育论文下一篇: 纳米科技论文