简介:数字地面模型DEM是利用一个任意坐标场中大量选择的已知X,Y,Z的坐标点对连续地面的一个简单统计表示,简而言之,DTM就是地形表面简单的数学表示。关键词DEM;高速公路;公路勘测设计中图分类号TP352文献标识码A文章编号1007-9599(2010)03-0000-02DEMAccuracyAssessmentonDifferentTerrainWuYunfeng(XinjiangGeologyandMineralResourcesBureauGeophysicalExplorationTeam,Changji831100,China)AbstractDEMdigitalterrainmodelistheuseofanarbitrarycoordinatefieldalargeselectionofknownX,Y,Zcoordinatesofpointsonthegroundinasimplecontinuousstatisticsthat,inashort,DTMissimplemathofsurfacetopography.KeywordsDEM;Highway;HighwaySurveyandDesign一、数字高程模型(DEM)概述(一)数字高程模型(DEM)的特点1.容易以多种形式显示地形信息。地形数据经过计算机软件处理后,产生多种比例尺的地形图、纵横断面图和立体图,而常规形图一经制作完成后,比例尺不容易改变,如要改变比例尺或者要绘制其他形式的地形图,则需要人工处理。2.精度不会损失。常规地图随着时间的推移,图纸将会变形,失掉原有的精度,而DEM采用数字媒介因而能保持精度不变。另外,人工方法由常规的地图制作其他种类的地图,精度会受到损失。而由DEM直接输出,精度可得到控制且不会损失。3.容易实现自动化、实时化。常规地图要增加和修改都必须重复相同的工序,劳动强度大而且周期长,不利于地图的实时更新,而DEM由于是数字形式的,所以增加或改变地形信息只需将修改信息直接输入到计算机,经软件处理后立即可实时化地产生各种地形图。(二)数字高程模型(DEM)的应用DEM作为地形表面的一种数字表达形式所具有的特点决定了DEM在勘测、摄影测量与遥感、地球科学、制图、土木工程、地质、矿业工程、地理形态、军事工程、城市规划、通讯等领域的应用日益增多,而且不断开拓新的领域。数字高程模型在公路勘测设计中的应用潜力巨大。传统的公路设计不仅需要大量费时费力的野外勘测工作,而且所设计出的公路还不可避免地具有以下几个方面地缺陷设计的方案不一定是经济、技术上的最优的;方案受人的主观影响较大;工作强度大,设计工作繁琐。在数字高程模型建立以后,不仅可以用于路线的优化,还可以用于路线设计、二维可视化、公路仿真等领域。二、不同地形区域的野外地形测量野外地形测量数据是建立数字高程模型的重要数据源,它包括平面位置数据和高程数据,笔者结合公路勘测设计的实际需要,选择几段沿公路走向的带状范围作为测量区域,这几段范围分别包含山岭、平原和丘陵这三种地貌,以便研究不同地貌条件下对数据采集和DEM精度的影响。(一)首级控制测量在测量范围内布设四等GPS—E级网作为测量的首级控制,四等控制点至少应有两个通视方向,GPS作业时应采用静态模式(常规静态或快速静态)观测。首级控制测量时最好联测已有的首级网点(四等点或者GPS—E级点),以备检核。由于公路的线路较长,在数据处理时,如果遇到控制点不在同一投影带,必须先进行坐标的投影换带计算,最后求得控制点的平面坐标。(二)图根控制测量图根点是直接提供地形图的依据,也是修测、补测地形图的依据。所以在上一等级的控制点基础上加密布设,以满足测图的需要。分别在平坦地区、山地和丘陵地带三种地形条件下所选择的实验区范围内布设图根点,在山地和丘陵地区可以适当增加图根点的密度。采用以下步骤和方法进行图根控制测量(三)碎部测量地形测量采用数字化测图,测图软件是清华三维公司的电子平板测绘系统(EPSW电子平板)。清华三维电子平板测绘系统是集扫描矢量化、数字化测绘作业、计算机成图等多种功能于一体的软件,运用该系统具有成果规范化、功效高、使用保存方便等特点,适合复杂多变地形的测绘。(四)检查点的布设与测量分别在平坦地区、山地和丘陵的实验地形条件下各布设大约63个检查点(这些点为非地形特征点,在整个实验区均匀布置),然后用全站仪和水准仪分别按较高的精度要求进行测量,用来检核DRM内插时的误差,同日寸也用来对RTK测量的三维坐标和全站仪三角高程进行精度评定。检查点使用比原始数据精度更高的数据,其对精度评定的影响可以不考虑。三、不同地形区域DEM精度评定(一)平原地区DEM精度评定由实际测量数据统计分析结果可得到以下图表在平原地区,采样间隔以20米为单位,测量结果表明,20米—100米范围内,DEM内插的采样点高程中误差随着采样间距的增大而不断增加,即表明在平原地区20米、100米范围内,DEM精度随采样间隔的增加而不断降低。间距点数最大值(cm)最小值(cm)平均值(cm)中误差(cm)20m775.2301.8640m7723.23116.287.9060m7778.3009.3214.7980m7778.309112.2117.43(表1EM模型误差统计)(图1平原地区由不同间距采样点构制的DEM误差)(二)丘陵地区精度评定由测量统计分析结果可得到在丘陵地区,采样间隔以10米为单位,10米—100米范围内,试验结果表明,DEM内插的采样点高程中误差随着采样间距的增大而不断增加,即表明在丘陵地区10米—100米范围内,DEM精度随采样间隔的增加而不断降低。(三)山岭地区精度评定由测量统计分析结果可得到在山岭地区,采样间隔以10米为单位,10米、100米范围内,试验结果表明,在10米—50米范围内,DEM内插的采样点高程中误差随着采样间隔的增大而增大,而50米、100米范围内,DEM内插的采样点高程中误差浮动范围不定,呈随机分布,不再有10米、50米范围内采样点高程中误差与采样间隔呈线性分布的规律性。四、小结在野外测量时包含特征点能显著提高DEM精度,尤其是在地形起伏较大的地区,所以测量时特征点必须测量;采样间距增加时平原地区的DEM的精度随着采样间隔的增加精度降低,但降低的幅度较慢;丘陵地区的DEM的精度随着采样间隔的增加精度相应降低;山岭地区DEM的精度随着采样间隔的增加精度逐渐降低,当达到一定程度后,DEM的精度降低的幅度就比较缓慢。总而言之,同样的采样间隔条件下,随着地形起伏的加剧,DEM的精度会相应降低。参考文献1徐其福.数字高程模型在公路勘测设计中的应用.山西科技,20022李志林.数字高程模型.武汉武汉测绘科技大学出版社,1999
简介:本文作者从实际应用出发,对现存数据挖掘决策树分类方法进行了研究,并应用到系统当中,实现了决策支持模块。关键词数掘挖掘;决策树算法;改进;实现中图分类号TP301.6文献标识码A文章编号1007-9599(2010)04-0000-02DataMiningDecisionTreeImprovement&ImplementationXiaYan,ZhouXiaohong,WangDong(ChangchunTechnologyCollege,Changchun130033,China)AbstractTheauthorstudiedonexistingDataMiningdecisiontreeclassificationmethodbasedonthepracticalapplication,andappliedtothesystem,achievedadecisionsupportmodule.KeywordsDataMining;Decisiontreealgorithm;Improve;Achieve随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将会产生重要的作用。因此,数据挖掘涉及的学科领域逐渐扩大,数据挖掘的方法也在不断地改进和提高。分类在数据挖掘中是一项非常重要的任务,分类算法可以分为决策树分类算法、遗传算法、神经网络方法、K-最近邻分类算法等。这里,以疾病防控与儿童免疫管理系统中决策支持子系统的开发过程为例,对决策树分类算法的改进及在实际中的应用进行阐述。一、数据选取和数据预处理在本系统中,以预防接种中遇到异常反应后记录的“异常反应调查表”中的数据为例进行说明。具体实现过程详细说明首先输入训练集,由于在真实的SQLServer数据库当中,为了降低存储要求和减少存储时间,并非真正存储每个数据项的属性值,而是用存储数字来对应相应的意义,如在数据库的数据表中,“性别”字段中“1”代表“男”、“2”代表“女”,反应到程序页面时再映射回原来的值,为了说理清晰又限于篇幅,这里只将所有数据集中有代表性的十几组数据作为分类模型创建的输入训练集。表1判断是否需要计划外加强免疫的属性表儿童编号月龄出生状态常住地上次注射后反应是否需要计划外加强免疫0405102<=2正常产城市无不良反应否0405495<=2正常产农村无不良反应否0401342>5正常产城市无不良反应是04054352…5正常产城市轻度反应是04065342…5非正常产城市重度反应是04072342…5非正常产农村重度反应否0401544>5非正常产农村重度反应是0408519<=2正常产城市轻度反应否0404566<=2非正常产城市重度反应是04035472…5非正常产城市轻度反应是0401534<=2非正常产农村轻度反应是0405856>5正常产农村轻度反应是0409533>5非正常产城市无不良反应是04053442…5正常产农村轻度反应否二、生成决策树对训练集的每一个属性,计算其信息增益。以“月龄”属性为例,每个结点中的正反例的个数分别为[2,3]、3,2、4,0,分别计算如下info2,3==0.971;info3,2==0.971;info4,0=0;计算信息熵E(月龄)==0.693;计算该属性的信息增益量,选取信息增益最大的属性为节点,按该属性的值划分数据集合Gain(月龄)=Info(9,5)-E(月龄)=0.940-0.693=0.247;同理,对“注射反应”属性、“出生状态”属性、“常住地”属性都可计算每个结点的正反例的个数(由于篇幅有限,不作计算)。通过对各属性信息增益的计算结果,选择“月龄”属性作为根节点,然后划分“月龄<=2”的所有可能性。计算当“月龄<=2”时,“注射反应”、“出生状态”、“常住地”的信息增益值Gain(注射反应)=Info(2,3)-E(注射反应)=0.971-0.4=0.571;Gain(出生状态)=Info(2,3)-E(出生状态)=0.971-0=0.971;Gain(常住地)=Info(2,3)-E(常住地)=0.972-0.951=0.020;同理考虑“月龄>5”的情况,由于“月龄>5”时,各个节点都是纯节点,所以不再划分。三、产生决策规则遍历决策树,输出叶结点类属性值,用IF—THEN形式表达为IF(月龄2…5AND注射反应=无)THEN(类别=是)IF(月龄2…5AND注射反应=轻)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=正常产)THEN(类别=是)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=城市)THEN(类别=否)IF(月龄2…5AND注射反应=重AND出生状态=非正常产AND常住地=农村)THEN(类别=是)……依此类推,共可产生十三条规则。四、决策支持子系统的分析用上述基于决策树的分类算法所得到的模型生成的规则来预测测试集中的未知数据属于哪一类,并通过该模型的测试结果与实际情况相吻合的准确率来判断该决策树是否有效。首先,用整个数据集中2/3的数据作为训练集按照基于决策树的分类算法来建立模型,生成一棵决策树。然后,用余下的1/3的数据作为测试集,通过创建的模型进行预测,并将预测结果和实际值进行比较。如果准确率达到或超过事先确定的阈值,则可以认定该模型对于数据分类是有效的,能够在实际中应用;反之,则认定该模型的分类效果不好,需要按以上步骤来重新判断,直到分类准确率达到预定的阈值为止。在本系统中,经过测试预测准确率已达到87%,在可以接受的范围内,所以算法是有效、可行的。参考文献1陈文伟,黄金才.数据仓库与数据挖掘.人民邮电出版社,20042王万森.人工智能原理及应用.电子工业出版社,20003范明,孟小峰.数据挖掘——概念与技术.机械工业出版社,2001作者简介夏琰(1980-),女,吉林长春人。长春职业技术学院信息技术分院,教师,讲师,硕士,研究方向为计算机应用。