热门搜索 :
考研考公
您的当前位置:首页正文

数据挖掘在基于GIS自动导航系统中的应用

来源:伴沃教育
维普资讯 http://www.cqvip.com

2007年9月 第28卷 第9期 韶关学院学报・自然科学 oumal of Shao ̄uan University・Natural Science Sep.2007 Vo1.28 No.9 数据挖掘在基于GIS自动导航系统中的应用 黄学宏,彭昕昀 (韶关学院信息工程学院,广东韶关512005) 摘要:车辆自动导航系统是智能运输系统的一个重要组成部分.提出了一种数据挖掘的复合聚类分析算法,结合 GIS系统在自动导航系统中线路设计方面的应用进行分析.实验证明这种复合聚类算法比传统的算法更加有效. 关键词:数据挖掘;地理信息系中图分类号:TP311,13 (GIS);复合聚类分析算法;自动导航系统 文章编号:1007—5348(2oo7)o9—0017—03 文献标识码:A 数据挖掘(Data Mining,DM)是一个从大量的数据中抽取出潜在的、有价值的知识(模型或规则)的过 程….有许多种DM方法,聚类分析方法是其中的一种.这种方法把每个分类对象称为样品,并根据对象的 性质和分类的目的选定若干指标(变量),对每一个样品测出所有的指标值,将得到的结果列一个数据矩阵, 这个资料矩阵是聚类分析的出发点 』. K均值聚类算法是最常用的划分方法之一,首先从n个数据对象任意选择k个对象作为初始聚类中 心,其他对象则根据它们与这些聚类中心的相似度(距离),分别分配给与其最相似的(聚类中心所代表的) 聚类;然后计算每个所获新聚类的聚类中心(该聚类中心中所有对象的均值),不断重复这一过程直到标准 测度函数开始收敛为止.这种算法使各聚类本身尽可能紧凑,而各聚类之间尽可能分开.只是它不适合用 于发现非凸性状的聚类,或具有各种不同大小的聚类,对异常数据也很敏感.但是基于密度的聚类方法却能 够帮助发现具有任意形状的聚类,并且仍然需要用户设置可帮助发现有效聚类的参数 J. 本文提出了一种复合聚类算法,将 均值算法的思想与基于密度的方法相融合,把定义在欧氏空间的 K均值聚类分析算法,推广到非欧氏空间,因而扩大了应用范围,同时能够获得更精确的聚类效果.将这种 算法用于地理信息系统(cIS),利用GIS提供的车辆数据进行车辆全球定位线路的自动设计.分析结果表 明,该方法在GIS数据挖掘中有良好的效果,因而具有实际的意义. 1 CIS的系统组成和功能 GIS即地理信息系统,是在计算机硬、软件系统支持下,对现实世 空间分析 界(资源与环境)各类空间数据及描述这些空间数据特性的属性进行 采集、储存、管理、运算、分析、显示和描述的技术系统.地理信息系 坐标数据、属性数据以及以此为基础而演义出来的知识. 图1表示了GIS的组成,它由5个主要的元素——硬件、软件、数 据、人员和模型构成. 硬件,主要是指GIS所依托的计算机系统,它包含从中央计算机 计 统中的“地理”并非指地理学,而是广义地指地理坐标参照系统中的 机 系 统 算 数 据 库 系 统 地图可视化 图1 GIS的组成 服务器到PC机,从单机到网络环境;GIS软件提供所需的存储、分析 和显示地理信息的功能;数据,GIS系统中最重要的是数据,GIS系统 收稿日期:20O7—06—12 作者简介:黄学宏(1948一),男,广东梅县人,韶关学院信息工程学院副教授。主要从事数据挖掘技术的研究 维普资讯 http://www.cqvip.com

・l8・ 韶关学院学报・自然 必须建立在准确使用地理数据基础上,数据来源包括从商业组织购买,以及从其他数据的转换.数据分为空 间数据、属性数据,并与关系数据库相互连接;GIS人员,GIS应用的关键是掌握实施GIS来解决现实问题的 人员的素质,GIS的用户包括设计、维护系统的技术专家,以及使用该系统完成工作任务的人员;模型,GIS的 专业模型和专家的经验,是GIS应用系统成败的至关重要的因素 】. GIS系统的主要功能包括:(1)数据输入、存储、编辑;(2)操作运算;(3)数据查询、检索;(4)应用分析; (5)数据显示、结果输出;(6)数据更新. 利用GIS应能回答和解决以下5类问题:(1)定位( ̄_ation):对象在何处?(2)条件(Condition):即满足 一定条件的实体在哪里?(3)趋势(Trends):从何时起发生了哪些变化?(4)模式(Patterns):即在某个地方 的空间实体的分布模式.模式分析揭示了地理实体之间的空间关系;(5)模型(Modeling):即某个地方如果具 备某种条件会发生什么,通过基于模型的分析实现. 2复合聚类分析算法 设Z= ,z ,…, }c R 为一有限数据集合,/7,是数据集中元素的个数,将该数据集中的数据分为k 类(1<k<,1),则z将被划分为 个/7,×k的分类区域U={u }∈ “,k的确定是根据不同对象的需要. 对于每一个小区域 ,,按照密度计算法选取凝聚点: V Cl, (C <C2)为球半径,通常C2=2C,, S(i, )=I Z( )一Z(j)I, (1) 式中Is(i,.『)为两样本点Z( ),Z(j)之间的距离. (1)如果.s( ,-『)≤C (样本点落入C,球域),则计算落入C 球域的样本点,再选择密度最大的样本点 作为第一凝聚点P,. (2)对于密度次大的样本点,如果S(P,, )≤C (样本点落入C 球域),则忽略此样本点,如果Is(P , ) ≥c (样本点不落入c:球域),则选择此样本点作为第二凝聚点P . 这样,按照样品密度由大到小一直选下去,每次和已选的任一凝聚点的距离不小于c 的样品作为新的 凝聚点. 对于以上所求得的凝聚点再求平均密度中心利用重心连接算法公式: , ・ ^ ・ ^ 、 ( , )=(…i1∑ 1∑ ),i:1 一i  (2) 其中 , 是样本点互的横坐标和纵坐标. 车辆自动导航系统是智能运输系统的重要组成部分,自动导航系统的应用将大幅度提高道路的通行能 力,缳解交通拥挤和阻塞.GIS在车辆自动导航系统中发挥着重要的作用,GIS条件下的电子地图数据库为车 辆自动导航系统提供了存放和管理自动导航信息的一个可视化载体.GIS在车辆自动导航系统中的应用研 究将会成为智能运输系统的一个重要的发展方向.车辆自动导航系统中的一个重要部分就是车辆的行驶路 线的设计,下面两幅图是在二维平面上GIS中车辆行驶路线设计的结果,图2是采用复合聚类分析方法在 Matlab中实现的结果,图3是采用传统的基于密度的方法所得的聚类结果.比较这两幅图可以看出,复合聚 类分析方法比传统的基于密度的方法设计的行车路线要清晰明朗. 3 DM和GIS在车辆自动导航系统中的应用 针对交通信息、交通系统的不确定性,在传统的基于数据库、知识库和模型库的决策支持系统基础上, 采用数据仓库、联机分析、数据挖掘以及专家系统的有关理论与技术,构建出新一代的智能决策支持系统模 维普资讯 http://www.cqvip.com 9 宏,等:数据挖掘在基于GIS自动导航系统中的应用 ・l9・ 型;应用数据挖掘方法(统计模式识别、神经网络方法、遗传规划和多源复杂信息知识挖掘技术等),研究建 立适合交通信息挖掘的具体模型;在信息分析技术方面,突破传统的基于经典数学的统计分析方法的局限 性,全面引入神经计算、模糊计算、进化计算等智能计算技术,为交通信息的综合管理、智能分析和实时决策 支持提供可行的方案. 经度,。 经度,。 图2 复合聚类方法的聚类结果 圈3 密度聚类方法的聚类结果 本文的实例数据来自于GPS,通过SQLSERVER建立专门的数据库,对数据进行存储、组织和管理.利用 SQL SERVER建立数据库时,设定相应的规则,保证数据的有效性、安全性和完整性. 该数据库仅含1张表,表中的每条记录有5个字段,分别为Number(编号)、ia(车辆名称)、tat(纬度坐 标)、I_ong( ̄度坐标)、Date(日期)、Time(时间),这样每条记录都完整地记录着某辆车在某一个时刻的确切 位置.所用的地理信息系统的软件为MapInfo,在MapInfo中调用sQLSERVER中的数据,并且利用MapInfo中 提供的工具去除不必要的数据,对空间数据进行处理后,可以将数据库中包含的所有的车辆的位置,描到电 子地图的相应地点.由于数据量非常庞大,所以需要采用DM的方法从数据库中提取有价值的信息.下面以 自动导航系统中车辆行驶路线的设计为例来说明DM如何应用在GIS中,主要步骤如下: (1)获取数据.从卫星上得到所有加入到自动导航系统中的车辆的分布数据. (2)选取样本数据.例如,选择任意的两个城市,并导出该区域所包含的数据. (3)聚类分析.用前面所介绍的复合聚类算法进行聚类分析,提取能确定最优路线的数据,最终将所得 数据所确定的路线,在地图中以描点的方式显示出来. 因为从GPS得来的自动导航系统的车辆分布数据是随机的,所以通过测试数据量、样本排序将数据进行 预处理,再进行区域分割,经多次试验证明k的选取与n有关,至少保证每个 内样本点数大于lO.如果样 本点太少,聚类效果不明显;反之,如果样本点数太多的话,设计的路线将会失真.我们取的两个城市之间的 样本点为l 908,取k=120,试验证明,此时的聚类效果最好. 4结论 本文提出了复合聚类的方法,这种方法在初始的时候设定多个聚类中心,这样的初始中心在数据的空 间分布上是很广泛的,具有多样性的特点.这种特点使得最初的聚类基本上能保证每个小区域 有一个密 度中心,再根据适当的准则在小区域 找出几个子中心,删除冗余数据;然后计算这个区域 f的平均密度中 心,来修正原来的密度中心.事实证明,这种方法在基于GIS的自动导航系统中非常有效. (下转第68页) 维普资讯 http://www.cqvip.com

・68・ 韶关学院学报・自然科学 参考文献: [1]廖常初.PIE基础及应用[M].北京:机械工业出版社,2003. [2]殷洪义.可编程控制器选择设计与维护[M].北京:机械工业出版社,2OO2:24—49. [3]王永华.现代电气控制及PIE应用技术[M].北京:北京航空航天大学出2003:80—96 Realizes wrappage examination、vith PLC on the ZB45 packaging machine UU Zhen。wen (sh删Cigarette Factory,China Tobacco Guangdong Industrial Corporation,Shaoguan 5 12026,Guangdong,China) Abstract:Uses the PIE programming control to realize on the packaging machine wraps separately(packing to have flaw smoke package)to e】 ne.The ZIM5 packaging machine when the production process,wraps eparsately he teDs..8or ex— amines has wraps eparsately the smoke the output signal,wraps separately he’tsignal and he tposition transmiter counting sin ̄ignput gives PLC,the sinagl after the PLC processig,tnhe PLC output rejection signal for the packaging machine rejection system,will wrap eparatsely hte soke usimg nhe tpackagig nmachine ection sstyem to rejeCt,thus realized has wrapped eparsately the goal which the soke rmejected. Key words:PLC control;wrappage examination;rejection system (责任编辑:颜志森) e穹 e 奢 、 e s s e 螽 螽 螽 螽 螽 、 (上接第l9页) 参考文献: [1]Bing Hu.Knowledge Discovery and Data ̄ing[J].21世纪青年科学论坛,2001,19(6):70—74. [2]朱明.数据挖掘[M].合肥:中国科学技术大学出版社,21302:28. [3]Wang X Z.Data Mining nd aKnowledge isDcovery for Process Monitoring and Control[M].London:Sprig—Vernbs limited,1999:134— 136. [4]朱勇华,邰淑彩,孙韫玉.应用数理统计[M].武汉:武汉水利电力大学出版社,1999:362—376. [5]龚健雅.当代GIS的若干理论与技术[M].武汉:武汉测绘科技大学出版社,1999. Data瑚 in auto navigation system on base GIS HUANG Xue—hong,PENG Xin—ytm (Instiutte of Information Engineerig,Shaoguann University,Shaoguan 512005,Guangdong,China) Abstract:The vehicle auto navigation system is one of he timportant parts f ohe itntelligent transportation sstyem.The pa— per gives a mulitplex clusterig anlgorithm of data digging,and analyze a new application in the design of he rtoute with he geogrtaphical information system Experiment has proved such compound cluster’S algorithm is mole effective than the tradiitonal ̄,oirthm. Key words:data ̄mng;geographical information system(GIS);mulitplex clustering algorihtm;auto navigation system (责任编辑:胡伶俐) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top