数据分析研究基于QGIS的城市交通分析系统_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

数据分析研究基于QGIS的城市交通分析系统

本文着眼于城市中日益严重的交通问题,以出租车为主要研究对象,力图研究出租车在城市中的分布规律以及流动规律并开发一套可以可视化展示这些规律的系统。本文通过统计和聚类(TRACLU)的方法对上述问题进行了分析研究,得出了不同时段出租车分布所遵循的规律。此外,本文还对两种地图匹配算法ST-Matching和 IVMM 进行了介绍和比较,并提出了对于这些算法的一些改进,得到了很好的效果。在此基础上,结合 QGIS开发了一套交通数据分析系统。本文所做工作是复杂网络理论应用于交通领域研究的基础性工作,为后续研究提供了极大便利。27589
毕业论文关键词 轨迹聚类 地图匹配 数据展示 道路网络
Title Data Analysis and Research — An Analytic Systemof City Traffic Based on QGISAbstractThis paper focus on the increasingly serious city traffic problems, trying to findout the regular patterns of taxi in distribution and tendency, and developing ananalytic system to visualize the regular patterns. Using statistic andclustering(TRACLU) methods, some regular patterns of taxi in distribution arefound. In this paper, two Map-Matching algorithms, ST-Matching and IVMM, areintroduced and compared, at the meantime, some improvements are made which showgood results. Beyond that, an analytic system was developed to visualize theregular patterns based on QGIS. These work is the base of transportation researcharea and can make it easier for further research.Keywords Trajectory Clustering Map Matching Data Visualization Road Network
目 次
1 引言  1
2 G P S 数据处理  2
2 . 1 G P S 初始数据处理  2
2 . 2 “飞点”的处理  2
2 . 3 密集点的处理  4
3 地图匹配  7
3.1 基于动态规划的地图匹配算法(ST-Matching)  8
3.2 基于统计的地图匹配算法(IVMM)  14
3.3 对现有算法的改进  17
3.4 两种算法效果的比较  19
3.5 Cell-Index  20
4 交通数据分析  2 1
4 . 1 出租车分布情况分析  2 1
4 . 2 轨迹聚类  2 4
4 . 3 轨迹聚类结果分析  3 1
5 数据展示系统的介绍  3 4
5 . 1 数据库  3 4
5 . 2 数据访问层  3 5
5 . 3 业务逻辑层  3 5
5 . 4 表示层  3 5
结论  3 9
致谢  4 0
参考文献  4 1
1 引言随着我国经济的飞速发展,城市化水平的提高,北京、上海等大城市的汽车保有量每年仍处于增长态势。从国家统计局公开的资料可以看到,北京市私人汽车拥有量 2012 年为405.55 万辆,到 2013 年这一数字就增长到了 424.95 万辆,短短一年的时间里增加了 19.4万辆。相同时间内,北京市的公路里程只是从 2012 年的 2.15 万公里,增加到了 2013 年的2.17 万公里,只增加了 200 公里。仅仅面对高速增长的私人汽车拥有量,公路的建设速度已经远远落后。这样的情况导致北京市单位里程的汽车密度逐年增加,交通压力也与日俱增。同时,再加上城市规划,交通体系设计,交通疏导等措施的不完善,导致了许多因为交通而引发的问题。例如城市交通拥堵,道路车辆的能源消耗与污染排放超标,交通服务不完善导致的服务资源分配不均等。这些问题已经越来越成为如今社会发展所无法回避的问题,甚至必须解决的问题。因为他们在一定程度上已经成为社会进一步发展的阻碍。例如城市交通拥堵导致道路的设计时速和设计单位时间车流量远远低于实际情况,造成建设资源的浪费,同时也给人们的出行带来了很大的不便。从上述涉及的种种问题来看,交通方面存在着很多需要改进的地方。本课题力图从众多问题中选取一个进行深入研究。经过对相关文献的阅读与分析,结合对现有知识储备以及可获得资源的估计,决定主要以出租车为研究对象,主要研究出租车在不同时段不同路段的分布情况,以及不同时段的流动趋势,为课题的后续研究,如出行路线的推荐,路段通行时间估计等打好基础。对出租车分布情况的研究,首先需要对车载 GPS 系统获得的数据进行处理,去除明显偏离实际情况的数据,得到合适的轨迹。然后将这些轨迹通过地图匹配算法匹配到电子地图的道路上,从而把近似自由空间下移动物体的分析转化为道路网络中移动物体的分析,简化研究的复杂度。进行地图匹配之后,就可以比较精确的统计各个路段上出租车的分布情况。对出租车流动趋势的研究,使用了轨迹聚类算法,可以从全局的角度得到出租车流动趋势。最后,使用了QGIS 作为数据展示平台,使得数据可以生动的展示出来,便于理解。本文章节概述如下:第二章介绍了对从出租车获得的 GPS 数据点原始数据进行处理的方法;第三章介绍了两种地图匹配的相关算法,以及对已有算法的一些改进,并且比较了两种算法;第四章对交通数据进行了分析并介绍了出租车轨迹聚类的算法框架;第五章介绍了数据展示平台的使用方法。2 GPS 数据处理定义一:GPS 点。一个 GPS点是一个三元组,分别记录此点的经度,纬度和时间。定义二:GPS 轨迹。一条 GPS 轨迹 T 是一个 GPS 点的序列 n p p p     2 1 ,而且相邻 GPS 点之间的时间差不会超过一个确定的阈值 T  ,也就是说,对于任意 T pi ,必有T t p t p i i     . . 0 1 。出租车车载 GPS 系统可以获取出租车在不同时刻的 GPS数据。 GPS 数据可以用来描述出租车在地球上的位置,通过一系列GPS点即可描述出租车的运动情况,从而为研究出租车的分布及流动趋势提供可能。但是,车载 GPS 存在记录点的精度不高,容易受到外界环境影响从而严重影响精度的情况,所以需要对原始的GPS数据进行处理,尽可能消除上述情况的影响,得到尽量准确的 GPS 点序列,即 GPS轨迹。2.1 GPS 初始数据处理车载 GPS 系统开启时,系统会初始化,在没有收到 GPS 信号的时候仍然会记录此时的GPS 点信息,但是这些信息只是系统的初始化数据,并非车辆的真实位置信息。如13331063427,2000-12-31 16:00:00,376.4250793,59.2265129 是从编号为 13331063427 的出租车车载 GPS 获取的 2013 年 10 月 17 日的数据,但是此数据的日期时间显然不是我们获得此数据的时间,而且得到的经纬度也并非符合规范的数值且远远偏离北京市的地理经纬度范围,所以可以判定其为系统初始化时记录的信息,需要被过滤。2.2 “飞点”的处理“飞点”是 GPS数据处理中常见的一种现象,即某一 GPS点与时间戳临近的点之间距离相差很大,如图 2.1 中点P2即为飞点。 (责任编辑:qin)