C#交通数据采集及整理方法的设计与实现(8)
时间:2016-11-24 21:22 来源:毕业论文 作者:毕业论文 点击:次
(2) 传输线路的故障。在线圈采集到数据之后会用过特定的通讯设备将数据传输到数据接收端,在这个过程中,由于线路被破坏,或者受到一定的干扰,都会造成数据在传输过程中丢失过着出现数据失真。 (3) 突发的交通事故或认为因素造成的交通状况。这种突发情况的发生会使得交通流出现异常的波动,但是这种异常的波动属于真实的交通状况,我们称之为异常数据。 结合错误数据产生的不同原因,我们分析交通数据的错误表现,可以将错误数据分成3类: (4) 数据缺失:数据缺失是指在数据接收端拿到的原始数据中,某一个或者多个线圈在一定的时间段内没有数据。数据缺失的表现形式主要是在数据库中该线圈的流量、速度、车流密度的值均为0 (5) 数据失真:数据失真也叫数据错误,是指数据与真实的数据不相符,这类数据的外在数据形态与正常的数据并无太大的差别,但是并不是交通状况的真实反映,不能用来进行预测。 (6) 数据异常:数据异常是指数据不同正常情况的,较之正常情况出现一定的波动,这种情况的产生通常是由于突发交通事故或者人为造成的交通状况等,数据异常并不是数据的失真,是交通状况的真实反映。 3.1.2 错误数据的基本特征 交通数据存在时间跟空间特征,所谓的时间特征是指数据在时间段内表现出来的基本特征,而空间特征是指错误数据产生的地点特征。分析3种错误数据的时间跟空间特征,可以看出它们表现出来的不同区别,如表3.1所示。 交通预测模型的预测精度要求较高,预测结果的精度越高越能符合真实的交通状况,才能更好的为交通诱导和交通控制提供准确的数据支持。由于原始数据中错误数据的存在,这种错误的数据并不是交通状况的真实反映,假如不经过数据的处理,就将原始数据作为预测模型的输入,必然会对预测结果的精度产生影响,因此对于原始数据的处理显得很重要。 表3.1 错误数据的类型及特征 类型 数据缺失 数据失真 数据异常 空间 特征 一个或者多个数据采集点 一个或者多个数据采集点 一个检测点异常 时间特征 一个或者多个检测时段 一般是短期内数据失真 瞬时或者较短时间段内数据异常 由于不同的原因造成的数据错误类型也不尽相同,它们也各自表现出来的不同的时间跟空间特征。根据错误数据表现出来的不同时空特征,本文提出了的不同的数据处理方法,对原始数据进行判断并加以修复,使之能够达到作为预测模型的输入数据的要求,从而保证了预测结果的精度。 3.1.3 错误数据的判断 由于错误数据在数据库中的表现形态与正确的数据的表现形态并没有太大的区别,所以针对错误数据的判断,我们主要是通过交通流三个参数之间的关系来判断,我们分析表3.2中的几种情况 表3.2 三参数之间的关系 编号 参数形式 错误判断 处理方式 1 Q≠0,V=0,O=0 错误 修正 2 Q=0,V≠0,O=0 错误 修正 3 Q=0,V=0,O≠0 错误 修正 4 Q≠0,V=0,O≠0 错误 修正 (责任编辑:qin) |