C#交通数据采集及整理方法的设计与实现(11)
时间:2016-11-24 21:22 来源:毕业论文 作者:毕业论文 点击:次
在经过错误数据的修复以及数据校验之后,则认为该数据已经可以作为交通预测模型的输入条件,并对预测结果的精度不会有太大的影响。 3.3 多元回归分析法 3.3.1 多元回归分析模型介绍 多元回归模型是这几年比较流行的应用比较广泛的,适合不确定性、非线性的动态系统的非参数建模方法。多元回归模型脱胎于混沌理论,最初是用来预测混沌系统中的轨迹行为的。SMITH在1995年时首次将多元回归模型应用于单点短时交通流预测。 多元回归模型的应用场合时:不需要先验知识的,只需要有足够的历史数据。主要是通过寻找历史数据中与当前时刻相似的“近邻”,用这些“近邻”来预测下一个时刻的流量。也就是通过查找历史数据库,找出与当前状态相似的历史装条,用与当前状态相匹配的历史状态来进行预测。 多元回归模型是一种无参数的、可移植的、预测精度较高的模型。多元回归模型能够应用于复杂的环境,可以在不同路段上进行预测。多元回归模型的优点是可移植性型较强,预测精度较高,对于应对突发事件的能力比较强。但是由于需要对历史数据库进行搜索,所以模型需要的数据量比较大,系统运行的效率也比较低,预测的速度也比较慢。 多元回归模型的方法主要有以下几类:核函数法、K邻域法、小波法、样条法四类。其中核函数法主要应用在密度估计或者需要密度估计得随机样本回归,而K邻域法多用于空间估计的样本回归,另外两种方法:小波法、样条法主要应用在信噪分离解释的回归,由于后面两种方法的计算复杂度较高,很难满足对交通流的预测的准确性与可靠性,因此在交通流的预测领域,主要应用的多元回归的方法是核函数法和K邻域法。 多元回归模型的五大要素分别是:历史数据的准备、状态向量的选取、相似机制的选取、近邻机制的选取、预测函数的选取。 (1) 历史数据的准备 原始数据处理中提到的原始数据处理的重要性,历史数据的准备是多元回归模型的第一步也是比较关键的一步,对于模型的预测效果和精度会产生一定的影响。历史数据的状态全面性要求较高,要求覆盖系统所有的状态,从而可以确保在进行“近邻”搜索时能够搜索到一定数量的“近邻”。 (2) 状态向量的选取 状态向量是指与预测变量相关的最小个数的状态变量组成的向量。与预测变量相关的状态变量可能有很多,为了能够在预测精度与精度之间达到一定的平衡,因此必须恰当地选取状态向量的个数。 (3) 相似机制的选取 相似机制是指如何来判断当前节点和历史数据库中的节点的相似度,相似机制的选取是多元回归模型中比较重要的一个步骤。“近邻”的要求必须是相似度达到一定的要求。 (4) 近邻机制的选取 近邻机制的选取是多元回归模型的最为重要的概念。近邻机制主要是判断历史数据库中哪些点能够成为当前节点的近邻。只有近邻的选取合理准确,才能够使预测模型的精确度达到一定的要求。 (5) 预测函数的选取 这一步是多元回归模型的最终预测步骤,合理利用选取好的“近邻”来预测下一个时刻的值。常用的预测方法有:平均值法和加权平均法等。 3.3.2 应用K邻域法的多元回归预测模型 该模型的主要由四部分组成:历史数据的准备、样本数据的生成、状态向量的定义以及变K近邻。算法的框架如下图所示。 (责任编辑:qin) |