在90年代初,一种适用于决策支持系统数据组织与管理的技术应运而生,即数据仓库(Data Warehouse。,DW)[17]技术。伴随着数据仓库技术的出现,20世纪90年代发展起来的数据挖掘技术和联机分析处理技术为决策支持注入了新的活力。
数据仓库DW、联机分析处理OLAP和数据挖掘DM技术三者结合起来使辅助决策能力有极大的提高[18],它们应用于实际决策问题而形成的决策支持系统是一种新型的决策支持系统。这种新决策支持系统的典型特点是以数据驱动,以数据仓库中的大量数据为分析对象[19]。数据仓库本身能提供综合信息和预测信息;联机分析处理提供多文数据分析信息;数据挖掘提供所获取的知识,共同为实际决策问题提供辅助决策依据。
论文探讨了基于轨道交通AFC系统运营管理的决策支持系统、提出了在轨道交通AFC系统数据中提取IC卡数据,并利用这些数据进行轨道交通的客流特征的分析。得到的这些信息可以作为轨道交通的运营者和轨道交通规划者的参考信息,以下是数据分析中常用的分析方法。
聚类分析 (Clustering Analysis)是数据挖掘与分析领域最为常见的技术之一,用于发现数据中未知的对象类[21]。这种对象类划分的依据是“物以类聚”,即考察个体或者对象间的相似性,将满足相似性条件的个体或者数据对象划分在一个组内,不满足相似性条件的个体或者数据对象划分给不同的组。通过聚类过程形成的每一个组称为类(亦称Cluster为“簇”)。数据挖掘之前,对象类划分的数量与类型均为未知,因此在数据挖掘后一般需要对数据挖掘结果进行合理的分析与解释。
聚类方法主要包括统计学方法与机器学习方法。在统计学中的聚类分析主要研究基于几何距离的聚类。在使用上,首先定义多文空间和距离,以距离作为相似性的判别标准。在机器学习中主要体现在聚类学习的例子或者数据对象没有类别标示,需要由聚类学习算法自动计算识别。
分类分析 (Classification Analysis)是数据挖掘过程中另一种重要的类分析方法,其通过对测试数据集进行前期分析训练,再根据训练结果对大规模数据库记录进行分类预测的过程[22]。比较基本的分类算法包括判定树归纳、贝叶斯分类以及神经网络分类等,均可广泛应用于医疗诊断与性能测试等领域。
本文在研究聚类与分类技术的基础上,从系统开发的角度,探讨了数据开发的工具选择,数据仓库系统的构建,及其系统最终的测试结果,完成了轨道交通AFC运营管理数据分析系统的设计、开发任务,取得良好的经济效益和社会效益。
1.3 课题研究内容及技术路线
论文由优尔个部分组成,各部分的主要内容安排如下:
第一部分析了课题研究的背景和国内外研究发展现状,提出了论文研究采取的思路。
第二部分对轨道交通AFC系统进行了较为全面的介绍,其中主要包括AFC系统的设备的构成,AFC系统的工作流程以及AFC系统的数据结构。
第三部分对数据分析方法进行综述。本章首先介绍了数据仓库,数据仓库系统一般是由数据获取、数据仓库管理和查询分析工具三大部分组成的。然后从数据挖掘任务和数据挖掘过程两个方面对数据挖掘进行了简单的阐述。
第四部分具体提出本文的数据分析方法及数据分析过程。轨道交通AFC数据分析是一个系统的过程,需要经过数据采集、数据处理、数据分析、结果表示等流程,借助数据分析工具,利用适合的数据分析算法才能得以实现, 进行轨道交通AFC数据分析必须将数据分析的各个环节有机地结合,正确选用各类数据分析工具及算法,保证各数据处理环节科学、准确,进而建立起一套完整的数据分析系统。
- 上一篇:AT89S52单片机智能除湿器控制系统的设计
- 下一篇:PIC24FJ128GA010电子万年历设计+电路图+源程序
-
-
-
-
-
-
-
巴金《激流三部曲》高觉新的悲剧命运
浅析中国古代宗法制度
江苏省某高中学生体质现状的调查研究
上市公司股权结构对经营绩效的影响研究
g-C3N4光催化剂的制备和光催化性能研究
高警觉工作人群的元情绪...
C++最短路径算法研究和程序设计
中国传统元素在游戏角色...
现代简约美式风格在室内家装中的运用
NFC协议物理层的软件实现+文献综述