基于聚类的时空数据有损压缩算法(2)
时间:2021-05-05 10:14 来源:毕业论文 作者:毕业论文 点击:次
数据压缩共分为有损和无损两大类。有损一般是采用线性拟合的方法,而无损则通过各类近似霍夫曼编码的方法进行数据压缩。有损压缩的精髓主要是如何抽取特征点,以特征点的连线来近似地表示(拟合)原始数据曲线。 2 地理坐标点定义 struct Data { long long time; double longtitude; double latitude; double altitude; }; 其中time代表安装在移动个体上的采集器上传的绝对时间,longitude,latitude,altitude分别代表的是该个体在当前时刻所在空间位置的三个坐标,因此同一采集器的一组按时序排列的Data可以看作是个体在一段时间内的位移轨迹。 采样率:采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,单位用赫兹(Hz)来表示。 3运行以及编译环境文献综述 3.1运行环境 英特尔®酷睿I3四核处理器E7500 (2.93GHz/1066FSB/3M 二级缓存,32bit OS) 3.2编译环境 Microsoft Visual Studio(简称VS)是微软公司的开发工具包系列产品。VS是一个基本完整的开发工具集,它包含了整个软件生命周期中所需要的大部分工具,如UML工具、代码管控工具、集成开发环境(IDE)等等。所写的目标代码适用于微软支持的所有平台,包括Microsoft Windows、Windows CE、.NET、Framework、.NET Compact Framework和Microsoft Silverlight 及Windows Phone等。 4算法分析 4.1概述 本问题是针对GPS系统所衍生出的数据量庞大问题,本算法将对空间曲线取出特征点,对原曲线进行近似描述。 4.2详细描述 GPS系统将使用传感器对位置信息进行采集,在规定的时间内采集一次,生成一组数据,这组数据由一个空间的三维坐标和一个时间标识所组成。GPS通过持续时间对汽车运动进行采集,可以连成一条连续的曲线,而做到这一点取决于人类视觉,也就是说人类视觉所能看到的最小的距离,若能找出一球心,以有损压缩阈值为球的半径,球内的点将统一由球心所代替。 4.3决策论文网 将球心点代替周围的近似点。 5算法概要设计 5.1核心基础设计 5.1.1压缩算法用例 功能:实现数据的压缩; 前置条件:输入数据、阀值 主成功场景: 1.判断所有地理坐标点是否都被划分 2.从为未被划分的地理坐标点中选择合适的一点作为球心点 3.根据这一点球心和阀值来寻找,根据球心点和阀值为半径,寻找属于这一球内的 点 4.将(3)中寻找到的球内的点都用(3)中球心点代替,并将找出的点设置为已划分 5.输出结果数据到磁盘 扩展场景: 1号步骤失败,进行5步; 3号步骤失败,进行步骤1; 5.1.2解压算法用例 功能:实现上述压缩算法的反压缩操作 前置条件:输入带解压的数据、数据个数、时间间隔 主成功场景: 1.判断所有地理坐标点是否被完全解压。 2.从未被解压的地理坐标点中选取一个地理坐标点,作为球心 3.将(2)中点所代表的地理坐标点都解压出来,并设置已解压的标记 4.对解压出的点按时间戳进行排来~自^优尔论+文.网www.youerw.com/ 5.输出结果解压地理坐标点到文件 扩展场景 步骤1失败,进行5; 5.2核心算法示意图 按照一定的距离把距离相近的点聚类,并找出聚类数据中最合理的中心点,以此中心点为特征点,抽取所有的特征点,用特征点近似表示原始数据。 (责任编辑:qin) |