基于聚类的时空数据有损压缩算法(2)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

基于聚类的时空数据有损压缩算法(2)

    数据压缩共分为有损和无损两大类。有损一般是采用线性拟合的方法,而无损则通过各类近似霍夫曼编码的方法进行数据压缩。有损压缩的精髓主要是如何抽取特征点,以特征点的连线来近似地表示(拟合)原始数据曲线。

2 地理坐标点定义

struct Data

{

long long time;

double longtitude;

double latitude;

double altitude;

};

    其中time代表安装在移动个体上的采集器上传的绝对时间,longitude,latitude,altitude分别代表的是该个体在当前时刻所在空间位置的三个坐标,因此同一采集器的一组按时序排列的Data可以看作是个体在一段时间内的位移轨迹。

    采样率:采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,单位用赫兹(Hz)来表示。

3运行以及编译环境文献综述

3.1运行环境

英特尔®酷睿I3四核处理器E7500 (2.93GHz/1066FSB/3M 二级缓存,32bit OS)

3.2编译环境

      Microsoft Visual Studio(简称VS)是微软公司的开发工具包系列产品。VS是一个基本完整的开发工具集,它包含了整个软件生命周期中所需要的大部分工具,如UML工具、代码管控工具、集成开发环境(IDE)等等。所写的目标代码适用于微软支持的所有平台,包括Microsoft Windows、Windows CE、.NET、Framework、.NET Compact Framework和Microsoft Silverlight 及Windows Phone等。

4算法分析

4.1概述

     本问题是针对GPS系统所衍生出的数据量庞大问题,本算法将对空间曲线取出特征点,对原曲线进行近似描述。

4.2详细描述

    GPS系统将使用传感器对位置信息进行采集,在规定的时间内采集一次,生成一组数据,这组数据由一个空间的三维坐标和一个时间标识所组成。GPS通过持续时间对汽车运动进行采集,可以连成一条连续的曲线,而做到这一点取决于人类视觉,也就是说人类视觉所能看到的最小的距离,若能找出一球心,以有损压缩阈值为球的半径,球内的点将统一由球心所代替。

4.3决策论文网

将球心点代替周围的近似点。

5算法概要设计

5.1核心基础设计

5.1.1压缩算法用例

功能:实现数据的压缩;

前置条件:输入数据、阀值

主成功场景:

1.判断所有地理坐标点是否都被划分

2.从为未被划分的地理坐标点中选择合适的一点作为球心点

3.根据这一点球心和阀值来寻找,根据球心点和阀值为半径,寻找属于这一球内的 点

4.将(3)中寻找到的球内的点都用(3)中球心点代替,并将找出的点设置为已划分

5.输出结果数据到磁盘

扩展场景:

1号步骤失败,进行5步;

3号步骤失败,进行步骤1;

5.1.2解压算法用例

功能:实现上述压缩算法的反压缩操作

前置条件:输入带解压的数据、数据个数、时间间隔

主成功场景:

1.判断所有地理坐标点是否被完全解压。

2.从未被解压的地理坐标点中选取一个地理坐标点,作为球心

3.将(2)中点所代表的地理坐标点都解压出来,并设置已解压的标记

4.对解压出的点按时间戳进行排来~自^优尔论+文.网www.youerw.com/

5.输出结果解压地理坐标点到文件

扩展场景

步骤1失败,进行5;

5.2核心算法示意图

    按照一定的距离把距离相近的点聚类,并找出聚类数据中最合理的中心点,以此中心点为特征点,抽取所有的特征点,用特征点近似表示原始数据。 (责任编辑:qin)