源代码 42
1 绪论
近年来,随着物联网的发展,物联网(IOT)大数据逐渐成为产业界和学术界一致关注的热点技术。相比于传统的互联网而言,物联网主要有两个明显的特点:第一,互联网仍旧是物联网的基础和核心,物联网是在互联网基础上的延伸和扩展的网络;第二,其用户端已经不是传统上的人与人之间,而是延伸和扩展到了任何物品和物品之间,人与物品之间,进行着信息交换和通讯。所以,物联网是通过无线电频率识别(RFID)技术、红外感应器、全球定位系统、激光扫描器、传感器、等信息传感设备,按合同协议,任何项目连接到互联网,信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理网络的目的。由此而来,相对于传统的互联网而言,每天产生的数据将是海量的。按照物联网协会邬贺栓院士的观点,物联网其中的大数据有以下几个特点:第一,异构多样化结构,来源广,表现方式不同,结构形式差异;第二,高增长,随着物联网的发展,各种信息量呈现几何级增长;第三,有噪音,数据为一个特定的应用程序的多样性的噪音很大,在使用前需要清洁。
从大数据的定义,是指涉及的数据量巨大,不能通过当前主流软件工具,在合理的时间内捕获、管理、处理和提供有用的信息,在此基础上的目的。大数据具有4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Veracity(真实性)。所以,迫切的需要一个准确的普遍适用的数据挖掘(Data Mining)算法来处理这些生产的数据。
1.1 物理网的研究的意义
可能在很多年以前,我们根本不敢想象有这样一个辅助工作、生产、生活和科学发展的个人电脑,更想象不到能够被联动到Internet中,一如我们在手里捧着电脑时想象不到如何能够在远端实时的一个命令就能让家里的空调、冰箱、机器人智能化的联动,等待主人到家。网络是个很神奇的东西,从我实习至今,我感受更为深刻,所以我丝毫不怀疑这样的情景的到来。IP地址(泛指Ipv4)枯竭,但是接下来的Ipv6更让我充满信心。有个研究者这么说过,“以后就是地球上的每一粒沙子都拥有他的地址”。
这些种种迹象表明,新型的IT产业的变革即将兴起,以后每种产业的发展都将会智能化。与此同时,每天的所需要整合和处理的信息、数据也是成指数的增长。可能你并没有感觉到,数据和科技正在一步步的改变我们的生活,未来。
1.2 数据挖掘的介绍
数据挖掘,顾名思义,指的是从不完整的、大量的、存在噪音污染的、模糊的、随机的应用数据中,提取隐藏在其中的、不为人知的、却具有潜在作用的知识与信息的一个过程。数据是形成知识的根源,这一点在人类的发展历史中可见一斑。事实表明,我们所谓的经验,也就是所说的知识,是通过无数次的尝试,归纳总结,并一次次运用到生活当中。而今天,我们所做的,就是通过机器算法模拟人类挖掘数据知识的过程,其效果和效率可能更优。
原始数据是可以结构化的。例如,关系数据库中的数据文本,图形,图像数据等,即使是分布于计算机网络上的异构型数据,都是可以结构化的。数学型、非数学型可以作为发现知识的实际方式,也可以是演绎方式或者归纳方式。知识的发现能够被用于数据信息的管理,优化查询、支持决策以及对过程的控制,还能够用于数据信息自身的维护和管理。数据挖掘和传统型分析之间的本质区别在于数据挖掘是在没有明确假设的条件的基础上挖掘信息,并发现知识。 面向物联网的分类研究(3):http://www.youerw.com/jisuanji/lunwen_49028.html