一、大数据概念文献综述
大数据(big data),指在一定的时间范围内不能用常用的数据处理工具来收集、处理、运用的数据集,是需要借助新的处理工具来进行挖掘的数据集合。“大数据”主要有四个特征,即我们俗称的4V,第一个V(volumes),指他的数据体量大,是庞大的数据汇合,大小在10TB左右,在实际生活中,大多数企业把多个数据存放在一起,规模以及达到PB级别;第二个v(variety),它特指数据的类别多而且大,数据来源渠道多种多样,数据的类型与格式也越来越丰富,不再是以前那种单一的的结构化数据。第三个V(Veracity),说明数据的真实性高,随着各种数据源的快速交换、共享,传统单一数据源的网络被打破,企业急需真实的数据来为其安全性、及时性做坚强的支撑。第四个V(Velocity),指速度,数据的处理速度变快,可以在数据量非常庞大的情况下对其进行实时处理。贵州省大数据产业应用发展规划纲要中对大数据的定义:大数据是通过快速获取、处理、分析以从中提取价值的海量、多样化的交易数据、交互数据与传感数据。大数据科学家JohnRauser认为:大数据就是任何超过了一台计算机处理能力的庞大数据量。对大数据而言重要的不是关于它的定义而是怎样把它运用于生活。大数据的意义不在于你掌握多少数据,重要的是你如何处理这些数据,在这过程中让数据增值,让数据产生价值。