Gartner给出的是一个比较宏观的定义,它主要叙述描写大数据,在此基础上加入一些处理此类型数据的特征,这些特征被用来描述大数据;而维基百科中的定义缺少精准性,常用软件工具的范围不容易界定;麦肯锡和IDC对大数据定义属于狭义定义,他们只强调数据增长速度、种类和本身的量。从大数据的概念来看,对大数据的定义界定各有各的看法。我们可以认为“大数据”的叫法有明显时代相对性,未来一些领先者来说习以为常的大数据在今天业界普遍水平也许并不认为是大数据。来*自-优=尔,论:文+网www.youerw.com
狭义范围的大数据,主要是指包含大数据技术应用和大数据技术,这些应用分布在各个领域,也是指能从多种多样的数据中,快速获得有价值的信息的能力。狭义的大数据不仅仅是指大数据反映的数据集合增长速度已经快到无法用现有的数据库管理工具驾驭 [2],也是指对规模量巨大的数据的获取、存储、管理、计算分析、挖掘与应用的全新技术体系[3]。
广义范围的大数据区域包含大数据科学、大数据工程、大数据技术及其他大数据应用。可以看出是在狭义的大数据基础上又添加了大数据工程和大数据科学。大数据的规划建设运营管理的系统工程叫做大数据工程[4],大数据科学关注的是大数据网络发展,在数据运营过程发现大数据规律,并验证这些规律与自然和社会活动之间的关系[6]。对大数据进行广义分类是为了更好的满足信息经济时代发展需要,适应科学技术发展趋势。
2。2大数据特征
大数据的3V特点论是由IBM公司提出,这三点指的是:多样性(Variety)、实时性(Velocity)和规模性(Volume)[2],但是这些没有体现出大数据的巨大价值。在3V基础上以IDC为首的业界提出4V理论,描述大数据的四个基本特征:数据规模大、数据种类多、处理速度快及数据价值密度低 [7],新增加特点—价值型(Value)很好的描述了大数据的价值总量和价值密度成反比的特点。如图2-1所示4V特性: