通过以上分析可知,数据产生的三要素已经发生了历史性的变革,人、机、物协同作用下,不间断、无领域限制的数据产生方式已经突破了传统数据的概念,其必然导致数据性质的变革,这也就衍生出了新的概念———“大数据”。
2. 3 大数据特性
在“大数据”的定义中,已经包含了大数据的特性,即数据量大、处理速度要求快、价值密度低等,目前对于大数据的特性认可度较高的是 3V 特
性: 即数据的规模性( Volume) 、高速性 ( Velocity) 以及数据结构多样性( Variety) ,而在此基础上已经有不同的公司以及研究机构对其进行了扩展,大数据特性描述的演化如表 1 所示。
根据上表可以看出,随着时间的演化,业界对于大数据的认识也更深入、全面。除以上对大数据特性的通用性描述之外,不同应用领域的大数据的具体特性也存在差异性。如互联网领域需要实时处理和分析用户购买行为,以便及时制定推送方案,返回推荐结果来迎合和激发用户的消费行为,精度以及可靠性要求较高; 医疗领域需要根据用户病例以及影像等信息判断病人的病情,由于其与人们的健康息息相关,所以其精度以及可靠性要求非常高。
·472 · 电 子 测 量 与 仪 器 学 报 第 29 卷
表 1 大数据特性描述的演化情况
Table 1 The description evolutions of big
data characteristics
特点 提出时间 作者或者机构 内涵
规模性 数据量大
( Volume)
DougLaney[27]
高速性 数据分 析 和
( Gartner Meta
( Velocity) 2001 处理速度快
Group research)
多样性 数 据 类 型
( Variety) 多样
价值性 价值稀疏性
( Value) [28] 2012 IDC
真实性 2012 IBM 数据反 应 客
( Veracity) [29] 观事实
易变性 Brian Hopkins 大数据 具 有
和 Boris Evel-
( Variability) [30] 2012 多层结构
son( Forrester)
[18]
表 2 列举了不同领域大数据的具体特点 以及应用案例。
表 2 不同领域大数据的具体特点
Table 2 The specific features of big data in different areas
领域 用户 响应 数据 可靠性 精度