文基百科中关于大数据的定义为: 大数据是指利用常用软件工具来获取、管理和处理数据所耗时间超过可容忍时间的数据集[3]。
IDC对大数据作出的定义为: 大数据一般会涉及两种或两种以上数据形式。它要收集超过100TB的数据,并且是高速、实时数据流;或者是从小数据开始,但数据每年会增长60%以上[3]。
研究机构Gartner给出了这样的定义:大数据是需要具有新型的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的数据信息资产[3]。
尽管对于大数据的概念有着不同的表述,但他们都存在一个普遍的观点是,大数据与“海量数据”和“大规模数据”的概念是关联的,不同的是大数据在数据数量、数据复杂性和产生速度等方面均大大超出了传统的数据形态,也超出了原有技术手段的处理能力,并带来了前所未有的产业创新的机遇。在过去的十余年中,数据挖掘的应用在销售、人力、电子商务等各个商业领域广泛开展,并引起各国的高度关注,并取得了前所未有的成果。从这种意义上说来,大数据时代来临标志着面向数据的研究和应用已脱离了起步阶段,开始进入发展阶段。
(二) 大数据的特征
目前,大数据形成了较为统一的四个基本特征:数据规模大(Volume),数据种类多(Variety),数据要求处理速度快(Velocity),数据价值密度低(Value),即所谓的四V特性[4]。
1.数据量大
数据量大是大数据的基本属性。大数据需要海量的数据支撑,根据IDC的定义至少要有超过100TB的可供分析的数据。
2.数据类型多样
数据尽管数量庞大,但通常是事先定义好的结构化数据,这样就分为各种各样的类型。数据类型繁多,复杂多变是大数据的重要特性。
上一篇:中越旅游服务贸易合作探讨
下一篇:河南历史文化资源产业化开发研究

共享经济在国内的发展现...

移动支付对旅游消费行为影响的研究

网络个人消费信贷对于网...

绿色贸易壁垒对我国的影响及其应对策略

农村商业银行公司化治理...

浙江民营企业海外投资现状及对策研究

大型会展场馆利用问题与...

10万元能开儿童乐园吗,我...

AT89C52单片机的超声波测距...

公寓空调设计任务书

国内外图像分割技术研究现状

志愿者活动的调查问卷表

中国学术生态细节考察《...

医院财务风险因素分析及管理措施【2367字】

承德市事业单位档案管理...

C#学校科研管理系统的设计

神经外科重症监护病房患...