大数据处理对电子商务的影响研究(2)_毕业论文

毕业论文移动版

毕业论文 > 经济论文 >

大数据处理对电子商务的影响研究(2)


文基百科中关于大数据的定义为: 大数据是指利用常用软件工具来获取、管理和处理数据所耗时间超过可容忍时间的数据集[3]。
IDC对大数据作出的定义为: 大数据一般会涉及两种或两种以上数据形式。它要收集超过100TB的数据,并且是高速、实时数据流;或者是从小数据开始,但数据每年会增长60%以上[3]。
研究机构Gartner给出了这样的定义:大数据是需要具有新型的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的数据信息资产[3]。
尽管对于大数据的概念有着不同的表述,但他们都存在一个普遍的观点是,大数据与“海量数据”和“大规模数据”的概念是关联的,不同的是大数据在数据数量、数据复杂性和产生速度等方面均大大超出了传统的数据形态,也超出了原有技术手段的处理能力,并带来了前所未有的产业创新的机遇。在过去的十余年中,数据挖掘的应用在销售、人力、电子商务等各个商业领域广泛开展,并引起各国的高度关注,并取得了前所未有的成果。从这种意义上说来,大数据时代来临标志着面向数据的研究和应用已脱离了起步阶段,开始进入发展阶段。
(二) 大数据的特征
目前,大数据形成了较为统一的四个基本特征:数据规模大(Volume),数据种类多(Variety),数据要求处理速度快(Velocity),数据价值密度低(Value),即所谓的四V特性[4]。
1.数据量大
数据量大是大数据的基本属性。大数据需要海量的数据支撑,根据IDC的定义至少要有超过100TB的可供分析的数据。
2.数据类型多样
数据尽管数量庞大,但通常是事先定义好的结构化数据,这样就分为各种各样的类型。数据类型繁多,复杂多变是大数据的重要特性。 (责任编辑:qin)