“大数据”一词出现于1998年。2008年Nature推出了大数据特别版,2011年Science也启动了大数据关键技术中的“数据处理”相关问题研究,自此奠定了大数据在科学中的地位。根据“百度指数”的数据,中国对“大数据”的广泛关注始自2012年初,当时《大数据》读物的出版引起了全社会对于大数据的热烈讨论,它为人类的决策和管理带来了崭新的思路和方法。作为数据库软件的先驱,图灵奖得主吉姆·格雷( Jim Gray) 在一次演讲中将数据密集型科学描述为科学研究方法的“第四范式”,他认为构建一个全新一代的计算工具来处理、可视化、分析数据是应对范式转换的唯一方法。 2012 年《哈佛商业评论》一篇文章将大数据誉为新的管理。自此,各行各业都期待着能够从大数据中获益。
大数据不是单一一个技术,而是一套技术体系。它包括海量数据的存储技术、数据计算技术、数据集成和融合技术与数据分析技术。大数据除了指数据大,同时它还有着更多的维度,包括数据的复杂性或互联性的规模。 大数据被认为是具有3V即规模性、多样性和高速性特征的数据集。 在小数据时代,由于信息缺乏、流通受阻等人为限制,我们妄求利用最少的数据获取最多的信息,习惯依赖于抽样数据、局部数据和片面数据,甚至在无法获取数据时去依靠纯粹的经验或理论假设去探寻未知的领域。其结果是我们对于世界的认知往往停留在表面上。另外,由于随机抽样的成功关键在于采样的绝对随机性,而随机性又难以满足,所以小数据时代的数据误差是较大的。而在大数据时代,我们可以在广阔领域、深入层次获取并运用全体数据、完整数据和系统数据,真正地去深入探寻现实世界中的规律。这种全数据模式并不需要刨根问底,只需掌握宏观层面上大体发展方向即可。它不会告知我们为何发生,它只需提醒我们正在或即将发生,这在许多情况下获益已足够大。Viktor Mayer-Schonberger在《大数据时代》中提出了三种思维模式的转变: 更多、更杂、更好。 即需要的是全体数据而非随机样本,不再追求精确度,不再追求因果关系,而是承认混杂性,探索相关关系。总之,大数据强调的是全体数据、混杂性以及相关性。
大数据的价值是不可估量的。在大数据时代,所有数据都是有价值的。而大数据的价值是取之不尽用之不竭的。首先,数据具有非竞争性,它不会随着使用而减少。其次,数据的价值并不仅限于特定的用途,它可以为了同一目的而被多次使用,也可以用于其他目的。这意味着数据的全部价值要远远大于其最初的使用价值,我们可以通过数据的再利用、数据集整合重组和开放数据等数据创新方式去尽情释放数据的隐藏价值。
二、大数据与政策能力
Simon提出:“管理即决策”。西方国家兴起的民主思想和科学精神为公共政策决策中数据的运用提供了思想基础和动力源泉。林德布罗姆提出“一方面,人们希望政策应具有信息基础并经过充分的分析。另一方面,他们也希望政策过程是民主的,从而必须具有政治性。换句话说,一方面他们希望政策制定更加具有科学性,另一方面则希望政策制定属于政治范围。” 大数据时代下的公共政策决策是一种基于数据驱动的决策方式,公共政策决策离不开对数据的观察、收集、分析、提取、整合、利用、贮存。大数据对公共政策决策的支持促进了决策的科学化与民主化,从而提升了国家的政策能力。
(一)大数据促进公共政策决策的科学化
大数据充分地让数据发声,在海量数据的基础上做出快速、准确、低成本的论断,实现决策的科学化。随着云计算、物联网等技术的发展,数据的获取、储存较之以前更为简便,从而大大提高了决策的时效性与精准性,大大降低了决策的总成本。在大数据时代,数据收集量以及收集速度、数据共享传递速度及范围、数据分析速度及深度、决策形成速度及有效性是以往小数据时代所不能比拟的。从决策过程来看,政策决策主要包括目标的选择和方案的选择,大数据在以下两个环节的应用具有极为重要的意义。文献综述