目前,国内外关于搜索引擎数据与社会活动的研究已有不可忽视的成果。对于网络搜索数据的研究最早应用于疾病(流感)的监测,2008年Polgreen等人证明了搜索指数与流感发病率存在长期稳定的相关关系,并可以利用指数预测流感发病情况和死亡率[1],次年,杰米斯。金博格等人成功地利用 Google搜索数据成功的预测美国流感疾病趋势,相较于传统方法可提前1-2周对流感发病率进行预测[2];在同一年(2009)国内甲型H1N1流感高发时期,康敏、钟豪杰等成功证明了流感监测数据与网络搜索指数之间存在相关性,网络搜索引擎可以有效地辅助流感的监测[3]。2013年刘伟江、樊国虎等研究证明了网络搜索数据与消费者信心指数之间具有显著相关性,建立了拟合度较高的模型,对样本内数据的拟合以及样本外的数据预测都有一定效果 [4]。论文网张崇,吕本富,彭赓,刘颖(2012)基于网络搜索数据监测或预测CPI的内在机理,进而通过实证研究对其相关关系进行检验,并建立模型对CPI进行预测,建立的模型甚至可以进行转折点预测[5]。董倩,孙娜娜等使用十六个大中城市的房价(二手房和新房),基于百度指数的搜索数据,建立了预测房价变动的模型,比官方发布的房价数据提前两周。[7]对于网络搜索指数的研究,早已成为研究社会环境的重要途径,成为不可忽视的一大趋势。Erik Brynjolfsson 和Lynn Wu (2009) 研究发现谷歌趋势的房屋搜索指数能够很好地预测未来住房市场的销售情况[11]。87992
本文将通过两大主要部分来研究网络搜索的租房指数与浙江地区CPI的相关性,分别为方法和数据的选择与采集处理;对于实证结果的分析,最后加以总结。
参考文献
[1] Polgreen, P。 M。, Chen, Y。, Pennock, D。 M。 & Forrest, N。 D。 Using internet searches for influenza surveillance[J]。Clinical Infectious Diseases 47, 1443–1448 (2008) 。
[2] Jeremy Ginsberg, Matthew H。 Mohebbi, Rajan S。 Patel, Lynnette Brammer, Mark S。 Smolinski, and Larry Brilliant。 Detecting influenza epidemics using search engine query data[J]。 Nature, pages 1012–1014, 2009。
[3]康敏,钟豪杰,杨芬。广东省2009年甲型H1N1流感流行与网络搜索情况的相关性分析[J]。热带医学杂志,2011,11(6):629-632。
[4]刘伟江,樊国虎,李映桥。网络搜索数据与消费者信心指数的相关性研究[J]。数量经济研究, 2014(2)
[5]张崇,吕本富,彭赓,刘颖。 网络搜索数据与CPI的相关性研究[J]。 管理科学学报。 2012(07)
[6]崔东佳。 大数据时代背景下的品牌汽车销量预测的实证研究 ——以网络搜索数据为例[D]河南:河南大学,2014:1-56。
[7]董倩,孙娜娜,李伟。基于网络搜索数据的房地产价格预测[J]。统计研究。2014(10)
[8]刘颖, 吕本富, 彭赓。 2011。 网络搜索对股票市场的预测能力:理论分析与实证检验。经济管理, (1): 172~179。
[9]张晨,房价为什么不纳入CPI(N)。城市快报。2011
[10]伍戈,黄俊筑,王岳。 房价压力下的房租负担(N)。伍戈经济笔记。2017,3
[10] Doornik J A。Improving the Timeliness Of Data On Influenza-Like Illnesses Using Google Search Data。 2009
[11]Wu Lynn,Erik Brynjolfsson。The Future of Prediction:How Google Searches Foreshadow Housing Prices and Sales。 Proceedings of the 2009 International Conference on Information Systems 。
[12]Chris H, Guy J。 2012。 Searching for the picture:forecasting UK cinema admissionsusing Google Trends data。Applied Economics Letters。 19 (11): 1051~1055。