二、文献综述
三、方法和数据
首先使用电脑程序抓取百度指数并解密,获得搜索指数的周数据,汇总成月数据。在国家统计局网站上获得CPI居住指数月度数据,将获取的数据进行统计汇总,获得时间序列,再使用皮尔逊系数测量时间序列之间(CPI与搜索指数)的相关关系完成研究。
1。选择数据采集点
对比谷歌趋势与百度指数,由于国内对于google搜索引擎的封锁,所以国内在PC端,百度的市场份额目前占到60。19%左右,360指数则以24。8%的市场份额位居第二;在移动端,百度的国内市场份额高达84。64%,而其他搜索引擎则各占据小于百分之十的市场份额。所以本文选用了更贴合国内现状的“百度指数”作为网络搜索数据的采集点。
2。选择关键词
围绕论文主题,选择了“杭州房屋出租”这一初始关键词。
由于百度指数对于本文重要初始关键词“杭州房屋出租”的搜索指数只保留了一年的数据,不符合实验要求,所以选择浙江省为搜索指数的地域细分,贴合搜索指数的地区细分,CPI居住指数也选择浙江省为地域范围。为保证实证研究的准确性,首先确定杭州市CPI与浙江省CPI的是否具有相关性。
3。CPI数据选择与处理论文网
选择国家统计局网站作为CPI数据的采集点,进入国家统计局数据查询网页:http://data。stats。gov。cn/ ,输入“CPI”,选择分省月度数据和主要城市月度数据,分别获取浙江省与杭州市CPI的月度综合数据,加以编辑汇总,得到浙江省和杭州市CPI的时间序列,使用图表工具进行处理,得到图1,
通过图1可以看出,浙江省CPI与杭州市CPI的走势非常一致,再通过计算这二者的
相关系数证明二者的相关性,使用spss① 软件对相关系数进行计算,得到两组时间序列的相关系数为0。878② ,在0。01水平上显著相关,综上可以证明浙江省CPI的居住指数可以为杭州CPI居住指数的代理指标。
4。关键词搜索指数处理
进入百度指数网页https://index。baidu。com/ ,输入“杭州房屋出租”搜索关键词的指数,注意选定区域为“浙江省”,将看到折线图显示搜索指数的周平均数据,将其汇总为2014年1月至2017年7月的月度数据。
5。数据分析
利用spss对收集到的2014年至2017年浙江省CPI的居住指数和“杭州房屋出租”的搜索指数两组时间序列进行皮尔逊相关系数计算,得到CPI居住指数③ 与租房网络搜索指数的相关系数为0。385,二者在0。05水平下显著相关,属于低度相关的范畴,并用图表工具处理得到图2。
从图2中可以看出二者的走势虽然具有一定的一致性,但一致性并不是特别明显,另外,相关系数为0。385 ,小于0。5,属于低度相关的范畴,也就是说搜索引擎的搜索指数与CPI居住指数存在差异。
四、实证结果
本文的写作立意是基于房屋的租赁价格是居住类CPI的重要统计因素而非房地产价格,所以选取“租房”相关的初始关键词,由于原本没有构建完整的理论框架,导致租房的网络搜索指数和CPI居住指数的差异较大,因此需基于经济学的角度构建一个完整的理论框架。本文的理论框架构建基础为:宏观经济环境因素影响商品供求关系,商品供求关系决定商品价格,宏观经济环境和商品供求关系是影响商品价格的重要因素,消费者和生产者作为市场的微观主体,他们的行为在市场上和互联网上都会有所反映,在市场上表现为商品价格的变化,在互联网上则表现为网页浏览﹑搜索指数的变化。微观主体在互联网上搜索的信息也可以分为宏观和微观两个方面,宏观方面是对于整个宏观经济大环境信息的搜索,包括宏观政策,市场经济状况,在微观方面,则指特定的商品特定属性和相关属性的搜索,并据此构建了如下图的理论框架示意图。文献综述