二、文献综述

三、方法和数据

首先使用电脑程序抓取百度指数并解密,获得搜索指数的周数据,汇总成月数据。在国家统计局网站上获得CPI居住指数月度数据,将获取的数据进行统计汇总,获得时间序列,再使用皮尔逊系数测量时间序列之间(CPI与搜索指数)的相关关系完成研究。

1。选择数据采集点

对比谷歌趋势与百度指数,由于国内对于google搜索引擎的封锁,所以国内在PC端,百度的市场份额目前占到60。19%左右,360指数则以24。8%的市场份额位居第二;在移动端,百度的国内市场份额高达84。64%,而其他搜索引擎则各占据小于百分之十的市场份额。所以本文选用了更贴合国内现状的“百度指数”作为网络搜索数据的采集点。

2。选择关键词

围绕论文主题,选择了“杭州房屋出租”这一初始关键词。

由于百度指数对于本文重要初始关键词“杭州房屋出租”的搜索指数只保留了一年的数据,不符合实验要求,所以选择浙江省为搜索指数的地域细分,贴合搜索指数的地区细分,CPI居住指数也选择浙江省为地域范围。为保证实证研究的准确性,首先确定杭州市CPI与浙江省CPI的是否具有相关性。

3。CPI数据选择与处理论文网

选择国家统计局网站作为CPI数据的采集点,进入国家统计局数据查询网页:http://data。stats。gov。cn/ ,输入“CPI”,选择分省月度数据和主要城市月度数据,分别获取浙江省与杭州市CPI的月度综合数据,加以编辑汇总,得到浙江省和杭州市CPI的时间序列,使用图表工具进行处理,得到图1,

通过图1可以看出,浙江省CPI与杭州市CPI的走势非常一致,再通过计算这二者的

相关系数证明二者的相关性,使用spss① 软件对相关系数进行计算,得到两组时间序列的相关系数为0。878② ,在0。01水平上显著相关,综上可以证明浙江省CPI的居住指数可以为杭州CPI居住指数的代理指标。

4。关键词搜索指数处理

进入百度指数网页https://index。baidu。com/ ,输入“杭州房屋出租”搜索关键词的指数,注意选定区域为“浙江省”,将看到折线图显示搜索指数的周平均数据,将其汇总为2014年1月至2017年7月的月度数据。

5。数据分析

利用spss对收集到的2014年至2017年浙江省CPI的居住指数和“杭州房屋出租”的搜索指数两组时间序列进行皮尔逊相关系数计算,得到CPI居住指数③ 与租房网络搜索指数的相关系数为0。385,二者在0。05水平下显著相关,属于低度相关的范畴,并用图表工具处理得到图2。

从图2中可以看出二者的走势虽然具有一定的一致性,但一致性并不是特别明显,另外,相关系数为0。385 ,小于0。5,属于低度相关的范畴,也就是说搜索引擎的搜索指数与CPI居住指数存在差异。

四、实证结果

本文的写作立意是基于房屋的租赁价格是居住类CPI的重要统计因素而非房地产价格,所以选取“租房”相关的初始关键词,由于原本没有构建完整的理论框架,导致租房的网络搜索指数和CPI居住指数的差异较大,因此需基于经济学的角度构建一个完整的理论框架。本文的理论框架构建基础为:宏观经济环境因素影响商品供求关系,商品供求关系决定商品价格,宏观经济环境和商品供求关系是影响商品价格的重要因素,消费者和生产者作为市场的微观主体,他们的行为在市场上和互联网上都会有所反映,在市场上表现为商品价格的变化,在互联网上则表现为网页浏览﹑搜索指数的变化。微观主体在互联网上搜索的信息也可以分为宏观和微观两个方面,宏观方面是对于整个宏观经济大环境信息的搜索,包括宏观政策,市场经济状况,在微观方面,则指特定的商品特定属性和相关属性的搜索,并据此构建了如下图的理论框架示意图。文献综述

上一篇:大网络环境下的数据挖掘用户的行为挖掘
下一篇:php网上书城用户交互界面的设计+ER图

基于PageRank算法的网络数据分析

基于神经网络的验证码识别算法

基于网络的通用试题库系...

网络常见故障的分类诊斷【2055字】

网络安全的研究【1797字】

网络信息安全技术管理的...

Web技术的网络考试系统【2240字】

新課改下小學语文洧效阅...

LiMn1-xFexPO4正极材料合成及充放电性能研究

张洁小说《无字》中的女性意识

麦秸秆还田和沼液灌溉对...

安康汉江网讯

互联网教育”变革路径研究进展【7972字】

网络语言“XX体”研究

ASP.net+sqlserver企业设备管理系统设计与开发

老年2型糖尿病患者运动疗...

我国风险投资的发展现状问题及对策分析