3。2数据来源文献综述
由于幸福感作为对一定人生阶段的生活水平和生活质量的总体评价,难以对幸福进行非常准确的衡量,因此往往需要通过调查问卷的形式对被访者进行多个纬度的考察。这些问卷中既包含有幸福程度调查,在调查问卷中,要求被访问者根据自己的实际情况从自身出发在“很不幸福、比较不幸福、居于幸福与不幸福之间(一般)、比较幸福、完全幸福”5个答案在中做出一个选择。虽然这种测量主观幸福感的方法很简单,但是可以代表居民的幸福感的高低。本文采用的是对全国各地深入到社区的一万多户家庭进行抽样调查的中国综合社会调查(Chinese General Social Survey,简称CGSS)2010年度数据。调查问卷中设计了性别、年龄、受教育程度、健康状况、2009年的个人总收入等调查问题,样本数超过了一万条。因此用该问卷来研究收入与幸福感的关系是比较合适的。
由于部分样本数据存在缺失或者奇异值的情形,在采纳上述数据进行进一步建模之前,需要将该部分样本予以剔除,以保证模型的准确性与适用性。具体而言:第一,删除调查数据中居民个人2009年全年劳动收入为0、性别、年龄、婚姻状况、教育程度、回答为不适用、不知道及拒绝回答的样本;第二,删除缺失工作记录的样本数据,以便更有效的验证被调查者收入的真实性;第三删除个别问题选择人数小于十人的选项。最终得到了有效样本数据2689个。