3 研究设计
3。1 数据样本及模型建立文献综述
文章根据“红岭创投”2016年1月1日-2017年4月30日的全部借款信息及相关借款数据作为初始样本,其中包括基本资料的评级:银行流水评级Basic1、信用报告评级Basic2、手机清单评级Basic3、车贷评级Basic4、房贷评级Basic5。辅助资料评级:社会关系评级Assist1、工作关系评级Assit2、能力水平评级Assit3、经营主体资质评级Assit4、经营业绩评级Assit5。本文对“红岭创投”2015年1月到2016年9月参与借贷活动用户的相关信息认证数据进行了抽样调查,供抽取了57891个样本观测样本,但是由于庞大的观测值中存在多种无用或存在欠缺的观测值,为此本文做了如下处理:1删除了缺少以上10个评级信息的观测样本6912个;2对年龄小于21岁缺乏还贷借贷能力的用户的观测值;1647个;3删除由单位或具有雄厚资金实力的企业作为担保人的观测值2892个。最终确定样本数据观测值为46440个观测值。