41 167 男 军队事业机关 3000 42
42 306 男 军队事业机关 2000 36
43 581 男 军队事业机关 7500 52
44 745 男 军队事业机关 2000 21
45 497 女 军队事业机关 7000 27
46 155 女 军队事业机关 10000 45
47 7 男 军队事业机关 23000 44
48 4 男 军队事业机关 18000 43
49 18 女 军队事业机关 16000 37
50 5 女 军队事业机关 22000 35
资料来源:招商银行客户管理系统,2012,5
5.4 二元回归估计模型
根据上述数据,选择逾期还款天数(day)、授信额度(credit)、年龄(age)进行二元回归分析。
a) 作散点图
图2 credit与day的散点图
从散点图上看,credit和day近似呈现线性关系,可以作线性回归。
图3 age与day的散点图
如上图所示,年龄age与逾期天数day大致呈中间低两头高的关系,day在40岁为低谷,大于或小于40岁时,day上升。可见,年龄age与逾期天数day不存在简单的单调相关关系。
b) 为了在模型中处理age与day之间的关系,我们需要人为创造一个变量,使得此变量对于day的影响是单调的,以便于我们的分析。一般来讲,关于解释变量的非线性问题都可以通过变量置换变成线性问题。所以,根据上面age与day关系的图形,我们可以假设age与day的关系呈一个倒立的正态分布函数型( )。显然,这里的正态函数中值应取 ,而根据day-age图中位于谷底部的年龄集中在30岁到50岁可知近似有以下关系: ,即 。这样可以得到一个满足 分布的正态分布密度函数 。然后我们再把这个正态分布密度函数“倒立”过来,即令 。这样,我们就得到了用来表示age对于day的影响的变量(函数) ,即
即
其可作图如下:
图4 F(age)和credit的拟合关系图
由此可以得到逾期还款天数(day)、授信额度(credit)、年龄(age)的二元回归估计模型:
用Eviews软件作回归模型分析,需要说明的是因为这些样本是截面数据,存在异方差,所以这里没有用最小二乘法估计参数,而是选择了加权最小二乘法进行了处理,以下做的Eviews回归都经过了该处理,不再赘述。处理结果见表2:
表2 二元回归模型的Eviews输出结果
到估计模型:
(5﹒1)
5.5 包含一个两分定性变量,两个定量变量的回归估计模型
一般认为女性的违约风险较小于男性,因此,银行在信用卡风险分析中要考虑到性别的因素,适当加以调整。把男性看做基准类,假设如下:
男性:sex=1 女性:sex=0
假设回归估计模型为:
用Eviews软件作回归模型分析见表3。
表3 Eviews输出结果
得到回归估计模型:
(5﹒2) 商业银行信用卡业务的风险及防范(12):http://www.youerw.com/jingji/lunwen_2687.html