1.采集的数据是否准确
无论是在传统金融领域,还是互联网金融领域,评估客户信用资质的前提是必须确定这个人就是客户自己。但是在复杂的网络环境下,大数据征信如何确定所收集的数据是客户的数据呢?所以如何证明客户的身份是大数据征信首先要解决的问题。尤其是金融业务互联网化程度越来越高的今天,“反欺诈”面临的挑战更大。各项监管文件中也反复强调“身份认证”的重要性,而各家机构也在不断创新方法、创新技术完善客户网上身份的核实。其中成熟度和准确率较高的人脸识别,其有效性和安全性仍备受质疑,比如说如果客户在脸部整形后要如何才能通过人脸识别登录系统?
2.社交数据与个人信用的相关度
用社交数据来进行信用评估一直备受争议。且不说社交信息对于判断借款人的还款意愿和能力暂无预测力,如果有效的话,那么那些社交数据与人的信用相关度比较高?据了解,美国暂时还没有哪一家征信机构采用社交数据进行信用评估,而国内获得牌照的征信机构,比如芝麻信用,社交数据在信用评分中所占的比例很低(5%以下)。再者,社交数据容易被操控。与贷款记录不同,人们可以通过某些手段操控自己的社交数据以提高信用评价,比如芝麻信用出来后网上出现的刷分攻略。
3.算法模型的有效性
互联网记录了借款人在传统金融机构以外不被采集的信息,获得了以前无法获取或获取成本很高的数据,为放贷人了解借款人的身份、还款能力和还款意愿提供了新的角度。但是,相关的信息究竟如何使用有待进一步研究验证。
我们在一些文章中会看到一些反映大数据征信不能准确评估客户信用状况的案例,如用户经常半夜上网可能会降低其信用评分,因为他会被认为没有稳定的工作,但是这也有可能只是用户的个人习惯而已,并不能说明用户没有固定工作。比如买双开门冰箱的用户可能因为有家庭而信用评分较高,但是我们都知道这个结论不一定准确。这是需要进行数据处理的,我们需要把它放到具体环境里,本来收入很低买了个大冰箱的人跟本来收入很高买了个大冰箱的人,这两者得出来的信用结果是不一样的。比如说被评估者本来收入很低,但却买了个超一流的大冰箱、超一流的沙发等,说明被评估者的履约能力是很差的,因为他的消费节制能力比较差,很可能会引发财务危机。再比如微博更新频繁的用户可能因为社交活跃而信用评分较高等,但事实上微博上存在一些推手他们只是专门负责更新微博而已。
所以大数据征信如何客观、准确地描述客户的资信状况,并且如何把这些社交数据在评估模型中表现出来还有待研究。
(二)征信主体的隐私保护
当下,我国还没有制度明确个人信息保护的法律,个人隐私在我国很难界定。这就导致了三个问题:一是社交数据是否属于个人隐私,二是信息过度采集会不会侵犯个人隐私,三是一旦个人隐私遭泄露如何确定责任人。
1.社交数据是否属于隐私
我国现有的法律并没有明确规定社交信息是否属于个人隐私,在法律没有明确界定的情况下,正规的征信机构不敢贸然使用社交信用进行征信,深恐侵犯个人隐私。事实上,在国外,使用社交信息进行信用评估的技术已经出现,但是征信机构却不敢用,因为害怕侵犯民众隐私遭受公众抨击。
2.信息过度采集会不会侵犯个人隐私
互联网时代,信息得到沉淀积累,数据挖掘和分析技术的进步让很多信息都能用于分析个人的信用情况,所有的信息都变得有价值。在利益的驱使下,征信机构会大量采集客户的数据,用于征信以外。由于公众在网上缺乏个人信息保护意识,公众在未被告知的情况下,或者不明显提醒网民哪些信息会被采集,导致公众忽略协议内容,这就有可能侵犯公众的个人隐私。 互联网大数据征信模式及存在问题研究(5):http://www.youerw.com/guanli/lunwen_1022.html