中国邮政储蓄银行股份有限公司安徽省分行 230000
【摘要】随着数字化风险的发展,对于无担保的信用类消费贷款,风控模式高度依赖于对客户本人的风险特征判断。金融机构对此类客户大多采用以工作单位为核心的风控指标,并给予较高的信用评级,预期资产质量表现良好,但在实践中,该类客户资产表现呈现下降趋势,对该类客户进行多维度细分及画像,有利于风控体系指标的优化,提高信用消费贷款资产质量。
【关键词】不良客户 风险特征 客户画像
作者简介:朱敬,(出生1982年11-)性别:男,民族:汉,籍贯:安徽蚌埠,学历:硕士研究生,中国邮政储蓄银行安徽省分行消费信贷部团队主管,经济师,研究方向:消费金融
信用消费贷款的基本信贷逻辑是基于客户稳定的现金流作为第一还款来源,稳定的现金流来源于优质单位的稳定工资收入。以公务员、医生、教师等代表的该类客户是各类金融机构重要目标客户群,在整体资产质量表现良好的情况下,该类客户资产表现呈现下降趋势,本文拟从多个维度分析贷款客户的风险特征,提出优化风控和营销策略。
一、基本指标
对客户的基本指标进行筛选,通过客户报表台账、互联网信息科技管理系统平台以及互联网等方式提取数据需求,提取数据包含字段27个变量,如下表所示:
一级指标 | 二级指标 | 变量 | 变量说明 |
基本情况 | 性别 | X1 | 男、女 |
婚姻状况 | X2 | 已婚、未婚、离异、丧偶 | |
学历 | X3 | 高中及以下、大专、本科、硕士、博士 | |
年龄 | X4 | 额度生效日时点对应的年龄 | |
住址 | X5 | 家庭地址 | |
财务状况 | 工作单位 | X6 | 申贷时工作单位 |
工作年限 | X7 | 申贷时工作年限 | |
行业 | X8 | 工作单位所对应的行业 | |
评级 | X9 | 一、二、三、四、五 | |
AUM值 | X10 | 客户在银行的个人资产规模 | |
申贷信息 | 贷款起期 | X11 | 额度贷款起期(到日) |
贷款止期 | X12 | 额度贷款止期(到日) | |
利率 | X13 | 贷款支用年利率 | |
额度 | X14 | 授信额度金额 | |
交易习惯 | 最大支用率 | X15 | 最大的使用金额/授信额度 |
支用对手账户名 | X16 | 客户贷款支用转出的账户名 | |
刷卡商户 | X17 | 刷卡的商户名称 | |
违约情况 | 不良贷款天数 | X18 | 不良的逾期天数 |
不良贷款金额 | X19 | 不良贷款余额 | |
历史逾期次数 | X20 | 五年内逾期次数 | |
首逾日期 | X21 | 贷款第一次出现逾期的日期 | |
负债情况 | 近一年申贷征信查询次数 | X22 | 近一年内金融机构融资类查询次数 |
负债总额 | X23 | 征信总负债金额 | |
除房贷外负债额 | X24 | 征信除房贷外负债额 | |
信用卡负债金额 | X25 | 信用卡负债金额 | |
信用卡总授信金额 | X26 | 信用卡总授信金额 | |
信用卡数 | X27 | 有效期内信用卡数量 |
二、数据分析维度
从客户维度和业务维度确定数据提取需求,通过数据筛选和清洗,对客户固态信息和动态信息进行分析,总结规律性风险特征。
1、客户维度:
(1)客户基本特征:客户信用评级、年龄、性别、学历等。
(2)客户行为特征:是否有频繁贷款申贷记录、支用路径、逾期习惯等。
2、业务维度:
(1)不同的年龄、性别会对还款能力和还款意愿产生影响、以及各年龄段、性别的放贷比例等。
(2)不良贷款率与不同的初始评级之间相关性、以及各初始评级的放贷比例等。
(3)借款属性(类型、利率、金额、期限)的不同会对还款产生影响以及贷款品种的放贷比例等
三、数据筛选与清理
1、空值处理。部分客户在信息录入阶段基础信息不全或者在贷款后无查询征信记录,如学历信息(缺失)、婚姻状况(未知)等内容。空值处理按照上表中字段说明较低的维度赋值。
2、重复值处理。由于系统取数中存在同一客户多次支用的情况,造成客户的贷款记录多次出现。重复值处理按照剔除已结清支用贷款,同一客户多次支用的未结清贷款合并为一笔贷款记录。
3、异常值处理。征信历史逾期次数不能完全反映客户真实征信情况,如历史逾期次数少但逾期期限比较长、逾期造成的不良贷款在不同时间段造成差异等异常值。异常值处理按照实质重要形式原则,对造成本次不良的逾期天数值作为确定值。
四、logistic回归数据分析
根据27个变量构建的评估指标体系,以1000条信用消费贷款实际业务数据作为研究样表,其中500条正常客户,500条违约客户。将其分为5组,每组包含正常客户及违约客户各100条。随机抽取3组作为训练样本,剩余2组作为检验样本。
(一)共线性检验
由于指标变量相互之间的多重共线会对所构建的模型产生较大的偏离度,采用统计量容差(TOL)和方差扩大因子(VIF)对27项风险评估指标变量进行共线性检验。根据结果,最终选择9个变量指标:X2、X3、X4、X7、X10、X12、X15、X22、X23,即婚姻状况、学历、年龄、工作年限、AUM值、最大支用率、历史逾期次数、近一年申贷征信查询次数、负债总额。
(二)模型测算结果
y=0.843-0.096X2-0.065X3+0.023X4+0.061X7+0.040X10+0.071X12
+0.055X15+0.084X22+0.098X23
模型对训练样本和检验样本的诊断结果如下:
样本 | 训练样本 | 检验样本 | |
测算值 | 0(正常) | 283 | 179 |
1(违约) | 317 | 221 | |
实际值 | 0(正常) | 300 | 200 |
1(违约) | 300 | 200 | |
总体样本数 | 600 | 400 | |
准确率 | 72.30% | 73.10% | |
误判率 | 27.70% | 26.90% |
通过实验结果表明,以实际业务发生数据为依据,基于logistic回归数据模型具有良好的判别性和稳定性。此外,变量X2婚姻状况与违约之间为负相关,与传统信贷理念(家庭稳定)有所差异,一方面由于婚姻状况是申贷时静态信息有关,另一方面可能与物权法实施有关。
五、结论与建议
(一)不良客户画像
初始评级为相对较低三类和四类客户,年龄段在40-60岁区间,性别为男性,学历为大专及以下或者全日制阶段学历较低,贷款前后频繁查询征信,查询理由为贷款审批、信用卡审批或无法合理解释的本人多次查询征信,在银行客户AUM值较低,有逾期历史记录。
(二)风险指标建议
按照数据分析和业务逻辑,对于画像类客户,应从以下几个方面着重做风控建议:
1、对于客户贷前征信中频繁查询贷款记录(贷款审批、信用卡审批),着重调查客户频繁查询的原因以及各次审批的结果,如都是拒贷或者超低授信额度,审慎准入。
2、对于客户多次自主查询征信,应当保持高度关注。小贷公司、担保公司以及资金中介等无权限查询客户征信,会让客户自己查询最新征信,客户多头借贷、中介包装风险较高,对于无法合理解释的客户,审慎准入。
3、对于客户有历史逾期记录、频繁借贷历史(即使已结清),需要保持高度关注,对于借贷历史时间顺序进行梳理,关注是否以贷转贷或者“过桥”转贷。
4、对于无自有住房40岁以上男性,贷前调查重点关注,是否有工作外投资或不良嗜好,如炒股、赌球等不良嗜好,不良嗜好是造成负债过高的重要原因。
【参考文献】
1、徐平安,候剑平,薛强 基于logistic模型的个人住房贷款信用风险实证研究 金融理论与实践 2010(11):52-56
2、蒋亮,何永锋,郭晓蓓.商业银行不良贷款成因实证浅析——基于宏观视角和省级面板数据的分析.西部金融, 2020(4):8.
3、刘颖.银行不良贷款影响因素的实证分析[D].浙江大学,2013.
4、程超,赵春玲. 信用评分技术在商业银行的应用——基于对信贷可获性、不良贷款率和经营绩效的实证分析. 南京财经大学学报 (2015):8.
5、李松. "论农村信用社不良贷款的成因及策略分析." 经济视野 17(2019):33-33.