信用风险评级研究论文

时间:2022-09-16 05:30:00

导语:信用风险评级研究论文一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

信用风险评级研究论文

内容提要:我国的银行业进行信用风险评级,虽然在技术上有一定的“后发优势”,但是绝对不是简单的“直接拿来”。信用风险的内部评级工作需要根植于内部数据,开发适合中国实际情况的评级模型。本文从银行内部评级的角度,对信用风险评级的若干问题进行了讨论,并提出了适当的处理方式。

关键词:信用评级风险防范议题

一、引言

新巴塞尔协议的核心内容是内部评级,包括了市场风险、信用风险和操作风险。市场风险由于数据都来之外部资本市场,而且方法成熟,需要我们自行研究的较少;操作风险的计量方法还不够成熟;信用风险,虽然方法成熟,但是需要使用内部数据,从而更多的需要我们自行开发研究,而且对于中国的银行业,传统的信贷业务仍是比重最大的业务,所以信用风险评级是目前我国银行研究的重点,也是内部评级的突破口。

信用风险评级模型的基本思想是从已有信用表现的历史数据中提炼信息,得到客户属性和行为变量与客户违约概率之间的函数关系,从而来预测未来的客户信用状况。这种函数关系,是广义上的对应关系,并不一定存在显式的表达。

尽管信用风险计量有很多领域还处于研究阶段,不过信用风险评级发展较早,从1968年奥尔特曼(Altman)引入的Z-score模型开始,到现在的logistic模型、机器学习等方法,在发达国家,不论是理论研究,还是实际应用,信用风险评级都已经相当的成熟。那么我们是否可以直接搬来使用呢?信用风险内部评级模型,方法的选择固然重要,但是好的方法并不一定对应好的结果,实际上模型表现更多的决定于问题本身情况和问题解决的处理细节。我国的银行业进行信用风险评级,虽然在技术上的有一定的“后发优势”,但是绝对不是简单的“直接拿来”。信用风险的内部评级工作需要根植于内部数据,来开发适合中国实际情况的评级模型。本文从银行内部评级的角度,对信用风险评级的若干问题进行了讨论,并提出了适当的处理方式。

二、数据特性

不同的数据特性适用不同的模型。例如,判别分析要求自变量符合多元正态分布;而Logistic回归对于数据的分布要求比较低,而且在处理纲目数据方面有着非常大的优越性。在变量不服从多元正态分布的情况下,Logistic回归优于判别回归;但是如果变量服从多元正态分布,那么线性判别规则是最优的。而机器学习类的模型,对于分布要求不高,而且处理离散变量也有明显的优势,例如决策树、神经网络。

模型没有绝对的最优,必须按照数据情况来选择合适的模型。数据情况的统计分析,是十分重要的,即使国外已经有经验表明某种模型表现优异,也有结合实际的建模数据进行分析。如果我国的数据情况与国外不同,不符合该模型的假定,该模型就不可取。

所以,建模的第一步工作就是分析数据情况,讨论各种可能模型的适用性,初步确定符合数据情况的模型框架。

三、分布的变化

既然信用评级的基本思想是从历史数据中提炼信息来预测未来的客户信用状况。那么,即使我们从历史数据中提炼出了完整的信息,如果历史数据与未来情况不同,预测的可信度也会成为问题。

一个比较典型的问题是宏观经济的变化。宏观经济的变化对于整体违约概率的影响是非常大的,如图1所示,美国历年来的公司违约情况。公司客户的评级往往主要依据公司的财务数据来得出结论,而实际上,即使是相同的财务比例,在不同的宏观经济情况下,也有不同的表现。公司类客户同样还要考虑整体行业的演变过程,根据经济学理论,行业生命周期往往经历萌芽期-扩展期-成熟期-衰退期四个周期。

在消费者评分模型中,还有一个问题是人口漂移。我国目前正处在精神文明和物质文明高速发展的阶段,人口特性变化很快,如打工族的出现、贷款购房的增加、家用轿车消费增加等。这些变化会导致潜在信用消费人群和信用观念的变化。这种随着经济环境、人口结构和生活方式的变迁使样本人群的范围和特质发生变化,一般被称为人口漂移。人口漂移会使原有评分标准下的评价结果与现实情况不符,这时就应适当的调整权值修正人口漂移带来的偏差,并不断更新作为训练样本的数据。

在宏观经济的变化引起的违约概率的整体变化,需要建立宏观经济模型来调整客户评级;而类似人口漂移等问题,数据结构都已经发生了变化,需要经常的更新训练样本,升级评级模型。评级模型有个别模型本身对于分布变化的这类问题有一定的解决能力,例如最近邻法,它可以直接加入新的申请者或删除老的用户的方式动态升级系统,从而克服人口漂移带来的问题。

四、拒绝推断

当我们使用训练样本进行模型研究的时候,所有训练样本都是已经有信用表现的客户,即都是曾经被授信的客户,而申请被拒绝的客户不在其列。但是当我们使用模型的时候,却面对了所有的可能客户(即包括了按照以前的标准被授信或者被拒绝的客户),既然我们模型从来就不认识被拒绝客户,又如何对他们作出判断呢?所谓“拒绝推断”(refusereference)是指如何从被拒绝的申请人中鉴别出应向其授信的申请人的问题。模型开发者面临的情况。

在完全不准确(近乎随机)的信用评分的情况下,跃为较为精确的评级模型,“拒绝推断”造成的影响不是很严重。当然实际情况不会如此,即使是简单的专家选择,也会使得训练样本有偏。而开始使用模型后,由于人口漂移等诸多因素,原有的信用评级模型随着时间的流逝而渐渐失效,从而需要不断地更新。“拒绝推断”是信用操作中无法回避的重要问题,目前主要的解决有部分接受法、混合分解法等。

1.部分接受法

这是一种解决这类问题的较理想的方法,但是却不会受到经营者的欢迎。部分接受法就是在未被授信的客户集中进行随机的取样,批准他们的贷款申请,然后观察其以后的行为。这些申请者,被赋以相应的权重,然后和那些通过原有规则获得批准的客户(或者是它们当中的随机取样)联系在一起,这将会带来完全随机的人群样本,可以用来创建新的评级模型。但是经营者往往不愿意这样做,他们的理由就是既然那些客户已经被认为是没有好的信用质量,批准他们的信用申请会带来损失。但是,如果授信方接收了当中一些人的申请,那么就可以通过建立更加具有预测能力的模型再长期获利。在任何情况下,授信方的利润都不会因为这些取样而受到太大的影响,因为这些取样都是经过仔细挑选的。关于部分接受法的研究还需要更加广泛的工作,不过有一点可以肯定的是,这个方法需要前台经营部门和风险管理部门的通力合作和预先的计划。

2.混合分解法

这是一种在没有任何关于人群信息的情况下,估计两种人群比例的方法。使用这种方法的前提是关于好坏人群的性质分布的假设。特别是,必须假设知道这些分布就等同于知道一些参数的值,而这些值是可以通过数据估计的。这种方法的关键就在于将假定的优质客户分布与假定的劣质客户分布的加权平均作为观察值的分布与整体样本分布的匹配。如此得到的整体样本分布称为“混合分布”。

这一方法可以让人们能够利用已知分布的一些优异性质,但它的弊端也很明显,就是关于好坏分布的假设必须是准确的。不幸的是,信用数据的特征非常复杂,想准确的得到它的分布往往是很困难的。

五、数据真实性

这是一个比较有中国特色的问题,虽然发达国家也有财务欺诈,但是绝对没有中国的严重。由于制度的缺失,或者制度执行的乏力,在中国,即使是会计师事务所审计出来的数据可能也是不可靠的。所以反财务欺诈,对于模型开发者是面临的严峻问题。但是模型开发者能做的只能是发现在统计意义上或者逻辑关系上出现的异常现象。

六、数据缺失

我国银行建立评级模型,面临最为严重的问题是数据缺失。在数据缺失非常严重的情况,建立一个优秀的模型几乎是不可能的,所以在此讨论在能建模的前提下,数据缺失问题如何处理。公务员之家

如果一个变量缺失一定比例(例如50%)以上,只有放弃该变量;如果从经济学含义上,该变量确实非常重要,那么只有通过专家的经验来寻找可替代的变量(或者变量组合)。例如,家庭地址的所属区可能是十分重要的变量,但是并没有被记录,或者建模人员无法从家庭地址中提炼出区域,那么可以通过邮政编码和电话号码结合表征区域变量。

在数据缺失不是很严重的情况下,我们可以采用缺值替代的方法,例如均值替代、同类均值替代等,或者在不影响数据量的前提下也可以直接删除数据缺失的记录。

以上讨论的都还是完全随机缺失,这类缺失是完全随机发生的,不影响样本的无偏性。但是缺失更常见的随机缺失和非随机缺失,所谓随机缺失是指该变量的数据缺失与其他变量有关,例如财务数据缺失情况与企业的大小有关;非随机缺失是该变量的缺失与本身取值有关,如高收入人群的不原意提供家庭收入,财务情况差的公司不提供财务报表。

对于随机缺失和非随机缺失,删除记录是不合适的,随机缺失可以通过已知变量对缺失值进行估计;而非随机缺失还没有很好的解决办法。总结而言,缺值问题还是一个需要深入研究的问题。

七、过度拟合

由于样本中存在噪音,所以模型的拟合优度只能达到一定程度,这是理论能达到的最优拟合度。有些时候,当模型把噪音当成了信息进行拟合,使得拟合优度超过了理论的最优拟合度,过度拟合的模型实际上包含了错误的信息,预测能力很差。如图3是一个过度拟合的简单例子,对于图中的点,我们通过线性拟合和非线性拟合得到拟合曲线a和b,显然的曲线b的拟合优度要高于曲线a,但是如果本质上y和x之间是线性关系,那么非线性拟合的模型假设是错误的,较高的拟合优度实际上是过度拟合造成的。

过度拟合可以通过评价样本等方法来解决,如图4,当训练不断进行,训练样本的误判率不断降低,而评价样本则呈现先降后升的情况,那么当评价样本的误判率到最低时,我们就应该停止训练。

八、指标选取中一些问题

信用评级在我国还处于起步阶段,而发达国家已建立起一套相当完备的标准,在很多方面我们可以借鉴已有成果,但我国的文化习惯和道德标准与发达国家之间存在很大差异,在选取指标时应注意国情和评估的具体目的。具体评价指标的选取各国具有不同,如美国法律不允许将性别、年龄等个人属性作为指标列入消费者信用评估体系,但这显然是非常重要的指标,而且我国目前没有这样的法律规定;德国将是否服兵役作为一项重要指标;意大利将出生省份和婚约中对共同财产的要求作为重要指标;而日本则将供职公司是否上市以及公司的雇员数作为重要指标。

九、留酌情处理权

信用评级需要留给专家一定的酌情处理权。一方面,在我国信用评级制度发展的起步阶段,在信用体系未完善之前,信用信息的提交和披露还很不规范,信息的真实性和准确性还无法得到保证,利用评估模型得出的结论固然客观,但若模型计算所依据的信息本身有问题还是会发生误判;另一方面,评级模型是统计意义上的函数关系,对于个别的特例情况,不一定能得到合理的评级。所以,在实际工作中应对此保留酌情处理的权利,根据专家的经验和授信方的具体要求对评级进行认定或者调整。