领导讲话

总结汇报

演讲致辞

心得体会

首页 > 心得体会 >读后感 > 消费金融信用风险研究应用信用评分概述

消费金融信用风险研究应用信用评分概述

单位文秘网 2020-09-10 10:15:44 点击: 次

消费金融信用风险研究—信用评分概述

　本中心风险研究小组

　丁正中

　壹、信用评分发展历史(Historyofcreditscoring)

　信用源于拉丁语credo，意谓「相信」(believe)，因为借贷双方相互信任关系而达成交易，但借方为降低损失，在决定借款前，会先评定借款人风险高低，作为是否借款之参考，而信用评分(CreditScoring)便是基于这么概念，所发展出来风险评定工具。通常认为Durand在1941年将Fisher(1936)提出判别分析方法(DiscriminantAnalysis)应用于区分贷款用户好坏，为信用评分应用之开端。另有一个说法是，在1930年代，邮购企业(mail-ordercompany)为了克服不一样信用分析人员对于信用决议产生不一致情形，引进数值评分系统，而二次世界大战发生后，因大多人全部投入战场，很多信贷企业(financehouse)及邮购企业缺乏教授做信用分析工作，这些企业便要求有经验人将评定信用准则写出来，方便没有经验人做贷款决议。总而言之，早期设计评分卡(Scorecard)统计学家，最初想法，是想仿照在申请保险时，会有一张评分卡，依据不一样年纪及性别，而给不一样费率，若是银行在办理贷款时，也能设计一张评分卡，依据贷款用户特征，给不一样分数，作为是否授信依据，能够有效节省核贷时间，又能达成风险管理目标。

　在1950年代，已经有些人将自动化信用决议和统计分类技术结合，发展帮助授信决议模式，但因计算工具不便，在样本数及评分模式设计上限制颇多。而在此期间，由数学家BillFair及工程师EarlIsaac在旧金山(SanFrancisco)成立第一家信用评分顾问企业。1960年代信用卡出现，让银行及信用卡发卡机构了解到信用评分是很好用工具，因每日全部有大量申请案件，在成本及人力考虑下，自动化决议能够节省不少成本及人力，又能维持一定决议质量，而伴随计算机科技快速演进，信用评分和决议支持系统(decisionsupportsystem)结合，使应用层面更广泛，比如：汽车贷款、信用卡、邮购、直销、房贷、保单、手机账户等皆可透过评分系统作用户管理。

　贰、信用评分原理(ThePrincipleofCreditScoring)

　信用评分基础原理是借由分析技术，由过去资料来研发能估计未来授信用户表现分数，其假设在授信审核时有部分已知用户特征(characteristics)，会和授信用户未来是否按时还款相关连，一旦找出这些关连性，在假设未来情况会和过去相类似情形下，能够套用现在数据，作未来估计。这些假设和早期授信人员大多利用过去授信审核经验，判定授信户未来是否还款情形相同，所不一样是现在很多数据可纪录在数据库中，藉由软件及算法(algorithm)辅助，可使分析更正确。尤其要注意是，信用评分模式是假设未来情况会和过去相类似(Thefuturewillresemblethepast)，但未必全部是如此，且通常时间经过越久，信用评分模式估计力会越差，所以评分模式建立完成后，会连续监控(monitoring)，以确保评分模式能有效运作。

　参、信用评分模式研发步骤(CreditScoringModelDevelopmentProcess)

　研发信用评分模式，要有熟悉市场分析、风险管理及统计方法人员，并由信息部门提供数据库及程序开发等相关帮助，但要是否要自行研发，并没有标准答案，时间、成本、人员训练及未来维护全部是考虑关键。本中心就先前研发信用卡申请人评分经验，大致整理以下研发步骤，或可提供有意自行研发金融机构作为参考。

　一、研究目标及定义(ObjectiveandGood/BadDefinition)

　要发展评分模式前，必需先决定研究目标及想要估计事件，并要有明确定义，未来在应用及解释上才不致混淆，所以事件定义是经由讨论决定，而非分析人员单独决定。比如：研究目标为估计授信用户未来十二个月发生违约事件，但违约事件有很多不一样定义，数据源也可能不一样，很多问题要逐一厘清，讨论会变得冗长而没有效率，所以在讨论前，先决定想要达成目标，请信息部门提供数据库中相关数据，并由分析人员作初步分析，开始讨论时会较有效率。值得注意是，越复杂定义，数据取得也越困难，所以定义除了要明确，也应尽可能简化。另外，模式未来应用目标不一样，定义也可能不一样，比如：一样是延迟缴款超出45天用户，若模式目标是在增加赢利或市占率，较有可能定义为好用户(Good)，但若目标是降低损失，较有可能定义为坏用户(Bad)。

　二、数据库和选择样本(DatabaseandSampleSelection)

　本中心先前将过期数据保留在磁带中，造成研究人员在资料撷取时不便，在去年开始建置数据仓储(DataWarehouse)，保留全部时点数据状态，方便以后研究使用，同时可避免占用在线数据库资源，降低对日常营运所产生影响。数据仓储因数据量庞大，撷取较耗时，建立数据超市(DataMart)可节省数据撷取时间，且在设计数据超市字段时，请资深分析人员提供相关经验，未来可节省数据整理及转换时间。

　抽样(Sampling)能够处理资料量过大问题，分析时更具效率，但必需掌握研究目标群体(TargetPopulation)特征，避免抽样时产生偏误。另外，越大样本会有越好评分结果，这种说法并非完全正确，因通常好用户多于坏用户，假设全部条件全部相同情况下，100,000个好用户和500个坏用户所建立评分模式，正确判定力会低于只有10000个好用户和3,000个坏用户所建立评分模式。将样本分为发展组样本(DevelopmentSample)和测试组(HoldoutSample)，模式研发完成后作验证(Validation)，可避免研究人员选样偏差(bias)或忽略了一些关键因子，造成模式在实际应用时产生落差。

　三、清理资料(CleantheData)

　“Garbagein,garbageout.”即使大家全部知道这个道理，但实际上要将数据清理洁净，却不是件轻易事。通常数据转入数据仓储(DataWarehouse)前，信息人员所订定准则大多是数据是否符合字段定义，但不确保分析时不会有问题，以年纪为例，在数据转入数据仓储时要符合数值型态，且设定上限为120，下限为0，但经分析人员分析后，发觉18岁以下也有信用卡主卡，甚至有很多数值集中在99，显然这些年纪是有问题。假如资料量不多，对于分析结果不致影响太大，能够直接删除或将数据作区隔，但仍需了解资料从何处取得，因为有问题资料通常是起源相同。

　四、分析资料(AnalyzetheData)

　分析关键目标是找出隐含在数据中相关(Correlations)、型态(Patterns)、集群(Clusters)、趋势(Trends)，资料虽经过前述清理步骤，通常还需要经过数据转换(DataTransformation)，才能进行分析。比如：数据库中会纪录信用卡发卡日期和停卡日期，但分析时变量可能需要信用卡持卡期间（Duration），这时候就要经过数据转换过程。实际上数据转换有很多技巧，有时还牵扯到部分复杂数学运算，如：Log、SIN、COSIN等转换，但转换关键目标是要能分析出有意义结果，分析人员除了了解数据转换及分析方法，也要了解最初定义研究目标，才有可能得到最终结果。

　五、建立模式(ModelBuilding)

　建立模式可利用方法很多，可分为统计方法(StatisticalMethods)和非统计方法(Non-statisticalMethods)两种类型，常见统计方法包含有判别分析(DiscriminantAnalysis)、回归(regression)、逻辑斯回归(logisticregression)、分类树(ClassificationTrees)等；而非统计方法有类神经网络(NeuralNetworks)、基因算法(GeneticAlgorithms)、教授系统(ExpertSystems)等。不一样方法，有不一样假设和限制，选择之前必需先考虑清楚，避免误用。在实务利用上，选择逻辑斯回归(logisticregression)来建构评分模式，结果可直接产生评分卡(Scorecard)，在模式实施(implementation)上成本较低也较快速，是很多模式研发人员(Modeler)常选择方法。

　信用评分通常是将用户分为好用户(Good)和坏用户(Bad)，就应用而言，回归模式虽简单易懂，但已逐步被逻辑斯回归模式所替换，关键是受到以下两种原因影响：

　1.回归模式所计算出来条件机率估量值(Estimateofconditionalprobability)，有可能会大于1或小于0，违反机率须介于0和1之间定义。

　2.在回归模式中，假设自变量(IndependentVariable)X和因变量(DependentVariable)Y之间关系为线性，则不管X值为何，其对条件机率边际影响全部是恒定，显然和我们通常认知不符。举例而言，假设购置房屋决议(买或不买)和收入相关，若收入太低，即使增加20-30%收入，仍然是买不起，对决议没有影响；另一个情况是收入已在某一水平之上，购置机率趋近于1时，收入再增加，对于购置决议也不再有影响。

　回归模式通常X愈是趋近两端，条件机率愈不易有显著改变，而逻辑斯回归模式，当X愈趋近-∞，条件机率以愈来愈慢速度趋近于0；当X愈趋近∞，条件机率以愈来愈慢速度趋近于1。以图形来说明，若研究收入和信用好坏关系，以横轴为收入，好用户(Good)为1，坏用户为0，可描绘出图1。若同时配适(fit)回归和逻辑斯回归模式，由图2可看出，逻辑斯回归展现S型，会和实际观察值较靠近。

　图1回归和逻辑斯回归模式比较(1)

　图2回归和逻辑斯回归模式比较(2)

　模式建立最终步骤，必需以测试组样本(HoldoutSample)作验证(Validation)，除可避免抽样偏误(Bias)问题，亦可检视模式过分配适(Over-fitting)问题。若模式利用发展组样本估计力很好，但用另一组数据估计力却显著下降时，显然模式不够稳健(Robust)，未来实际利用时，会因数据不一样而产生不一致估计结果。

　六、模式布署及系统测试(DeploytheModelandSystemTest)

　模式终究是帮助人做决议参考，在模式经过验证后，必需将模式产生结果写入日常使用决议系统中，提供未来作决议时参考。在此阶段，信息部门(ITDepartment)饰演关键角色，但熟悉业务、风险管理及统计方法人员配合也很关键。另外，必需制作相关文件及作人员训练，在系统测试时，有利于评定系统运作是否和先前设定目有一致性，也能降低未来使用时对于评分(Score)误解或误用。

　七、连续监控(MonitoringandTracking)

　评分模式估计力会因时间不一样而有改变，透过定时及连续性模式监控，能够确定模式估计力仍在合理范围内。若模式估计力和发展模式时有显著差异，则必需调整评分模式结果或重新建构新评分模式。

　评分模式能够估计未来发生用户违约机率，假设高风险有高赢利，一样用户，风险管理人员和市场分析人员可能会有不一致见解，将应用模式所产生决议纪录下来，并连续追踪，适时调整决议，较能取得风险和赢利平衡点。

　肆、结语

　信用评分是将数据(Data)转换为可用知识(Knowledge)帮助决议过程，对照现在很多企业使用数据采矿(datamining)方法，会发觉二者方法全部相类似，全部是由数据为开端，找出隐含于数据中知识，依据所得到知识作决议，不一样仅是应用领域不一样，而有不一样名称。

　使用信用评分优点有降低人事成本，决议更有效率及一致性(Consistency)等。即使有研发成本较高，如：购置软硬件设备及顾问费用，评分结果可能会被误解或误用等缺点，也有些人批评一些建立评分模式方法，像黑箱作业，无法解释清楚，不过就如同一句谚语所说：”Theproofofthepuddingisintheeating.”，好坏试过即知。

　参考文件

　郭敏华(20XX),债信评等,台北:智胜文化

　LynC.Thomas,DavidB.EdelmanandJonathanN.Crook(20XX),CreditScoringanditsApplications,Philadelphia:SIAM

　ElizabethMays(20XX),HandbookofCreditScoring,NewYork:AMACOM

　DavidW.Hosmer,StanleyLemeshow(20XX),AppliedLogisticRegression,NewYork:JonhnWiley&Sons,Inc.

　ElizabethMays(1998),CreditRiskModeling:DesignandApplication,NewYork:AMACOM

　JohnB.Caouette,EdwardI.Altman,andPaulNarayanan(1998),ManagingCreditRisk,NewYork:JonhnWiley&Sons,Inc.

　RobertCole,LonMishler(1998),ConsumerandBusinessCreditManagement,NewYork:Irwin/McGraw-Hill

　 (责任编辑：单位文秘网) )

地址：https://www.kgf8887.com/show-157-25167-1.html

上一篇：稽查涉税犯罪案件移送过程中执法风险及防范研究应用

下一篇：服装企业营销总监工作职责

热点文章

版权声明

本站由单位文秘网原创策划制作，欢迎订阅或转载，但请注明出处。违者必究。
本站部分资源搜集于互联网，如有侵权行为请尽快联系我们处理。

消费金融信用风险研究应用信用评分概述

热点文章

最新文章

版权声明