单位文秘网 2020-09-10 10:15:44 点击: 次
本中心风险研究小组
丁正中
壹、信用评分发展历史(Historyofcreditscoring)
信用源于拉丁语credo,意谓「相信」(believe),因为借贷双方相互信任关系而达成交易,但借方为降低损失,在决定借款前,会先评定借款人风险高低,作为是否借款之参考,而信用评分(CreditScoring)便是基于这么概念,所发展出来风险评定工具。通常认为Durand在1941年将Fisher(1936)提出判别分析方法(DiscriminantAnalysis)应用于区分贷款用户好坏,为信用评分应用之开端。另有一个说法是,在1930年代,邮购企业(mail-ordercompany)为了克服不一样信用分析人员对于信用决议产生不一致情形,引进数值评分系统,而二次世界大战发生后,因大多人全部投入战场,很多信贷企业(financehouse)及邮购企业缺乏教授做信用分析工作,这些企业便要求有经验人将评定信用准则写出来,方便没有经验人做贷款决议。总而言之,早期设计评分卡(Scorecard)统计学家,最初想法,是想仿照在申请保险时,会有一张评分卡,依据不一样年纪及性别,而给不一样费率,若是银行在办理贷款时,也能设计一张评分卡,依据贷款用户特征,给不一样分数,作为是否授信依据,能够有效节省核贷时间,又能达成风险管理目标。
在1950年代,已经有些人将自动化信用决议和统计分类技术结合,发展帮助授信决议模式,但因计算工具不便,在样本数及评分模式设计上限制颇多。而在此期间,由数学家BillFair及工程师EarlIsaac在旧金山(SanFrancisco)成立第一家信用评分顾问企业。1960年代信用卡出现,让银行及信用卡发卡机构了解到信用评分是很好用工具,因每日全部有大量申请案件,在成本及人力考虑下,自动化决议能够节省不少成本及人力,又能维持一定决议质量,而伴随计算机科技快速演进,信用评分和决议支持系统(decisionsupportsystem)结合,使应用层面更广泛,比如:汽车贷款、信用卡、邮购、直销、房贷、保单、手机账户等皆可透过评分系统作用户管理。
贰、信用评分原理(ThePrincipleofCreditScoring)
信用评分基础原理是借由分析技术,由过去资料来研发能估计未来授信用户表现分数,其假设在授信审核时有部分已知用户特征(characteristics),会和授信用户未来是否按时还款相关连,一旦找出这些关连性,在假设未来情况会和过去相类似情形下,能够套用现在数据,作未来估计。这些假设和早期授信人员大多利用过去授信审核经验,判定授信户未来是否还款情形相同,所不一样是现在很多数据可纪录在数据库中,藉由软件及算法(algorithm)辅助,可使分析更正确。尤其要注意是,信用评分模式是假设未来情况会和过去相类似(Thefuturewillresemblethepast),但未必全部是如此,且通常时间经过越久,信用评分模式估计力会越差,所以评分模式建立完成后,会连续监控(monitoring),以确保评分模式能有效运作。
参、信用评分模式研发步骤(CreditScoringModelDevelopmentProcess)
研发信用评分模式,要有熟悉市场分析、风险管理及统计方法人员,并由信息部门提供数据库及程序开发等相关帮助,但要是否要自行研发,并没有标准答案,时间、成本、人员训练及未来维护全部是考虑关键。本中心就先前研发信用卡申请人评分经验,大致整理以下研发步骤,或可提供有意自行研发金融机构作为参考。
一、研究目标及定义(ObjectiveandGood/BadDefinition)
要发展评分模式前,必需先决定研究目标及想要估计事件,并要有明确定义,未来在应用及解释上才不致混淆,所以事件定义是经由讨论决定,而非分析人员单独决定。比如:研究目标为估计授信用户未来十二个月发生违约事件,但违约事件有很多不一样定义,数据源也可能不一样,很多问题要逐一厘清,讨论会变得冗长而没有效率,所以在讨论前,先决定想要达成目标,请信息部门提供数据库中相关数据,并由分析人员作初步分析,开始讨论时会较有效率。值得注意是,越复杂定义,数据取得也越困难,所以定义除了要明确,也应尽可能简化。另外,模式未来应用目标不一样,定义也可能不一样,比如:一样是延迟缴款超出45天用户,若模式目标是在增加赢利或市占率,较有可能定义为好用户(Good),但若目标是降低损失,较有可能定义为坏用户(Bad)。
二、数据库和选择样本(DatabaseandSampleSelection)
本中心先前将过期数据保留在磁带中,造成研究人员在资料撷取时不便,在去年开始建置数据仓储(DataWarehouse),保留全部时点数据状态,方便以后研究使用,同时可避免占用在线数据库资源,降低对日常营运所产生影响。数据仓储因数据量庞大,撷取较耗时,建立数据超市(DataMart)可节省数据撷取时间,且在设计数据超市字段时,请资深分析人员提供相关经验,未来可节省数据整理及转换时间。
抽样(Sampling)能够处理资料量过大问题,分析时更具效率,但必需掌握研究目标群体(TargetPopulation)特征,避免抽样时产生偏误。另外,越大样本会有越好评分结果,这种说法并非完全正确,因通常好用户多于坏用户,假设全部条件全部相同情况下,100,000个好用户和500个坏用户所建立评分模式,正确判定力会低于只有10000个好用户和3,000个坏用户所建立评分模式。将样本分为发展组样本(DevelopmentSample)和测试组(HoldoutSample),模式研发完成后作验证(Validation),可避免研究人员选样偏差(bias)或忽略了一些关键因子,造成模式在实际应用时产生落差。
三、清理资料(CleantheData)
“Garbagein,garbageout.”即使大家全部知道这个道理,但实际上要将数据清理洁净,却不是件轻易事。通常数据转入数据仓储(DataWarehouse)前,信息人员所订定准则大多是数据是否符合字段定义,但不确保分析时不会有问题,以年纪为例,在数据转入数据仓储时要符合数值型态,且设定上限为120,下限为0,但经分析人员分析后,发觉18岁以下也有信用卡主卡,甚至有很多数值集中在99,显然这些年纪是有问题。假如资料量不多,对于分析结果不致影响太大,能够直接删除或将数据作区隔,但仍需了解资料从何处取得,因为有问题资料通常是起源相同。
四、分析资料(AnalyzetheData)
分析关键目标是找出隐含在数据中相关(Correlations)、型态(Patterns)、集群(Clusters)、趋势(Trends),资料虽经过前述清理步骤,通常还需要经过数据转换(DataTransformation),才能进行分析。比如:数据库中会纪录信用卡发卡日期和停卡日期,但分析时变量可能需要信用卡持卡期间(Duration),这时候就要经过数据转换过程。实际上数据转换有很多技巧,有时还牵扯到部分复杂数学运算,如:Log、SIN、COSIN等转换,但转换关键目标是要能分析出有意义结果,分析人员除了了解数据转换及分析方法,也要了解最初定义研究目标,才有可能得到最终结果。
五、建立模式(ModelBuilding)
建立模式可利用方法很多,可分为统计方法(StatisticalMethods)和非统计方法(Non-statisticalMethods)两种类型,常见统计方法包含有判别分析(DiscriminantAnalysis)、回归(regression)、逻辑斯回归(logisticregression)、分类树(ClassificationTrees)等;而非统计方法有类神经网络(NeuralNetworks)、基因算法(GeneticAlgorithms)、教授系统(ExpertSystems)等。不一样方法,有不一样假设和限制,选择之前必需先考虑清楚,避免误用。在实务利用上,选择逻辑斯回归(logisticregression)来建构评分模式,结果可直接产生评分卡(Scorecard),在模式实施(implementation)上成本较低也较快速,是很多模式研发人员(Modeler)常选择方法。
信用评分通常是将用户分为好用户(Good)和坏用户(Bad),就应用而言,回归模式虽简单易懂,但已逐步被逻辑斯回归模式所替换,关键是受到以下两种原因影响:
1.回归模式所计算出来条件机率估量值(Estimateofconditionalprobability),有可能会大于1或小于0,违反机率须介于0和1之间定义。
2.在回归模式中,假设自变量(IndependentVariable)X和因变量(DependentVariable)Y之间关系为线性,则不管X值为何,其对条件机率边际影响全部是恒定,显然和我们通常认知不符。举例而言,假设购置房屋决议(买或不买)和收入相关,若收入太低,即使增加20-30%收入,仍然是买不起,对决议没有影响;另一个情况是收入已在某一水平之上,购置机率趋近于1时,收入再增加,对于购置决议也不再有影响。
回归模式通常X愈是趋近两端,条件机率愈不易有显著改变,而逻辑斯回归模式,当X愈趋近-∞,条件机率以愈来愈慢速度趋近于0;当X愈趋近∞,条件机率以愈来愈慢速度趋近于1。以图形来说明,若研究收入和信用好坏关系,以横轴为收入,好用户(Good)为1,坏用户为0,可描绘出图1。若同时配适(fit)回归和逻辑斯回归模式,由图2可看出,逻辑斯回归展现S型,会和实际观察值较靠近。
图1回归和逻辑斯回归模式比较(1)
图2回归和逻辑斯回归模式比较(2)
模式建立最终步骤,必需以测试组样本(HoldoutSample)作验证(Validation),除可避免抽样偏误(Bias)问题,亦可检视模式过分配适(Over-fitting)问题。若模式利用发展组样本估计力很好,但用另一组数据估计力却显著下降时,显然模式不够稳健(Robust),未来实际利用时,会因数据不一样而产生不一致估计结果。
六、模式布署及系统测试(DeploytheModelandSystemTest)
模式终究是帮助人做决议参考,在模式经过验证后,必需将模式产生结果写入日常使用决议系统中,提供未来作决议时参考。在此阶段,信息部门(ITDepartment)饰演关键角色,但熟悉业务、风险管理及统计方法人员配合也很关键。另外,必需制作相关文件及作人员训练,在系统测试时,有利于评定系统运作是否和先前设定目有一致性,也能降低未来使用时对于评分(Score)误解或误用。
七、连续监控(MonitoringandTracking)
评分模式估计力会因时间不一样而有改变,透过定时及连续性模式监控,能够确定模式估计力仍在合理范围内。若模式估计力和发展模式时有显著差异,则必需调整评分模式结果或重新建构新评分模式。
评分模式能够估计未来发生用户违约机率,假设高风险有高赢利,一样用户,风险管理人员和市场分析人员可能会有不一致见解,将应用模式所产生决议纪录下来,并连续追踪,适时调整决议,较能取得风险和赢利平衡点。
肆、结语
信用评分是将数据(Data)转换为可用知识(Knowledge)帮助决议过程,对照现在很多企业使用数据采矿(datamining)方法,会发觉二者方法全部相类似,全部是由数据为开端,找出隐含于数据中知识,依据所得到知识作决议,不一样仅是应用领域不一样,而有不一样名称。
使用信用评分优点有降低人事成本,决议更有效率及一致性(Consistency)等。即使有研发成本较高,如:购置软硬件设备及顾问费用,评分结果可能会被误解或误用等缺点,也有些人批评一些建立评分模式方法,像黑箱作业,无法解释清楚,不过就如同一句谚语所说:”Theproofofthepuddingisintheeating.”,好坏试过即知。
参考文件
郭敏华(20XX),债信评等,台北:智胜文化
LynC.Thomas,DavidB.EdelmanandJonathanN.Crook(20XX),CreditScoringanditsApplications,Philadelphia:SIAM
ElizabethMays(20XX),HandbookofCreditScoring,NewYork:AMACOM
DavidW.Hosmer,StanleyLemeshow(20XX),AppliedLogisticRegression,NewYork:JonhnWiley&Sons,Inc.
ElizabethMays(1998),CreditRiskModeling:DesignandApplication,NewYork:AMACOM
JohnB.Caouette,EdwardI.Altman,andPaulNarayanan(1998),ManagingCreditRisk,NewYork:JonhnWiley&Sons,Inc.
RobertCole,LonMishler(1998),ConsumerandBusinessCreditManagement,NewYork:Irwin/McGraw-Hill
(责任编辑:单位文秘网) )
地址:https://www.kgf8887.com/show-157-25167-1.html
下一篇:服装企业营销总监工作职责
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用