前言:尋找寫作靈感?中文期刊網用心挑選的信用評分方法在信貸風險管理中實踐,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
摘要:信用評分是金融機構對信貸客戶進行風險評估的基礎工具。信用評分的理論和實踐經過近半個世紀的發展,已經逐步成熟的應用在銀行的貸前審批、貸中、貸后的風險監控中。信用評分主要包括申請評分、行為評分和流失評分。信用評分的全流程包括數據準備、數據預處理、探索性分析、變量選擇分析、模型分析、信用評分轉化和模型部署等流程。隨著人工智能的發展以及更多的數據維度的使用,金融機構將通過信用評分進行更加精細化的管理,快速有效地評估企業和企業主的信用風險。
關鍵詞:信用評分;風險;logistic回歸
一、信用評分的發展歷程
信用評分從狹義來講主要是信貸機構在發放貸款時通過科學的評估方法對歷史違約樣本和非違約樣本進行分析建模,從而構建違約概率模型,對每個潛在的貸款客戶進行違約風險評分。從廣義來看,信用評分可以應用到社會信用評估的各個領域,比如公共信用評分、學術誠信評分、招投標誠信評分等等。隨著移動互聯、機器學習等信息技術的普及以及海量互聯互通的信用數據的產生,信用評分已經滲透到每個人的工作、生活、學習的各個領域[1]。美國工程師Bill Fair和數學家Earl Isaac在1956年設立了Fair Isaacz咨詢公司,即后來著名的FICO公司,1958年他們制作了首批申請評分卡,主要面向消費金融公司。20世紀60年代中期,許多石油公司出現了信貸違約風險問題,因此,他們開始引入信用評分。包括信用卡機構在這個期間由于無序競爭也產生了巨額損失,因此也開始紛紛引入信用評分。自引入評分卡以來,違約率下降了50%。1972年FICO幫助Wells Fargo開發系統實現了信用評分的自動化。并且在1975年首次完成了信用評分系統。隨著信息技術的發展,除了消費信用領域,信用評分也在其他領域進行了應用。1993年,FICO公司開發了一種面向小微企業的信用評分模型。1995年信用評分首次應用在住房按揭證券化業務中。從2000年開始,貸款機構開始意識到個人貸款和小微企業貸款差異不大,信用評分開始在小微企業中普及。由于巴塞爾協議規定銀行需要拿出一定資本用于覆蓋客戶在違約時由信用風險帶來的損失,而信用評分可以轉換成違約概率,因此信用評分也成為金融機構計算資本金是否滿足最低資本要求的工具。近年來,新興的方法如神經網絡、支持向量機、隨機森林等開始引入信用評分領域[2]。
二、信用評分模型的主要數據來源
隨著金融科技行業的發展,信用評分可以使用的數據源也越來越廣。目前信用評分主要數據源包括銀行存量數據、用戶提供數據、人行征信數據及第三方征信公司提供數據這四個部分。由于用戶提供數據需要鑒真去偽的難度較大,這部分的數據主要作為校驗比對。真正納入評分模型的主要是另外三個部分的數據。2020年1月19日人民銀行二代征信系統正式上線,與一代征信系統相比,二代征信系統在信息采集、產品加工、技術架構和安全防護方面,均進行了優化改進[3]。目前已經作為金融機構判斷用戶風險的主要數據來源?;ヂ摼W技術的發展也培育了大量的征信機構,這些機構擁有及加工的信用補充數據也成為金融機構風險建模的一個重要補充部分,比如黑名單篩查、四要素認證、多頭借貸名單、反欺詐排查等等。銀行內部也開始構建自己的大數據平臺,其沉淀的違約客戶數據、客戶KYC數據等也成為建模的重要數據源。國家發改委公共信用信息中心也提供了全國工商企業的黑白名單、行政處罰等信息。全國法律文書網提供了全國企業和個人的法律訴訟文書查詢服務,這些數據源也是金融機構開展信用評價非常重要的補充數據。
三、信用評分模型的類別
(一)申請評分卡模型
申請評分卡模型用于借款人在申請信貸業務時對其當前時點的信用狀態進行評估,是風險管理最重要的組成部分,屬于貸前風控管理。也稱為A卡(Application Scorecard)。
(二)行為評分卡模型
行為評分卡主要用于借款人在借款持續期間其信用行為及違約風險變化過程的監控及評估,并測算借款人未來的還款能力和意愿,屬于貸后風控管理。也稱為B卡(Behavior Scorecard)。
(三)催收評分卡模型
在借款人當前還款狀態為逾期的情況下,預測未來該筆貸款變為壞賬的概率。也稱為C卡(Collection Scorecard)。
(四)三種評分卡的差異
從使用的時間角度看,申請評分卡主要側重于貸前、行為評分卡側重于貸中、催收評分卡側重于貸后。從使用數據看,申請評分卡一般做1年左右的貸款信用分析,而行為評分卡需要2-3年的數據,催收評分卡對數據的要求更多,需要加入其他的數據維度,互聯網大數據時代有很多外部數據可以作為信用評分的重要組成部分[4]。從使用變量看,申請評分卡主要用的是申請者的背景資料,如基本信息,以及人行二代征信信息、第三方外部數據源等。行為評分卡因為有了用戶的信貸記錄可以多增加行內行為數據。從使用模型看看申請評分卡主要使用logistic回歸以及AHP等模型,而在行為評分和催收評分則可以采用更多的分析模型,比如生存分析、隨機森林、人工智能等模型,這些模型在預測精度方面都會比logistics傳統的線性模型來的高一些,但是解釋性會差一些。金融機構可以根據申請評分卡的評分來決定該客戶是否可以享受純信用貸款,還是必須增加一部分抵押物,或者是拒絕申請。同時,也根據其他的信用評分來決定其貸款額度以及貸款利率。金融機構可以通過行為評分卡來判斷客戶信用額度是否需要調整、根據違約或者逾期情況制定清收策略等。
四、信用評分模型構建流程
(一)數據準備
信用評分模型的數據準備是一個非常重要,但常常長期被忽視的問題,有句諺語叫“垃圾進,垃圾出”,如果數據有質量問題,不具備代表性,那么產生的結果也不具備參考意義。用歷史數據進行建模,然后對未知樣本進行預測有個默認前提假設,即歷史數據與未知樣本處于相同的分布。然而,作為一家金融機構本身是很難獲得足夠多的違約樣本作為“病人”納入模型訓練,另外,不同金融產品產生的違約客戶樣本也不適合放到一個模型進行訓練,因此,違約樣本的不足是銀行信用評分模型的一個說不出的痛,更不要要求違約樣本需要在不同自變量分箱中保持合理的分布了[5]。另外,信用白戶也是數據準備階段會遇到的一個難題,信用白戶指沒有任何貸款記錄的貸款申請用戶,這些用戶在關鍵指標上面基本沒有任何可以用于建模的有效信息。因此,在數據準備階段建議區域性的商業銀行,應該通過當地人行共享違約客戶的數據,從而增大違約客戶樣本量及覆蓋面[6-7]。否則通過單個商業銀行來積累違約樣本,效率太低,成本太高。每個違約樣本都是一筆不良。在數據準備階段也要對客戶的多頭借貸、黑名單等外部數據進行多方校驗,以免陷入詐騙團伙的圈套。
(二)數據預處理
數據預處理階段的工作主要包括數據清洗、缺失數據處理、異常值處理等。這個過程中會遇到很多變量缺失比例較高的問題,和傳統的線性回歸分析不一樣,線性回歸對缺失值問題要求比較高,而信用評分主要采用Logistic回歸方法,而且所有連續變量都進行了分箱處理,所以,如果變量缺失,可以將其單獨做入一個分箱[8]。在做信用評分數據預處理過程中還有一個顯著的問題就是樣本不平衡問題,常常違約樣本占總樣本的比例甚至都小于1%,因此要采用重抽樣的方法來增大違約樣本的比例,使得違約樣本與非違約樣本的比例保持在1:1或者1:3這樣的范圍。另外,還要對違約樣本相對自變量的分布進行檢查,如果分布太偏對預測效果的影響也比較大。
(三)探索性分析
數據預處理完,就要進行探索分析,探索分析主要看各個自變量的分布情況,與因變量的相關情況,以及各個自變量之間的相關系數矩陣。在這個過程中,已經可以初步判斷哪些自變量與因變量成強相關關系。在變量探索階段需要將每個自變量與因變量進行散點分析以判斷自變量與因變量之間的相關程度。除此以外,可以做自變量相對因變量的盒型圖比較,從而判斷每個自變量對因變量的影響程度以及異常值的過濾[9-10]。
(四)變量選擇(WOE)分析
WOE(Weight of Evidence)編碼是信用評分過程中最重要的一個環節,通過這個環節才能通過計算不同變量的不同分箱對因變量的IV(Information Value)從而計算變量的重要性,也為后期計算信用評分卡提供基礎信息。通過每個變量的IV信息,可以判斷自變量的重要程度排序,從而剔除一些影響較弱的自變量[11]。
(五)模型分析
將WOE轉換完的變量進行Logistic回歸,對回歸結果進行檢驗。
(六)信用評分轉化
根據Logistic回歸結果進行評分轉換,轉換成評分卡里每個變量每個分箱所對應的加減分。在該環節需要設定基礎分值,以及PDO(Points to Double the Odds)。假設 Odds=50:1時評分=600,如果PDO=50,意味著如果分數增加或者降低50分,則Odds減少或者增加一倍。
(七)模型部署
模型訓練完,需要進行驗證,主要分析KS指標和PSI指標。KS用于模型風險區分能力評估,KS指標衡量的是好壞樣本累計分布之間的差值。好壞樣本累計差異越大,KS指標越大,那么模型的風險區分能力越強。KS值在0-1之間,大于0.5,模型的效果就很好了[12-13]。PSI指標反映了驗證樣本在各分數段的分布與建模樣本分布的穩定性。PSI越小越好,一般在0-0.1以內,模型穩定性比較好。模型驗證通過后,一般需要部署在生產環境,有新貸款申請客戶的數據作為輸入參數,經過模型運算后得出該用戶的信用評分。
五、信用評分的未來發展方向
信用評分是金融機構進行精細化管理的重要工具,隨著金融機構對企業畫像數據維度的擴充以及人工智能算法的創新,金融機構將能夠更加精準和及時的對企業以及企業主的風險進行畫像,除了企業及企業主本身,金融機構也具備對其關聯機構或利益相關人的風險進行評估及追蹤,從而構成全維度的風險評估及預警體系。為金融機構的風險管理提供有效保障[14]。隨著人工智能算法的普及以及更多的數據維度的加入,信用評分的精度將得到顯著提升,信用評分在金融機構內部的使用范圍也將越來越廣,信用評分對企業和個人的影響越來越大,必將導致每個企業和個人都將更加珍惜其信用,從而讓有信用的企業和個人做生意不困難。
作者:林煒 單位:光大銀行上海分行