基于不平衡數據的FL-lightgbm算法研究及其應用
發(fā)布時間:2024-06-06 04:30
隨著人們消費觀念的改變,“超前消費”的概念被越來越多的人所認可,消費金融迎來了蓬勃發(fā)展。它能使用戶提前負擔起暫時無法負擔的商品,加速商品流轉,在一定程度上促進了經濟的發(fā)展。消費金融貸款有著小額、無抵押、無擔保的特點,這些特點使消費金融貸款在惠及更多中低收入人群的同時,也為消費金融公司帶來了貸款違約的風險。本文嘗試用機器學習的方法預測用戶違約的風險,降低消費金融公司的壞賬率。傳統(tǒng)的機器學習方法通常假設數據是均勻分布的,但消費金融貸款數據的分布是不平衡的,即未違約用戶的數量遠大于違約用戶的數量,在這種情況下,采用傳統(tǒng)的算法會導致模型過多地關注未違約用戶的樣本,導致對少數違約用戶的錯分,這種錯分會給消費金融公司造成極大代價。因此研究消費金融貸款中的不平衡的違約數據分類問題有重要意義。本文基于消費金融公司捷信的貸款違約數據,對用戶是否違約進行預測。首先對數據做了預處理和探索性分析,并根據數據特點構建新特征,選取xgboost模型中重要性排名前150的特征構建模型;其次本文選取xgboost和前沿的lightgbm模型分別建模,采用AUC作為評估指標,發(fā)現lightgbm模型整體上優(yōu)于xgboo...
【文章頁數】:71 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3990308
【文章頁數】:71 頁
【學位級別】:碩士
【部分圖文】:
第1章緒論上海師范大學碩士學位論文4圖1-1技術路線圖1.4本文主要貢獻本文使用捷信提供的消費金融貸款數據,分別構造xgboost、lightgbm及改進損失函數的lightgbm模型來預測用戶貸款違約概率,并采用AUC進行評判。對不同算法的AUC值進行對比,可以發(fā)現改進損失函數....
上海師范大學碩士學位論文第3章基于損失函數的focalloss改進19圖3-1損失函數的單調遞減形式y(tǒng)f(x)被稱為margin,其作用類似于回歸問題中的殘差yf(x)。常見的二分類損失函數主要有以下幾種:(1)0-1損失(0-1loss)0-1loss是最原始的損失函數,它直接....
第3章基于損失函數的focalloss改進上海師范大學碩士學位論文20()11fxpe公式(3-5)可表示如下圖圖3-2二元交叉熵的損失表示則可得損失函數L[ylogp(1y)log(1p)]公式(3-6)即()()()()11[log(1)log(1)]NiiiiiLypypn....
第3章基于損失函數的focalloss改進上海師范大學碩士學位論文20()11fxpe公式(3-5)可表示如下圖圖3-2二元交叉熵的損失表示則可得損失函數L[ylogp(1y)log(1p)]公式(3-6)即()()()()11[log(1)log(1)]NiiiiiLypypn....
本文編號:3990308
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/huobilw/3990308.html