金融风控建模常用指标介绍(WOE, IV, KS, PSI)

2023-09-17 12:37:42

金融风控建模常用指标介绍(WOE, IV, KS, PSI)

近期在做金融风控相关项目,有必要把特征和模型的衡量指标总结下,以备不时之需。这次主要介绍4个指标(WOE, IV, KS, PSI)。

  • WOE(Weight of Evidence, 用于特征变换,衡量变量某个取值的预测能力)
    WOE算法已在我的另一篇文章数据预处理-分箱(Binning)和 WOE编码介绍过,这里不再赘述。

  • IV(Information Value, 衡量特征的预测能力)
    在这里插入图片描述其中,
    在这里插入图片描述
    IV值可以看作WOE值的加权求和,IV值的衡量标准可以参考:
    在这里插入图片描述

  • KS(Kolmogorov-Smirnov, 衡量模型对好坏样本的区分能力)

每个分箱中累计坏客户率减去累计好客户率的最大值。
在这里插入图片描述
举例:样本总量891,好客户549,坏客户342(见下标),表中数据计算方法。

  • 表中第一行:

    total_rate=90/891=10.1%,

    cum_good_rate=good_rate=2/549=0.36%,

    cum_bad_rate=bad_rate=88/342=25.73%,

    ks=25.73% - 0.36% = 25.4%。

  • 表中第二行,

    total_rate=89/891=10.0%,

    good_rate=24/549=4.37%,

    bad_rate=65/342=19.01%,

    cum_good_rate=0.36%+4.37%=4.74%,

    cum_bad_rate=25.73%+19.01%=44.74%,

    ks=44.74%-4.74%=40%
    在这里插入图片描述
    从表中可以发现,当分类阈值设为0.65时,对好坏样本的区分度最高。

  • PSI(Population Stability Index,衡量模型和特征的稳定性)
    在这里插入图片描述
    其中,Ai代表第i组的实际占比(上线后数据),Ei代表第i组的期望占比(训练数据)。
    在这里插入图片描述
    PSI值为0.018,模型稳定。PSI值的衡量标准参考:
    在这里插入图片描述
    注:PSI和IV在取值范围与业务含义的对应上也是存在统一性,只是应用场景不同——PSI用以判断变量稳定性,IV用以判断变量预测能力。

更多推荐

LeetCode 42. 接雨水

题目链接力扣(LeetCode)官网-全球极客挚爱的技术成长平台题目解析先算出每个位置的面积,然后把每个位置的面积相加就得到了最终可以接多少雨水!每个位置的面积等于(该位置左边包括自己最大的高度)与(该位置右边包括自己最大的高度)中最小的那个数,然后减去当前位置的高度,就是当前位置可以存放的雨水。首先定义两个数组lef

面试算法11:0和1个数相同的子数组

题目输入一个只包含0和1的数组,请问如何求0和1的个数相同的最长连续子数组的长度?例如,在数组[0,1,0]中有两个子数组包含相同个数的0和1,分别是[0,1]和[1,0],它们的长度都是2,因此输出2。分析首先把输入数组中所有的0都替换成-1,那么题目就变成求包含相同数目的-1和1的最长子数组的长度。在一个只包含数字

【ES6知识】ESModule 模块化

文章目录一、前言:模块化背景1.1后端模块化1.2关于前端模块化二、模块的导出三、模块的导入四、应用模块到HTML中五、exportdefault默认导出命令六、重命名导出与导入七、创建模块对象八、动态加载模块一、前言:模块化背景JavaScript程序本来很小——在早期,它们大多被用来执行独立的脚本任务,在你的web

MySQL性能分析常见方式

1、慢查询SQL日志查看慢SQL是否开启showvariableslike'%slow_query_log';执行下面的命令开启慢查询日志setglobalslow_query_log='ON';修改慢查询阈值#N为设置的时间setglobal/sessionlong_query_time=N;查看设置的慢查询时间sh

零基础学前端(七)将项目发布成网站

我们学习了HTML和CSS,已经可以做出精美的静态网页。我们不慌学习JavaScript,因为Javascript的作用是为网页增加动作和数据交换,只能让网页更完美而已,现在网页的基础我们已经可以搭建,我们不妨先将网站发布出去,让更多人看到你所作的内容。我想这是非常有意义的,让人激动人心的。一、导言发布网站才是编程中最

【Linux】【网络】传输层协议:UDP

文章目录UDP协议1.面向数据报2.UDP协议端格式3.UDP的封装和解包4.UDP的缓冲区UDP协议UDP传输的过程类似于寄信。无连接:知道对端的IP和端口号就直接进行传输,不需要建立连接。不可靠:没有确认机制,没有重传机制;如果因为网络故障该段无法发到对方,UDP协议层也不会给应用层返回任何错误信息。面向数据报:不

spring seccurity OAuth 2.0授权服务器工作流程

一、客户端配置:在configure(ClientDetailsServiceConfigurerclients)方法中,配置了一个客户端,包括客户端标识符、客户端秘密、授权类型、授权范围和令牌有效期等信息。这个客户端表示某个应用程序或服务,它将向授权服务器请求访问令牌。二、请求授权码:客户端应用程序首先将用户重定向到

文件包含漏洞

一、文件包含函数:将外部文件的内容引入当前环境:#include<stdio.h>includerequireinclude_oncerequire_oncehightlight_fileshow_sourcereadfilefile_get_contentsfopenfilephp文件包含函数:<?phpinclud

【搭建私人图床】本地PHP搭建简单Imagewheel云图床,在外远程访问

文章目录1.前言2.Imagewheel网站搭建2.1.Imagewheel下载和安装2.2.Imagewheel网页测试2.3.cpolar的安装和注册3.本地网页发布3.1.Cpolar临时数据隧道3.2.Cpolar稳定隧道(云端设置)3.3.Cpolar稳定隧道(本地设置)4.公网访问测试5.结语1.前言云存储

分享!JetBrains IDE中的GitLab支持

GitLab是流行的基于git的软件开发和部署平台之一,虽然很长一段时间以来,所有基本git操作都已经可以通过GitLab实现,但GitLab集成仍是JetBrains社区的一大最热门请求。为此,JetBrains团队今年与GitLab联手提供了这种类型的集成。JetBrains官方认为此类集成包括的各种功能可能会影响

springboot实现webSocket服务端和客户端demo

1:pom导入依赖<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId><version>2.2.7.RELEASE</version></dependen

热文推荐