风控ML[9] | Vintage和Roll Rate 分析的详解

article/2025/9/4 13:57:44

e8b80b73644340cfbc8b93e60c0e7016.png

我们说了好几期的风控建模了,也有不少的同学私信我说一般来说我们需要怎么确定Y值呢?,到底多坏的逾期表现的客户可以被我们定义为坏客户呢?今天这篇文章,就给大家介绍一个大家既熟悉又陌生的分析工具——Vintage Analysis(账龄分析)和Roll Rate Analysis(滚动率分析),希望对大家有一定帮助。

本次文章从以下几个模块来展开说说,先介绍一下理论,然后造一批虚拟数据来实际实现一波加深理解,最后再回归我们的主题。

00 Index

01 Roll Rate Analysis的理论
02 Vintage Analysis 的理论
03 如何确定建模的A卡Y值

01 Roll Rate Analysis的理论

Roll Rate Analysis,即滚动率分析,目的在于确定坏客户的定义逻辑,比如说逾期多少天之后的客户,不会在未来还钱了。为了找到更加准确的坏人,我们这个阈值,不能太小。于是,就有了滚动率分析的方法,来确定这个阈值。
滚动率分析,就是选择一个观测点,向前和向后的一段时间窗口,统计不同档次客户的变化情况,从而来确定坏人的划分标准,具体实现步骤如下:
1,选择观测点,比如20210601;
2,以观测点向前统计6个月内(20201201-20210601),客户的档次分布情况(档次一般分为C:正常,M1:逾期0-30天,M2:逾期31-60天,M3:逾期61-90天,M4+:逾期90+,逾期标签以时间窗口内,最坏的逾期表现,一般用指标:最长逾期天数来衡量并归类档次);
3,以观测点向后统计6个月内(20210601-20211201),客户的档次分布情况,如下表;

b60a848f95198ad15ae7ca19e505162e.png

4,将分布用占比的形式表示,如下表;

b2325c5f3fa9a04f3cb4fd5a77a3ef97.png

5,选择多个观测点,重复迭代2-3步,得到更多的分布,最终确定一个平均水平。

那我们有了上面的表格之后,就可以着手去分析下了。上面我们提及到,滚动率分析的目的是为了找到一个阈值,用来区分坏人的阈值。所以,我们基于现有的数据,分析一下当下客群(不同客群的好坏定义不相同)的坏人在多久会体现得比较明显。
我们从表中可以看到,这是一张交叉表,是同一个在过去6个月和未来6个月的表现来统计的。比如说第一行,代表的含义就是:原先(即过去6个月内)还款表现正常的客户,在未来(即未来6个月内)还款表现的重新分布。比如原先正常的客户有8355个,经过6个月的表现,有95.8%(8000个)客户仍是正常的,有3%的客户变成了M1,有1.2%的客户变成了M2,以此类推。

3de9e827bb07e092cb46a478391d8798.png

在Roll Rate Analysis中,有一个名词很有意思,就是“从良率”,也就是说,原先是“坏人”,后面正常还款了,变成了“好人”,这个也是决定我们确定Bad的阈值的关键!
比如,从表中,我们可以看到,原先是M3的(第4行)客户,只有3.4%变成了C(正常),从良率太低了,所以我们可以确定,在当下客群,客户如果在过去6个月内,最长逾期天数超出了60天(即M3+),基本上都是坏人了,所以我们可以以这个阈值,作为我们确定坏人的阈值。

3b7a6c793673f4d7ce3ef1e18a9c2dc9.png

02 Vintage Analysis 的理论

一开始我接触这个名词的时候就觉strong text得很高大上,就那种不明觉厉的感觉,于是就去百度了下。

f052ab66c913fd9b878558ed0fa9f903.png

Vintage分析其实一开始是起源于葡萄酒行业,酿酒师们为了观察葡萄酒的变化质量而常用的分析方法,可以通过每年观察酒精浓度来衡量当年葡萄酒的品质,后面类似的分析方法就在各行各业应用开来了,最为经典的就是在风控领域的应用。

我们先来直观地看一下 Vintage 曲线(随意造的数据)。

fa281a51acfddd04ba6ababb1f0bf787.png

f8c2643e630a1681e9c361b12e9efbc7.png

我们要看懂上图,需要了解一下的知识:
1,Now: 指的是当下观测时间点;
2,DPD60+: 指的是定义坏人的阈值,即逾期60天以上,这个值就是在上面👆的Roll Rate Analysis中得到的;
3,Loan Month: 放款所处月份,也就是贷款发放的月份;4,MOB: 即Month On Book,也就是账龄,可以理解为贷款的年龄,放款当月为MOB0,次月为MOB1,以此类推;
5,有些月份的MOB为空? 这是因为还没有发生,比如最后一行,2021年10月放款的借据(或者客户),在当下观测时间点(20220101),只有3个自然月的表现可以统计,分别是MOB0-2,对应月份202110、202111、202112

有了上面的认识,我们可以看到大多数的放款的逾期占比情况,会在MOB9的时候达到稳定,即我们常说的“成熟期”,因此我们在选择样本客户的时候,会选择表现期大于等于9期的客户,因为在这个时候,坏人基本都现形了,我们可以找到大多数的坏人作为样本。

03 如何确定建模的A卡Y值

有了上面两小节的认识,我们就可以比较轻易确定样本Y值了,直接给出答案:

Good: 表现期大于8期,并且逾期状态未达到M3+的客户,定义为好,Y=0;
Bad: 表现期大于8期,并且逾期状态为M3+的客户,定义为坏,Y=1;
Else:其他的样本由于“未成熟”,所以我们不纳入建模样本。

为什么这么定义呢?概括来说就是Roll Rate Analysis确定了表现期,用来过滤未成熟的客户;Vintage Analysis确定了坏客户的阈值,用来区分一下好坏客户。
That's All! 其实也没那么复杂,对吧。

Reference

1,《Vintage Analysis 野谈》 https://zhuanlan.zhihu.com/p/95796921 2,《信贷风控中Vintage、滚动率、迁移率的理解》 https://zhuanlan.zhihu.com/p/81027037

b1f3bd0709668c2186b3debe1072e957.png


http://chatgpt.dhexx.cn/article/SHxn3hHE.shtml

相关文章

了解过Vintage的N种样式?

vintage的几种形式有没有兴趣了解下? 我们之前写的文章里就提到过一个资产分析报表里的vintage表,这个表是反映客群的账龄情况,如果不是很清楚请再戳进去:风控建模系列(六):催收评分卡卡跟贷前…

风控模型策略-知识全整理(一)

做了大概5年风控,中间做过甲方,做过乙方,做过模型,做过策略,做过数据分析,但是始终觉着不得风控精华,做的事情太多,有的东西也就很难深入,目前就是将这么几年的积累写下来…

vintage、滚动率等相关指标介绍

目录 1、vintage 方法简介 优势 五级分类的比较 2、滚动率 3、入催率 4、FPD 随着互联网金融的发展,对数据分析的需求越来越大。数据分析的目的其实是为了找到风险和收益的平衡点。高收益伴随着高风险,而低风险的回报又如同鸡肋。所以,…

对Vintage未表现数据的预测方法总结

这段时间在利用Vintage分析做借贷产品的放款损失率相关工作,来简单总结一下。 Vintage分析 前面说到,Vintage是资产质量分析的重要工具,主要是用来分析同一产品在不同时间放款的资产质量变化情况,从而反映该产品的客群质量和变化…

vintage+android相机,Vintage复古相机

Vintage复古相机是一款功能强大,非常好用的相机软件,这里有着丰富的复古滤镜可以自由选择,并且还可以直接在这里p图修图,各种效果可以提前预览,还可以一键生成保存,非常便捷!喜欢拍照的小伙伴不…

一文教你如何解读Vintage

当我们在观测资产最终损失和不同资产的风险差异时,经常会用到一个指标,那就是Vintage。 这个指标的计算和展示与大多数指标有所不同,因为所需要的数据信息并不单来源于某一个固定时间的切片数据,而是来源于历史多个时间节点的切片…

Vintage、滚动率、迁移率的应用(转载)

转载于:http://mp.weixin.qq.com/s?__bizMzIyNDk2MzQ1NQ&mid2247484124&idx1&sneec18c836806b8803845716195fae061&chksme807bcccdf7035da8b5ca7fe81f0a7e2185e2ed37b93eeea2dc992457e10781c0dfe6c27cb48&scene21#wechat_redirect 一、Vintag…

信贷风控中Vintage、滚动率、迁移率

风控业务背景 信贷风险管理是一门艺术,更是一门科学。资产质量分析中常会涉及到三个理论: 账龄分析(Vintage Analysis):用以分析账户成熟期、变化规律等。滚动率分析(Roll Rate Analysis)&…

Vintage分析和迁移率模型在信用卡业务中的应用

随着中国金融业对外开放程度的加大,国内信用卡产业的竞争愈演愈烈,信用卡市场营销的费用也越来越高.如何利用有限的营销资源为发卡机构创造最大利润,实现信用卡营销和风险的精细化管理已成为信用卡产业发展的热门话题.本文通过对国外商业银行在信用卡业务中常用的Vintage分析和…

业务相关--vintage

vintage整理 --------仅用于个人学习知识整理和sas/R语言/python代码整理 ####1 . 前言 Vintage表,将不同时间层面的顾客拉平到同一时间周期上进行比较,观察不同入口时间的顾客在不同生命周期上的表现。 vintage一般有三种用法: 1.横看&…

vintage分析 风控建模系列 01

vintage分析 风控建模系列 01 在工作中发现,目前没有一个很好的系列帖子对风控建模中的各项细节做讲解,本人为一个金融科技公司的风控算法建模师,希望在此将风控建模的知识成体系、有深度、易吸收地分享给大家 vintage分析价值 在一场完整…

使用R语言creditmodel包进行Vintage分析或留存率分析

1 什么是vintage分析? Vintage分析(账龄分析法)被广泛应用于信用卡及信贷行业,这个概念起源于葡萄酒,即不同年份出产的葡萄酒的品质有差异,那么不同时期开户或者放款的资产质量也有差异,其核心…

Vintage分析和迁移率模型在网贷行业的运用

Vintage 分析和迁移率模型在网贷行业的运用 网贷业务的核心竞争力来自收益与风险之间平衡点的把握,其收到消费理念、市场策略、市场消费环节影响,贯穿于产品设计、营销审批、授信、支用、还款、催收以及客户服务的全过程。风控偏好和市场竞争策略会导致不…

一文彻底理解评分卡开发中——Y的确定(Vintage分析、滚动率分析等)

评分卡已经在各大银行和公司都实际运用于业务,也有很多前辈对它进行了详细的阐述。本文将从支付和信贷评分卡建立的角度,对比分析不同行业在建立评分卡时因变量Y确定的差异。让想了解评分卡的小伙伴,有一个更深刻的理解。并能举一反三&#x…

vintage的一点深入思考

vintage是资产质量分析中常用的指标,网上也有很多介绍vintage的含义、计算方法以及用法的文章。最近结合业务中的一个实际问题,对vintage曲线有了一些新的思考,所以写下来记录一下。 目录 1.业务问题 2.原因分析 3.总结 一、业务问题 业务的发…

ML之FE:Vintage曲线/Vintage分析(观察用户的全周期风险情况/明确用户风险的成熟期/确定逾期率何时趋向于稳定/从而选择合适的表现期)的简介、计算逻辑、案例应用之详细攻略

ML之FE:Vintage曲线/Vintage分析(观察用户的全周期风险情况/明确用户风险的成熟期/确定逾期率何时趋向于稳定/从而选择合适的表现期)的简介、计算逻辑、案例应用之详细攻略 目录 Vintage曲线简介—通过葡萄酒产业理解Vintage曲线 (1)、Vintage来源 (2)、Vintage曲…

vintage分析

vintage分析的由来 由于酿酒业,对于葡萄酒而言,年份不同,气候不同,生产的葡萄酒品质也不同,因此酿酒业常将葡萄的采摘年份作为品质的区分。同时,随着葡萄酒窖藏时间的增加,酒的品质也会提升。因…

对Vintage分析的一些学习理解

账龄分析(Vintage Analysis) 我目前工作主要是信贷业务相关的数据分析及算法构建,所以经常会接触到信贷风险管理分析方法,常见的包括账龄分析(Vintage Analysis)、滚动率分析(Roll Rate Analys…

ACM学习经验

首先可以说,在我认识的顶尖的 ACMer 中,很多人走的都不是在 OJ 盲目刷题的路。(当然也有特例,前提是他们的某方面基础或智商本身已经达到很高的水平。)不盲目刷题,我想原因也很简单,OJ 题目质量…

如何进行算法比赛 (持续更新)ACMER

由数据范围反推算法复杂度以及算法内容 - AcWing 1.关于时间复杂度的分析y总的总结 变量要进行初始化否则会坑你一把 还有变量的命名要注意 https://www.acwing.com/blog/content/32/ 有时候n的范围很大,但是a[i]的范围很小就可以预处理 2.首先一些奇奇怪怪的方法…