【信用评分预测模型(一)】信用评分预测模型简介

article/2025/8/3 13:32:03

文章目录

  • 前言
  • 一、数据准备
    • 1.文章所使用的数据都是基于下面这两个网站:
    • 2.观察期和表现期
  • 二、数据处理
    • 1.缺失值和异常值
    • 2.筛选数据
  • 三、相关性检验
  • 四、特征工程
    • 1.特征变量
  • 五、模型构建
    • 1.随机森林模型
    • 2.决策树模型
    • 3.AHP分析
  • 总结


前言

在传统的信用风险预测的模型中,主要依靠的是人的主观经验判断,不够客观,很容易形成一种情况,在这个金融机构评分高,但是去其他金融机构评分较低,差异性较大。这样就不利于对个人或企业的信用风险预测不够统一,难以适应大数据时代的到来。并且过去的模式对人的要求极高,但随着大数据时代的到来和信用风险的种类不断增加,过往的信用评分模型会造成较大的误差。比如:过往贷款审批的时候,审批人手中所掌握的“工具”是一些零散的信息,比如借款人的工作单位,婚姻状况,或者大概一个月的收入是多少。常规的做法是,根据这些维度设定一个门槛标准,只要这个借款人的每个维度都满足这些条件,就准予通过。这种做法会有一些问题:

有的借款人虽然不满足某一些门槛条件,但可能另外一些条件特别优秀,单维度的强拒绝规则造成审批效率低下;如何利用零散、非结构化的信息整合成科学的核额体系是一个难题;贷后管理、资产质量分析和风险定价需要可量化的数字评价体系支持。相应的,信用评分帮助解决了以上大部分问题:具象的个体风险被标准化,分数的存在使得审批有了最简单易用的判断标准;整体的信贷资产质量也有了量化指标。
这个系列主要就是来探讨如何进行信用评分的预测模型。

”信用评分解决了生产效率的问题,也解决了生产标准化的问题“
——陈建,《现代信用卡管理》作者,现任Fair Isaac公司的亚太区技术方案总监


一、数据准备

1.文章所使用的数据都是基于下面这两个网站:

http://www.idatascience.cn/dataset
http://www.ics.uci.edu

所选取的数据是信用卡流失。总样本数量有22000+。

2.观察期和表现期

  • 观察期→评分节点→表现期→用户申请时间
  • 1.观察期:是变量采集期,用以采集变量数据,获取各类特征信息的时期,通常为1-3年。
  • 2.表现期:是样本预测期,用以判断样本是否触发负面样本的条件,通常为0.5-1年。

用图来展示:
在这里插入图片描述
注意以下要点:

  • 观察期是相对于观察点来变动的,是相对的概念。
  • 观察点和观察期是衍生x变量的时点或时期,所有的衍生变量要只能在此时间点和此时间点之生成,不能使用此时间点之的信息,否则就会产生使用未来信息的情况。也就是说观察期和观察点之前的数据是一个过去式。客观存在的,也符合计量经济学中对数据的要求,真实,完整,可比较。
  • 表现期需要有足够的长度,不能够太短,从而保证样本群体分类的稳定性,使账户/客户的行为充分表现出来
  • 表现期和表现点是定义y变量的时期,这个y变量具体是什么,取巨额月分析角度。

如以下例子:
贷款申请时间为2023年1月 1日(假设观察期为3年,表现期为1年)

观察点: 2022年 1月1日

观察期: 2019年1月 1日到2021年12月 31日(输入变量:用以识别信用风险的变量)

表现期: 2022年1月 1日到2022年12月 31日(输出变量:是否违约)结论,模型生效之日就会进入识别能力的衰减期,注意防控模型失效风险。

二、数据处理

1.缺失值和异常值

由于数据或多或少都会出现空缺值和异常值,会对整体数据有一定的影响,需要在数据预处理阶段将数据整理好,如空缺值填充或删除,异常值剔除,数据标准化。

2.筛选数据

所收集的数据会有较多不符合要求的数据,需要我们去筛选,这取决于操作者的个人能力和个人经验。

三、相关性检验

  • 单变量分析,如应用统计学方法筛选出预测能力较高的变量,获取自变量中对违约状态影响最显著的指标。经过筛选的变量将进入信用评分模型。再比如需要分析变量的分布是否大致呈正态分布,才能够满足后续分析的条件。这部分的分析可以利用聚类或AHP分析。

  • 变量之间相关性的分析,如两两之间的相关性:pearson、spearman、kendall等、VIF多重共线性。如果变量之间相关性显著,会影响模型的预测效果。

四、特征工程

1.特征变量

特征工程是一个包含内容很多的主题,也被认为是成功应用机器学习的一个很重要的环节。如何充分利用数据进行预测建模就是特征工程要解决的问题! “实际上,所有机器学习算法的成功取决于如何呈现数据。” “特征工程是一个看起来不值得在任何论文或者书籍中被探讨的一个主题。但是他却对机器学习的成功与否起着至关重要的作用。机器学习算法很多都是由于建立一个学习器能够理解的工程化特征而获得成功的。”——ScottLocklin,in “Neglected machine learning ideas”

数据中的特征对预测的模型和获得的结果有着直接的影响。可以这样认为,特征选择和准备越好,获得的结果也就越好。这是正确的,但也存在误导。预测的结果其实取决于许多相关的属性:比如说能获得的数据、准备好的特征以及模型的选择。所以在建模前,我们需要先看看各变量的影响大小。

五、模型构建

1.随机森林模型

2.决策树模型

3.AHP分析

总结

以上模型会在接下来的专栏一一实现。


http://chatgpt.dhexx.cn/article/NMc16hXy.shtml

相关文章

大数据分析案例-基于多元线性回归算法构建用户信用评分模型

🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 喜欢大数据分析项目的小伙伴,希望可以多多支持该系列的其他文章 大数据分析案例合集…

【综合案例】信用评分模型开发

目录 一、案例背景二、前置知识2.1 数据分箱2.2 属性选择2.3 回归方程 三、数据处理3.1 数据清洗3.2 因素分析 四、模型训练五、模型预测六、结语后记 一、案例背景 在上一篇文章网络贷款违约预测案例中,我们在分析属性关系时发现:FICO信用评分与分类标…

信用评分模型(R语言)

信用评分 2016年1月10日 本文详细的介绍了信用评分卡的开发流程,开发语言为R语言,python版本请见:一行代码搞定信用评分模型(python) python版实例和数据请见我的github:https://github.com/chengsong990020186/CreditScoreModel,如觉得实用就点下star,欢迎大家一起…

信用评分卡模型分析(基于Python)--理论部分

信用风险计量体系包括主体评级模型和债项评级两部分。主体评级和债项评级均有一系列评级模型组成,其中主体评级模型可用“四张卡”来表示,分别是A卡、B卡、C卡和F卡;债项评级模型通常按照主体的融资用途,分为企业融资模型、现金流…

企业信用评分卡模型实战(python,附代码)

企业信用评级在全球金融领域有广泛应用。它涉及到公司管理,企业债发行,企业融资,企业上市,企业并购,个人炒股和购买公司债券等多个场景。企业债发行 企业主体信用评级越高,意味着该企业抗风险能力、盈利能力…

银行信用卡评分模型(一)| python

文章目录 背景介绍题目分析一、申请者评级模型二、欺诈评级模型三、行为评级模型四、催收评级模型总结 背景介绍 信用风险和评分卡模型的基本概念:信用风险指的是交易对手未能履行约定合同中的义务造成经济损失的风险,即受信人不能履行还本付息的责任而使…

【单片机毕业设计】【mcuclub-cl-010】基于单片机的灭火小车的设计

最近设计了一个项目基于单片机的灭火小车系统,与大家分享一下: 一、基本介绍 项目名:灭火小车 项目编号:mcuclub-cl-010 单片机类型:STC89C52、STM32F103C8T6 具体功能: 1、通过一对红外寻迹管进行寻迹&a…

详细介绍如何从零开始制作51单片机控制的智能小车(四)———通过蓝牙模块实现数据传输以及通过手机蓝牙实现对小车运动状态的控制

我会通过本系列文章,详细介绍如何从零开始用51单片机去实现智能小车的控制,在本系列的上一篇文章中介绍了如何让小车实现自动避障,本文作为本系列的第四篇文章,主要介绍蓝牙模块的使用,如何通过蓝牙进行数据传输&#…

课设-基于51单片机的智能小车(循迹+避障+APP控制)

51单片机课设—智能小车 一、课设任务二、硬件设计及相关传感器模块1、车模2、51单片机3、红外循迹模块4、电机及驱动5、蓝牙模块6、硬件搭建 三、程序代码1、main.c文件2、motor.c文件 四、我的大学--“造车”史 注:本设计资源可在微信公众号:“Kevin的…

基于51单片机智能小车循迹功能的实现

基于51单片机智能小车循迹功能的实现 目录 基于51单片机智能小车循迹功能的实现一、思路(仅供参考)二、部分硬件模块介绍1、L298n电机驱动模块2、两路红外循迹模块 三、实现1、代码2、运行视频(...注意:该视频有声音!!…

基于51单片机的循迹小车

在大学期间,单片机是部分学生的专业课之一,在学完课本上枯燥的知识后,需要实践加强巩固。简单且综合性尚可的循迹小车必然是实践的首要选择。下面将主要从机械、电控、代码三个部分对以51单片机为主控芯片的循迹小车进行简述 目录 1.总体介…

51单片机智能蓝牙小车

作为大一电子小趴菜,在和队友学习制作蓝牙小车过程中遇到了许多困难。本文既为大家避坑,也作为团队总结。 这篇文章分为两部分 1,组装篇 2,代码篇 思维导图: 组装篇 先准备好一块电源拓展板,用于为电机驱…

浅谈51单片机简易循迹小车制作方案

目录 省流助手(方案清单) 前言 一、小车模型 二、电机 三、电源 1、电池: 2、PCB电源选择: 3、MCU供电方案: 4、MCU和电机的供电方案: 四、主控MCU最小系统 五、电机驱动 1、让电机动起来:&…

基于51单片机制作的蓝牙小车

基于51单片机制作的蓝牙小车 这是本人(小菜鸡一枚)于大一寒假所做的小玩意,以展现我这几月所学,这也是我发的第一篇博客,准确来说这可能是我搞51单片机的巅峰所做了,因为部长说以后要学stm32开发板了&…

【项目实战】基于STM32单片机的智能小车设计(有代码)

【1】背景意义 近些年随着国民生活水平的提升,以小车为载体的轮式机器人进入了我们的生活,尤其是在一些布线复杂困难的安全生活区和需要监控的施工作业场合都必须依赖轮式机器人的视频监控技术。因此,基于嵌入式技术的无线通信视频监控轮式机…

51单片机小车(附源码)

算是做的第一个比较完整的序幕项目,用到的模块不多,更多时间花在调试硬件封方面,比如电池带不动电机导致51单片机重启。 项目框图 项目流程图 通过蓝牙发送指令控制小车的前进、后退、转向、调速等功能。 在小车运动过程中黄灯亮起&#xff…

单片机智能小车

单片机智能小车: 基于单片机控制的自主寻迹电动小车的设计: 摘 要:针对小车在行驶过程中的寻迹要求,设计了以AT89C51单片机为核心的控制电路,采用模块化的设计方案,运用色标传感器、金属探测传感器、超声波传感器、霍尔…

51单片机寻迹小车

# 基于51单片机的循迹小车(详细讲解源码) 作为一名学生,这里我就简单谈谈我们小组做这个循迹小车的一个过程。主要是实现小车寻黑线行驶的这样一个功能,速度可以调节(定时器中断模拟PWM波实现) 一丶硬件部分 小车的主体框架是一个三轮的外在形态 电源…

【51单片机实例】智能小车(一)--------小车的前进、后退和停止

51智能小车系列 智能小车(二)-------- 小车的红外遥控调速 智能小车(三)-------- 小车的红外循迹 文章目录 前言一、硬件选择1.1 小车底盘1.2 电机1.3 51单片机最小系统板1.4 L298N双路电机驱动模块1.5 电源1.6 杜邦线 二、硬件连…

51单片机蓝牙小车(精要版)

51单片机蓝牙小车(精要版) 实现:通过手机与小车的蓝牙通信,实现手机控制小车前后左右的移动。 这是博主学了51单片机第一次做的单片机项目,选择了许多人喜欢的蓝牙小车作为第一个项目。 准备材料: 1.小…