基于逻辑回归算法模型搭建思路

article/2025/9/16 18:37:30

在真实工作场景中,有多种算法依据借贷数据集建立模型,主要使用的算法有逻辑回归、神经网络、决策树、贝叶斯信念网、GBDT算法等,本系列文章旨在为刚入门和对模型感兴趣的同学介绍传统风控模型算法之一——逻辑回归。

前方高能!准备发车!

逻辑回归算法

逻辑回归(LogisticRegression)又称为逻辑回归分析,经常被用于分类,是常用的预测算法之一。通过学习历史数据的特性预测新数据的表现结果。

例如,可以将放贷概率设定为因变量,将用户的自身属性以及行为特征属性,例如家庭人员数量、婚姻状况、年龄、同一页面停留时间等设定为自变量,根据这些特征属性预测放贷的概率。

统计学家开发了逻辑函数,也被称为sigmoid函数。

在这里插入图片描述

用于描述生态中人口增长的特性,迅速上升并最大限度地发挥环境的承载能力。这是一个S形曲线,它可以取任何实数值并将其映射到0到1之间的值,但不会完全处于这些极限值。逻辑回归可以认为是因变量可以进行二分类时的回归分析。

像所有回归分析一样,逻辑回归是预测分析。Logistic回归用于描述数据并解释一个定性变量(取值0或1)与一个或多个名词、序数、区间或比率相关变量之间的关系。它可以应用于借贷事件的发生某些事件的概率,例如美国FICO的信用评分卡模型就是基于逻辑回归建立的。

线性回归方程

在这里插入图片描述

将线性回归方程代入上述Sigmoid函数,即得到逻辑回归方程:

在这里插入图片描述

当x=0时,Sigmoid函数值为0.5;当x→∞时,Sigmoid函数值将逼近1;而当x→-∞,Sigmoid函数值将逼近0。Sigmoid函数可以将输出映射到(0,1)之间,表明某组数据属于某一类别的概率,比如设定阈值为0.5,则当h(x)<0.5 与 h(x)>0.5的时候,函数表示的特征数两类。

逻辑回归算法计算流程

针对某一任务数据集,找一个合适的预测函数,一般表示为h函数,即分类函数,用来预测输入数据的判断结果;

其次构造一个损失函数,该函数表示预测的输出与训练数据类别之间的偏差,可以是二者之间的差或者是其他形式,综合考虑所有训练数据的损失,将损失函数求和或求平均,记为J函数,表示所有训练数据预测值与实际类别的偏差。

当J函数的值越小表示预测函数越准确,所以需要采用某种方法找到J函数的最小值。对于参数的估计,往往采用梯度下降的优化方式:

在这里插入图片描述

对于任意任务数据集,通过选择合适的损失函数,结合梯度下降、极大似然估计获得对模型特征系数的估计也就是完成整个算法计算过程,获得目标算法的训练过程。

Sigmoid函数的上述性质非常适合二分类模型,同时对于变量中的每个特征,都能通过其系数给出合理的解释。

基于逻辑回归算法构建贷前反欺诈模型示例

在这里插入图片描述

1.数据收集及处理

基于逻辑回归算法的个人贷款贷前反欺诈模型是基于客户各种维度数据进行开发的,常见的数据维度包括年龄、生日、性别、文化程度、职业、行业、收入、电话、邮箱、身份证信息、婚姻状况、住址、公司地址、房屋类型、家庭人均年收入等等。获得这些数据的途径包括申请信息填写、第三方数据公司合作等方式。

但是原始数据中由于客户填写的内容未必是真正信息、收集信息过程中存在不确定性事件,往往会存在缺失值、重复值、异常值等,这就需要对不同维度、有可能存在交叉冗余的原始数据信息进行进行统计分析、关联性分析等处理,然后获得能够用于建模的数据。

2.特征工程

原始数据经过预处理之后,需要对其进行特征工程,即结合业务知识、数据方法构建能够确认模型的特征集。特征工程中,数据质量和特征维度直接决定了机器学习模型性能的上限,而模型的构建和具体算法的选择则是趋近上限的方法。

3.特征选择

通过特征工程能够获得很多特征,包括原始特征、衍生特征,但是考虑到模型的复杂度以及特征对预测结果的重要性,我们需要对已有特征进行特征选择,获得入模特征。

4.模型构建

利用特征选择得到的特征作为入模特征,结合逻辑回归模型进行模型训练,选择合适的损失函数训练固定次数或待模型精度达到要求,完成模型构建。但是根据实际工程经验,模型构建的过程往往是多次迭代,逐步优化的过程,不是一次训练就直接获得最终模型。

5.模型评估

考虑到本示例是用于个人消费贷款贷前反欺诈环节,属于分类模型,结合实际的业务经验,对于本领域的模型从稳定性、区分性、排序性三个方面进行评估。常用的指标包括KS值、AUC值、GINI系数等指标。若训练好的模型在各评估维度或某几个特定维度满足业务要求,即可将其作为最终模型。反之,则需要重复以上几个步骤进行模型迭代优化。看完了以上内容是不是很有收获呢?这只是冰山一角哦~如果你想对上述搭建的模型感兴趣,想更深入学习建模能力。欢迎选择「量化风控模型机会创造营」⬇️

没套路 不会写代码

风控模型训练营2.0版本中,教会你以下各种“套路“,让你事半功倍。

第一周通过精讲风控模型框架,教会你建模流程上的“套路”。
导师总结自己实际建模工作中用到的Python和Sql代码,求同存异,第一周教给你能完成工作中约80%模型代码的“套路”模版。

第一周通过学习单特征构建、多特征筛选、四类主流特征构造方法以及第二周学习TF-IDF方法,教会你特征构建的“套路”。

第二周通过学习参数调优各种高效大法,教会你参数自动化调优的“套路”。

不懂算法

我们知道很多人算法基础差,自己读书也难以理解枯燥的数学公式,风控模型训练营2.0版本中,我们会这样教你学算法。

第二周通过先学习银行类金融机构风控模型中最常用的逻辑回归算法,把最常用最基础的逻辑回归算法真正学懂学会,让你求职银行这类相对传统的金融机构风控建模岗完全Hold住。

第二周通过再学习GBDT、Xgboost等几个常用二分类机器学习算法,让你遇到一些求创新的银行风控建模岗面试官,或者互联网金融科技公司如某阿某讯某东,也能游刃有余的介绍和使用算法。

第二周通过学习前沿算法,让你对算法新方向有所了解,面试或工作中展现自己超前学习力,面试加分。

没有模型体系知识

不论是面试还是工作中,模型体系的建立和掌握是至关重要的。尤其是在求职中,面试官对求职者有没有体系性的模型理解是极为看重,有体系性的理解代表着将来他能有无限的可能性。

风控模型训练营2.0版本中,第三周我们会让你学到最全的风控模型。

申请类(贷前)评分卡与各种A卡子模型

行为类(贷中)评分卡与各种B卡子模型

催收类(贷后)评分卡与各种C卡子模型

如何恰到好处的使用不同模型

通过6天的课程学习,可以掌握不同场景下建模全流程开发与应用,包括分析思路与代码能力。具体课程安排如下:

在这里插入图片描述

如果你想系统学习,入行模型岗

扫码添加课程顾问,解锁最适合你的学习方式
添加科科,解锁最适合你的学习方式
↓↓↓VX↓↓↓
fintechapplab

对于社招,最大的门槛不是学历、背景,而是有没有相关项目经验。这简直是所有转岗人士的死穴。FAL怎么为大家“解穴”呢?

1. 教你最实用的“经验”

在第一周教你建模特征处理、构建与选择的经验;
在第二周教你各类子模型的经验,应对各种业务细分场景下如何开发模型的问题;
第二周还会教你参数优化的经验,让你快准狠的调整核心参数,模型一步到位,让面试官都感觉到你“经验十足“。

2. 手把手带你过项目,走代码,项目实操就有了

通过FAL自建“鲸抖”大数据实操平台,配置统一实验环境,三周内每周六日下午导师与你一起上机实操项目,做到实时与你一对一的辅导学习,让你完整体验到模型开发监控的全流程,再也不怕面试官问细节。
在这里插入图片描述


http://chatgpt.dhexx.cn/article/e64B3og5.shtml

相关文章

【机器学习】Logistic Regression 逻辑回归算法详解 + Java代码实现

文章目录 一、逻辑回归简介1.1 什么是逻辑回归1.2 Sigmoid函数1.3 预测函数 二、逻辑回归实战 - Java代码实现 一、逻辑回归简介 1.1 什么是逻辑回归 逻辑回归&#xff08;Logistic Regression&#xff09;是一种用于解决二分类&#xff08;0 or 1&#xff09;问题的机器学习…

机器学习之逻辑回归算法

文章目录 逻辑回归原理推导逻辑回归求解 逻辑回归&#xff08;Logistic Regression&#xff09;是机器学习中的一种分类模型&#xff0c;它是一种分类算法&#xff0c;虽然名字中带有回归&#xff0c;但是它与回归之间有一定的联系。 看到回归二字&#xff0c;很多人可能会认为…

机器学习算法 之 逻辑回归算法

1 逻辑回归之第一次学习 本文内容主要转自两处&#xff1a; [1] 逻辑回归从入门到深入&#xff08;logistic regression) 本文内容从Python 逻辑回归实际使用的角度出发&#xff0c;较为通俗易懂&#xff0c;感谢其作者的分享。 [2] 《百面机器学习》之逻辑回归 注意&#xf…

逻辑回归算法简介

逻辑回归算法&#xff1a;虽然名字中带有回归两个字&#xff0c;但它却不是回归算法&#xff0c;它是一个经典的二分类算法。 回归与分类的区别&#xff1a; 回归&#xff1a;可以得到一个准确值或一个区间值&#xff0c;比如房屋价格预测&#xff0c;NBA比赛得分等。 分类&am…

逻辑回归算法原理

回归与分类的不同在于其目标变量是否是连续的。分类是预测出一个标签&#xff0c;找到一条线或超平面去区分数据&#xff0c;输出是离散的、有限的。回归是预测出一个量&#xff0c;找到一条线去尽可能的拟合逼近这些数据&#xff0c;输出是连续的、无限的。 逻辑回归本质上是线…

机器学习算法--逻辑回归原理介绍

一、逻辑回归基本概念 1. 什么是逻辑回归 逻辑回归就是这样的一个过程&#xff1a;面对一个回归或者分类问题&#xff0c;建立代价函数&#xff0c;然后通过优化方法迭代求解出最优的模型参数&#xff0c;然后测试验证我们这个求解的模型的好坏。 Logistic回归虽然名字里带“…

逻辑回归算法

逻辑回归算法-龙珠计划 一、逻辑回归算法原理 逻辑回归&#xff08;Logistic Regression&#xff09; 属于机器学习 — 监督学习 — 分类。 逻辑回归&#xff08;Logistic Regression&#xff09;主要解决二分类问题&#xff0c;用来表示某件事情发生的可能性。 逻辑回归本…

【机器学习】逻辑回归算法

逻辑回归算法 学习目标1. 逻辑回归的介绍1.1 逻辑回归的应用场景1.2 逻辑回归的原理1.2.1 输入1.2.2 激活函数 1.3 损失以及优化1.3.1 损失1.3.2 优化 1.4 小结 2. 逻辑回归api介绍3. 案例&#xff1a;癌症分类预测-良&#xff0f;恶性乳腺癌肿瘤预测3.1 背景介绍3.2 案例分析3…

java中字符流和字节流的区别_java中字节流和字符流有哪些区别

java中字节流和字符流的区别有&#xff1a;1、定义不同&#xff1b;2、结尾不同&#xff1b;3、处理方式不同&#xff1b;4、缓冲区不同&#xff1b;5、编码方式不同。字节流默认不使用缓冲区&#xff0c;而字符流使用缓冲区。字节流采用ASCII编码&#xff0c;字符流采用unicod…

JAVA--字节流和字符流区别

&#xff08;一&#xff09;功能区别 1、FileInputSteam和FileOutputStream可以完成所有格式文件的复制&#xff1b; 2、FileReader和FileWriter只能完成文本格式的复制&#xff0c;无法完成视频、音频等文件的复制&#xff1b; &#xff08;二&#xff09;区别原理 1、字节…

Java进阶(四十五)java 字节流与字符流的区别

字节流与和字符流的使用非常相似&#xff0c;两者除了操作代码上的不同之外&#xff0c;是否还有其他的不同呢&#xff1f; 实际上字节流在操作时本身不会用到缓冲区&#xff08;内存&#xff09;&#xff0c;是文件本身直接操作的&#xff0c;而字符流在操作时使用了缓冲区&a…

字节流与字符流的区别用字节流好还是用字符流好?

字节流&#xff1a; (A)FileOutputStream(File name) 创建一个文件输出流&#xff0c;向指定的 File 对象输出数据。 (B)FileOutputStream(FileDescriptor) 创建一个文件输出流&#xff0c;向指定的文件描述器输出数据。 (C)FileOutputStream(String name) 创建一个文件输出流&…

Java基础面试题 | 字节流和字符流有什么区别?

字节流按 8 位传输&#xff0c;以字节为单位输入输出数据&#xff0c;字符流按 16 位传输&#xff0c;以字符为单位输入输出数据。 但是不管文件读写还是网络发送接收&#xff0c;信息的最小存储单元都是字节。 java 字节流与字符流的区别_afa的专栏-CSDN博客_java中字节流和…

JAVA字节流和字符流的区别

之前在复习IO的时候&#xff0c;为了方便记忆&#xff0c;提到了以Stream结尾的为字节流&#xff0c;以Writer或者Reader结尾的为字符流。 除了在使用上的不一样&#xff0c;那究竟两者有什么区别呢。直接给出结论&#xff1a;字节流在操作时本身不会用到缓冲区&#xff08;内…

字节流与字符流的区别及相互转换

转载&#xff1a;http://www.cnblogs.com/sjjsh/p/5269781.html 先来看一下流的概念&#xff1a; 在程序中所有的数据都是以流的方式进行传输或保存的&#xff0c;程序需要数据的时候要使用输入流读取数据&#xff0c;而当程序需要将一些数据保存起来的时候&#xff0c;就要使用…

字节流与字符流

字节流、字符流 主要内容 IO 流 字节流 字符流 异常处理 Properties 教学目标 能够说出IO流的分类和功能 能够使用字节输出流写出数据到文件能够使用字节输入流读取数据到程序 能够理解读取数据read(byte[])方法的原理能够使用字节流完成文件的复制 能够使用FileWirter…

Java字节流和字符流的区别?

字符流&#xff1a;就是在字节流的基础上&#xff0c;加上编码&#xff0c;形成的数据流 字符流出现的意义&#xff1a;因为字节流在操作字符时&#xff0c;可能会有中文导致的乱码&#xff0c;所以由字节流引申出了字符流。 程序中所有的数据都是以流的方式进行传输或保存的…

字节流和字符流的区别

目录 1.区别 2.字节流 2.1没执行代码前&#xff1a; 2.2效果&#xff1a; 3.字符流 3.1代码 3.2效果前&#xff1a; 3.3执行后 没效果&#xff1a;&#xff08;因为数据还在临时内存&#xff09; 3.4需要:多上面多个关闭资源 3.5 效果图&#xff1a;&#xff08;可以关…

字节流和字符流区别(附例子)

字节流和字符流的用法几乎完成全一样&#xff0c;区别在于字节流和字符流所操作的数据单元不同&#xff0c;字节流操作的单元是数据单元是8位的字节&#xff0c;字符流操作的是数据单元为16位的字符。 区别 字节流一般用来处理图像、视频、音频、PPT、Word等类型的文件。字符流…