【图文通俗带示例】StackingRegressor和StackingCVRegressor原理详解

article/2025/10/1 15:35:52

在大学的数学建模比赛中能明显提分的模型融合算法,本文介绍集成算法中的一种Stacking模型融合。通过PPT解释了Stacking回归算法进行模型融合的基本原理,并且结合mlxtend库中的源代码做出了基础解释。下方给出了示例代码可供直接调用

StackingRegressor源码解析: 

StackingCVRegressor源码解析: 

上述过程就是Stacking回归算法的基本原理,实际上的过程十分简单,但是可创造性很强,可以根据自己的需求对这种思想做创新。

知道了原理,mlxtend库给我们封装好了完整的Stacking回归的算法,接下来我们就给出一个交叉验证方式的示例代码:

import numpy as np
import pandas as pd
# 导入catboost
from catboost import CatBoostRegressor
# 随机森林库
from sklearn.ensemble import RandomForestRegressor
# 导入lightGBM
import lightgbm as lgb
# 引入stacking模型融合(cv)
from mlxtend.regressor import StackingCVRegressor
from sklearn.linear_model import LinearRegression
# 用于保存和提取模型
import joblib
import matplotlib.pyplot as plt
# 解决画图中文字体显示的问题
plt.rcParams['font.sans-serif'] = ['KaiTi', 'SimHei', 'Times New Roman']  # 汉字字体集
plt.rcParams['font.size'] = 12  # 字体大小
plt.rcParams['axes.unicode_minus'] = False# 加载数据集并将其拆分为训练集和测试集
#读取数据
traindf=pd.read_csv('./train.csv',encoding='gbk')#这里的训练集包括目标特征
testdf=pd.read_csv('./test.csv',encoding='gbk')#测试集不包括# 目标变量
y = traindf['Label']
del traindf['Label']
# 特征
X = traindf# 读取模型
# 基模型1
LGBMR_BEST_PARAMS = lgb.LGBMRegressor(bagging_fraction=0.8,bagging_freq=1,feature_fraction=0.9000000000000001,lambda_l1=0,lambda_l2=15,learning_rate=0.29352291475392334,max_bin=205,max_depth=10,min_data_in_leaf=98,min_gain_to_split=0.003127047743666289,n_estimators=645,num_leaves=70)
# 基模型2
cat_params= {'iterations': 992,'learning_rate': 0.2462181777526843,'depth': 11,'l2_leaf_reg': 0.006126980082076129,'rsm': 0.42416637312752437,'border_count': 173,'leaf_estimation_method': 'Simple','boosting_type': 'Ordered','bootstrap_type': 'MVS','sampling_unit': 'Object'}
CATBOOST_BEST_PARAMS = CatBoostRegressor(**cat_params)
# 基模型3
RF = RandomForestRegressor()# 元回归器, 这个可以理解为第二层的那个模型,即将前面回归器结果合起来的那个回归器,这里我使用lr,因为第二层的模型不要太复杂
lr=LinearRegression()
# 基模型列表
regressorModels = [ LGBMR_BEST_PARAMS,CATBOOST_BEST_PARAMS, RF]
# 使用stackingCV融合
STACKING=StackingCVRegressor(regressors=regressorModels,meta_regressor=lr,cv = 5,shuffle = True,use_features_in_secondary = False,n_jobs=-1)# 模型训练
# 注意模型的训练需要使用完整的训练集
STACKING.fit(X,y)# # 保存模型
# joblib.dump(STACKING, './STACKING.pkl')
# # 读取模型
# STACKING = joblib.load('./STACKING.pkl')# 模型预测
# 用模型对测试集预测
y_pred = STACKING.predict(testdf)
# # 预测结果进行逆log运行
# y_pred=np.expm1(y_pred)# 读取真实集---shape=(n,1)
label=pd.read_csv('./true.csv',encoding='gbk')# 模型评估
import numpy as np
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
# 计算均方误差(MSE)
mse = mean_squared_error(label, y_pred)
print("均方误差(MSE):", mse)# 计算均方根误差(RMSE)
rmse = np.sqrt(mse)
print("均方根误差(RMSE):", rmse)# 计算平均绝对误差(MAE)
mae = mean_absolute_error(label, y_pred)
print("平均绝对误差(MAE):", mae)# 计算决定系数(R²)
r2 = r2_score(label, y_pred)
print("决定系数(R²):", r2)

 在这个示例需要根据实际情况修改某些路径和特征名称。

个人拙见,有错误可留言我修改,需要原PPT的可以点击方链接:

PPT:https://pan.baidu.com/s/13fC8epQdK0wMFvydutDUDw        提取码:xbjt


http://chatgpt.dhexx.cn/article/yDbLPqaU.shtml

相关文章

Python进行多输出(多因变量)回归:集成学习梯度提升决策树GRADIENT BOOSTING REGRESSOR回归训练和预测可视化

最近我们被客户要求撰写关于回归的研究报告,包括一些图形和统计输出。 在之前的文章中,我们研究了许多使用 多输出回归分析的方法。在本教程中,我们将学习如何使用梯度提升决策树GRADIENT BOOSTING REGRESSOR拟合和预测多输出回归数据。对于…

回归- Regression

回归- Regression —————————————————————————————————————————— 回归- Regression 线性回归Linear regression 模型表示Model representation代价函数Cost function目标Goal 多项式回归加权线性回归一般线性回归 通用的指数概率分布…

日本股市预测JPX: LGBM Regressor (Fit in 1 Min)

LightGBM 与 XGBoost 目前几乎所有具有结构化数据集的竞赛的基础学习者。这主要是因为 LightGBM 的实现;它不会像 XGBoost 在默认设置中那样精确搜索最佳分割,而是通过直方图近似(XGBoost 现在也具有此功能,但仍不如 LightGBM 快&…

Regression 2

一、Where does the error come from?[error due to bias and variance] 我们将寻找function看作是在打靶,靶的正中心为 f ^ \hat{f} f^​,每次collect data训练出来的 f ∗ f^{*} f∗为打在靶上面的点 Variance取决于model的复杂程度和data的…

注意:Classifier和Regressor的score函数,是不同的!

下面以sklearn的KNeighbors模型举例: 1.对于分类(Classifier)模型,score函数计算的是精确度。底层是accuracy_score http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.RadiusNeighborsClassifier.html#skle…

3.Regression(二)

总结自:机器学习(李宏毅,台湾大学) 上一篇文章中,我们选用的model是 y b w ∙ x c p ybw \bullet x_{cp} ybw∙xcp​,可以选用其它的model吗?我们选用的loss function是 L ( f ) ∑ ( ( y ^ …

Regularization(正则化)

前言 这一章还是紧接着上一章的,在上一章我们讨论了logistic regrsssion(逻辑回归),在更早我们还讨论了linear regression(线性回归),对于这两种问题,我们在进行用函数去预测结果时,我们根据已知的数据集去推测一个函数…

Linear Regression Logistic Regression

Linear Regression & Logistic Regression Keywords List keywords you may encounter when exploring LR(Logistic Regression), or a bigger concept – ML(machine learining): 监督学习 损失函数 梯度下降 学习率 激活函数 神经网络 Let’s kick off wi…

RandomForestClassifier/Regressor

1.集成算法(ensemble ) 1.集成评估器 bagging多个相互独立的评估器,对其预测进行平均或多数表决原则来决定评估器的结果boosting基评估器相关,按顺序一一构建,结合若评估器构成强评估器 2.RandomForestClasifier 1.决策…

Regression 回归

李宏毅老师机器学习课程笔记——Regression 回归 一、理论 问题:已知一批宝可梦样本进化前的特征值x_cp, x_s, x_np, x_w, x_n,预测宝可梦升级后的CP值。模型的目标就是找到一个最合适的函数F(X)Y: 特征条件X包括{x_cp, x_s, x_np, x_w, x_…

线性回归正则化 regularized linear regression

线性回归正则化regularized linear regression 在前几篇博客中介绍了一元线性回归http://blog.csdn.net/u012328159/article/details/50994095和多元线性回归http://blog.csdn.net/u012328159/article/details/51029695等线性回归的知识,具体请参见本人其他博客。但…

# Logistics Regression

目录 一 logistics regression 1 一点介绍 2 评价 3 一点应用 4 代码流程 5 上代码!!! 一 logistics regression 1 一点介绍 逻辑回归是一个分类模型,其突出特点即 模型简单、可解释性强 2 评价 优点 实现简单&#xff0…

Python-Regression

本文归纳整理了线性回归(LinearRegression)、岭回归(Ridge)、Lasso回归(Lasso)、弹性网(ElasticNet)、K近邻、SVM等10多种机器学习模块sklearn中回归算法调用及实现过程,…

大数据挖掘永恒的定律?符号回归(Symbolic Regressor)

大数据挖掘永恒的定律?符号回归(Symbolic Regressor) 符号回归简介 符号回归是一种机器学习技术,旨在识别一个潜在的数学表达式。它首先建立一个朴素随机公式的总体来表示已知自变量和它们的因变量目标之间的关系,以预测新数据。每一个连续的…

Regression

//李宏毅视频官网:http://speech.ee.ntu.edu.tw/~tlkagk/courses.html 点击此处返回总目录 //邱锡鹏《神经网络与深度学习》官网:https://nndl.github.io 今天主要讲的是Regression。会通过一…

从零接入微信公众号(Java实现 附源码)

目录 从零接入微信公众号 一、微信测试号的申请与关注 1.申请 2.访问域名配置 3.关注 二、测试号快速生成底部导航栏 1.获取 access_token 2.自定义菜单 三、微信公众号网页授权 1.网页授权原理 2.代码实现 1)NetUtil.java 2)Oauth2Token.java 3)WxUserDO.java…

前后端分别部署教程 ---- 第三部分项目部署和挂载到微信公众号

3. 前端 这里介绍的是idea开发工具下的项目打包 3.1 项目打包 一定要在指定项目路径下打开 Terminal,不然会打错项目的包. 右击项目名称,然后点击 Open in Terminal: 在下面的 Terminal窗口中, 输入打包命令: npm …

springboot+h5页面+微信公众号获取微信用户信息

springboot项目,h5页面通过微信公众号获取微信用户信息 最近本人有一个项目需求,微信公众号里点击一个菜单进入一个商城购物系统。 对于在微信公众号还是小白的我来说难度有点大,但是做完后发现也就这样,用多了就熟悉了。下面记录…

【公众号】微信进入公众号链接自动获取授权登陆

文章目录 前言一、准备二、开发2.1 搭建项目2.2 WeixinUtil 工具2.3 回调接口与登陆接口2.4 过滤器自动登陆2.4 其他类2.5 测试 三、总结 前言 最近项目上有一个需求,用户反映每次从微信打开链接都需要手动登陆,比较繁琐,想点开微信连接后自…

java向微信公众号---发送模板和图文消息

微信公众号初次开发 其他操作 项目搭建mavenapplication.ymlyml参数配置微信客户端配置 搭建完成 实现业务模板消息推送准备工作模板消息填写要求图文消息填写要求 推送模板消息推送模板消息结果——效果 推送图文消息推送图文消息工具类问题和结果 获取关注的用户openId既然有…