广义线性模型——Logistic回归模型(1)

article/2025/8/19 16:04:12

广义线性模型(GLM)是线性模型的扩展,它通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。

广义线性模型拟合的形式为:

 其中g(μY)是条件均值的函数(称为连接函数)。另外,你可放松Y为正态分布的假设,改为Y 服从指数分布族中的一种分布即可。设定好连接函数和概率分布后,便可以通过最大似然估计的多次迭代推导出各参数值。 

在大部分情况下,线性模型就可以通过一系列连续型或类别型预测变量来预测正态分布的响应变量的工作。

但是,有时候我们要进行非正态因变量的分析,例如:

(1)类别型结果变量:二类变量(及格|不及格,生|死,通过|不通过);分类变量(差|良好|优秀)。

(2)计数型结果变量:(随便抓的一把大米的数量,一个月下雨的次数)。这类变量都是非负的有限值,而且它们的均值和方差通常都是相关的(正态分布变量间不是如此,而是相互独立)。

这种时候我们就要使用包含非正态因变量分析的广义线性模型了,广义线性模型取消了对残差(因变量)服从正态分布的要求。残差不一定要服从正态分布,可以服从二项、泊松、负二项、正态、等分布,这些分布被统称为指数分布族。

R中通常使用glm()函数(还可用其他专门的函数)拟合广义线性模型。
而在广义线性模型中主要使用 Logistic回归模型和泊松回归模型.

我看到了很多SCI文章中使用过GLM分析。作者使用GLM主要有两种作用:(1)推断多个自变量对目标变量的解释效应;(2)通过算法从很多GLMs中获得最简GLM,然后再根据该GLM预测目标变量的发展趋势我下面会展示怎么使用GLM的这两种作用。

一,广义线性模型中的Logistic模型。

Logistic回归适用于二值响应变量( 0 和1)。用如下代码拟合Logistic回归模型:
glm(Y~X1+X2+X3,family=binomial,data=mydata)

 下面我通过一个实验数据来拟合Logistic回归模型。(数据链接在最后,需要的自取)

我基于某个试验数据,来探究试验中的哪些土壤因素对物种丰富度产生显著影响。

Torigin(初始温度)、pH,P含量、TC(总碳)、TN(总氮)、CN比、CP比、NP比、ECEC(离子交换量)。

首先我们将物种丰富度Richness转变为二值型因子(ffd),将物种丰富度大于150变为二值响应变量1(high),将物种丰富度小于等于150变为二值响应变量0(low)。

library(readxl)
treatment <- read_excel("D:/R-works/work4/treatment.xls")#根据数据储存位置读取数据
View(treatment)
treatment$ffd[treatment$Richness>150]<-1
treatment$ffd[treatment$Richness<=150]<-0
treatment$ffd<-factor(treatment$ffd,levels = c(0,1),labels=c("low","high"))
table(treatment$ffd)

 该二值型因子现可作为Logistic回归的结果变量:

fit1<-glm(ffd~pH+P+TN+TC+CN_ratio+NP_ratio+ECEC,data=treatment,family = binomial)
summary(fit1)

family=binomial表明模型的指数分布族为二项分布(各分布族默认的连接函数不同)。

 

 从P值可以看出,试验中只有pH对物种丰富度有显著影响。去除无显著影响的变量因子重新拟合模型,检验新模型是否拟合得好:

fit2<-glm(ffd~pH,data=treatment,family = binomial())
summary(fit2)

 去除其他的变量后,新模型的回归系数更加显著。由于两模型嵌套(fit2是fit1 的一个子集),你可以使用anova()函数对它们进行比较,对于广义线性回归,可用卡方检验。

anova(fit2,fit1,test="Chisq")

结果的卡方值不显著(p=0.3653),表明一个预测变量的新模型与七个完整预测变量的模型拟合程度一样好。这使得你更加坚信添加P、TN、TC、CN_ratio、NP_ratio、ECEC不会显著提高方程的预测精度,因此可以依据更简单的模型进行解释。

链接:https://pan.baidu.com/s/1IEC3bJmsjExnQP3EHdwECQ 
提取码:6668


http://chatgpt.dhexx.cn/article/8Sf7TOcW.shtml

相关文章

机器学习-线性模型及广义线性模型

线性模型&#xff08;linear model&#xff09; 线性模型试图学得一个通过属性的线性组合来进行预测的函数&#xff0c;即&#xff1a; ... (其中;...;为输入属性&#xff0c;;...;和b为模型参数) 向量表示为&#xff1a; (其中为输入属性向量&#xff0c;和b为模型参数) 线性…

广义线性模型到底是个什么鬼?

以下文章内容摘自网络&#xff1a;说人话的统计学 原标题&#xff1a;广义线性模型到底是个什么鬼&#xff1f; ❉说人话的统计学❉ 从逻辑回归模型开始&#xff0c;我们连续讲了好多集有些相似又特点各异的几种统计模型。它们有个统一的旗号&#xff0c;叫做「广义线性模型」(…

线性模型(一)--广义线性模型(GLM)简介

我们从初中开始接触线性方程&#xff0c;线性关系是变量间最简单的关系&#xff0c;所以我打算从线性模型入手开始介绍机器学习的基本算法。广义线性模型&#xff08;General Linear Model,GLM&#xff09;是线性回归模型的推广形式&#xff0c;由广义线性模型可以推导出线性回…

广义线性模型2

1.1.2 Ridge Regression[岭回归] 岭回归和普通最小二乘法回归的一个重要区别是前者对系数模的平方进行了限制。如下所示&#xff1a; In [1]: from sklearn import linear_modelIn [2]: clf linear_model.R linear_model.RandomizedLasso linear_model.RandomizedLogisticRe…

R语言广义线性模型

&#xff11;.广义线性模型和glm&#xff08;&#xff09;函数 广义线性模型扩展了线性模型的框架&#xff0c;它包含了非正态因变量的分析。 广义线性模型通过拟合响应变量的条件均值的一个函数&#xff08;不是响应变量的条件均值&#xff09;&#xff0c;假设响应变量服从指…

广义线性模型(GLM)初级教程

文章目录 广义线性模型指数分布族性质 连接函数正则连接函数(canonical link function)如何找这样的g&#xff1f; 模型详解参数估计极大似然估计Newton-Raphson MethodFisher Scoring MethodIteratively Reweighted Least Squares关于FS和IRLS区间估计 模型检验Pearson Residu…

广义线性模型(Generalized Linear Model)之二:Logistic回归

广义线性模型&#xff08;Generalized Linear Model&#xff09;之二&#xff1a;Logistic回归 一、引入&#xff1a;多元线性回归模型二、Logistic回归模型三、非条件logistic回归模型&#xff08;一&#xff09;介绍&#xff08;二&#xff09;模型的建立与检验&#xff08;三…

广义线性模型(GLM)及其应用

广义线性模型[generalize linear model(GLM)]是线性模型的扩展&#xff0c;通过联系函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。它的特点是不强行改变数据的自然度量&#xff0c;数据可以具有非线性和非恒定方差结构。是线性模型在研究响应值的非正态分布以…

广义线性回归模型

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、广义线性回归模型二、数据集简介三、使用步骤1.引入库和读入数据2.简单分析3.详细分析3.回归分析4.计算混淆矩阵和整体预测率 前言 提示&#xff1a;glm被…

广义线性模型GLM

本文转自 GLM(广义线性模型) 与 LR(逻辑回归) 详解&#xff08;原作者&#xff1a;爱学习的段哥哥&#xff09; GLM的内容&#xff0c;本应该较早之前就总结的&#xff0c;但一直觉得这种教科书上的基础知识不值得专门花时间copy到博客里来。直到某一天看到一篇不错的总结&…

广义线性模型--Generalized Linear Models

监督学习问题&#xff1a; 1、线性回归模型&#xff1a; 适用于自变量X和因变量Y为线性关系 2、广义线性模型&#xff1a; 对于输入空间一个区域改变会影响所有其他区域的问题&#xff0c;解决为&#xff1a;把输入空间划分成若干个区域&#xff0c;然后对每个区域用不同的多项…

广义线性模型(Generalized Linear Models, GLM)

上一篇博客中我们说到线性回归和逻辑回归之间隐隐约约好像有什么关系&#xff0c;到底是什么关系呢&#xff1f;我们就来探讨一下吧。&#xff08;这一篇数学推导占了大多数&#xff0c;可能看起来会略有枯燥&#xff0c;但这本身就是一个把之前算法统一起来的抽象模型&#xf…

广义线性模型(Generalized Linear Model)——机器学习

零、前言 对于条件分布(y|x;θ)&#xff0c;对于线性回归模型有&#xff0c;而对分类问题有。其实这些分布均是广义线性模型&#xff08;GLM&#xff09;的特殊情况。 我们通过定义广义线性模型&#xff0c;可以据此求出拟合函数h(x) 一、指数分布族&#xff08;Exponential …

广义线性模型和线性回归

广义线性模型&#xff08;GLM&#xff09; 首先术语广义线性模型&#xff08;GLM&#xff09;通常是指给定连续和/或分类预测变量的连续响应变量的常规线性回归模型。它包括多元线性回归&#xff0c;以及ANOVA和ANCOVA&#xff08;仅具有固定效果&#xff09;。形式为 yi〜N&a…

机器学习之广义线性模型

深夜博客在今天开张啦 一年前接触了机器学习&#xff0c;纯属个人兴趣&#xff0c;还没想到要入坑&#xff0c;现在沉迷无法自拔了哈哈哈。好了也不说太多废话了&#xff0c;今天的主题是广义线性模型啦&#xff01;这篇博客是参考斯坦福cs229 lecture1中的Generalize Linear …

广义线性模型理解

本文纯属个人理解&#xff0c;恳求指正。 广义线性回归能做什么&#xff1f;为什么我们要使用广义线性回归&#xff1f; 这俩天看到了广义线性回归这个概念&#xff0c;百度上面基本是吴恩达的copy版本&#xff0c;知乎上面都是大神写的&#xff0c;表示看完等于没看。 看了p…

广义线性模型1

1.1 Generalized Linear Models[广义线性模型] 线性模型[linear model]&#xff0c;也称经典线性模型[classical linear model]或一般线型模型[general linear model&#xff0c;GLM]。广义线性模型[generalized linear model&#xff0c;GENMOD]由Nelder & Wedderburn[19…

R之广义线性模型

R之广义线性模型 一、广义线性模型和glm()函数 结果变量是类别型的。二值变量&#xff08;比如&#xff1a;是/否、有效/无效、活着/死亡&#xff09;和多分类变量&#xff08;比如差/良好/优秀&#xff09;都显然不是正态分布&#xff1b;结果变量是计数型的。&#xff08;比…

第5章 广义与一般线性模型

第1章 多元统计分析概述 第2章 多元数据的数学表达 第3章 多元数据的直观表示 第4章 多元相关与回归分析 第5章 广义与一般线性模型 5.1 模型的选择5.2 广义线性模型5.3 一般线性模型 第6章 判别分析及R使用 第7章 聚类分析及R使用 第8章 主成分分析及R使用 第9章 因子分析及…

广义线性模型

今天我来介绍一种在机器学习中应用的比较多的模型&#xff0c;叫做广义线性模型&#xff08;GLM&#xff09;。这种模型是把自变量的线性预测 函数当作因变量的估计值。在机器学习中&#xff0c;有很多模型都是基于广义线性模型的&#xff0c;比如传统的线性回归模型&#xff…