广义线性模型和线性回归

article/2025/8/18 21:29:41

广义线性模型(GLM)

首先术语广义线性模型(GLM)通常是指给定连续和/或分类预测变量的连续响应变量的常规线性回归模型。它包括多元线性回归,以及ANOVA和ANCOVA(仅具有固定效果)。形式为
yi〜N(xβ,σ2),其中xi包含已知的协变量,β包含要估计的系数。这些模型使用最小二乘和加权最小二乘拟合。

术语广义线性模型(GLIM或GLM)是指由McCullagh和Nelder(1982,第二版,1989)推广的一类更大的模型。在这些模型中,假设响应变量yi遵循均值为μi的指数族分布,并假定为xβ的某些(通常是非线性)函数。有些人会称它们为“非线性”,因为μi通常是协变量的非线性函数,但是McCullagh和Nelder认为它们是线性的,因为协变量仅通过线性组合xTiβ影响yi的分布。第一个广泛使用的适合这些模型的软件包称为GLIM。

广义线性模型(GLM)是一类广泛的模型,包括线性回归,ANOVA,泊松回归,对数线性模型等。下表提供了遵循Agresti(2013年第4章)的GLM的简要概述:

在这里插入图片描述

任何GLM都有三个组成部分:

随机分量–指响应变量的概率分布(Y); 例如 线性回归中Y的正态分布,或二进制逻辑回归中Y的二项分布。 也称为噪声模型或误差模型。

系统组件-在模型中指定解释变量(X1,X2,… Xk),更具体地说,在创建所谓的线性预测变量时将其线性组合。

链接函数,η或g(μ)-指定随机和系统分量之间的链接。 它表示响应的期望值如何与解释变量的线性预测变量相关; 例如,对于线性回归,η= g(E(Yi))= E(Yi);对于逻辑回归,η= logit(π)。

GLM与传统(OLS)回归相比的优势

我们不需要将响应Y转换为具有正态分布
链接的选择与随机分量的选择是分开的,因此我们在建模方面具有更大的灵活性
如果链接产生加性效应,则我们不需要恒定的方差。
通过最大似然估计拟合模型; 因此,估计器的最佳属性。
我们将讨论对数线性和逻辑回归模型的所有推理工具和模型检查也适用于其他GLM。 例如偏差,残差,置信区间,过度分散。

线性回归

线性回归尝试通过将线性方程式拟合到观测数据来模拟两个变量之间的关系。一个变量被认为是解释性变量,另一个被认为是因变量。例如,建模者可能希望使用线性回归模型将个体的体重与其身高相关联。
在尝试将线性模型拟合到观测数据之前,建模者应首先确定目标变量之间是否存在关系。这并不一定意味着一个变量会导致另一个变量(例如,较高的SAT分数不会导致较高的大学成绩),但是这两个变量之间存在一定的显着相关性。散点图可能是确定两个变量之间关系强度的有用工具。如果建议的解释变量和因变量之间似乎没有关联(即散点图未指示任何增加或减少的趋势),则将线性回归模型拟合到数据可能不会提供有用的模型。相关变量的一个有价值的数值度量是相关系数,它是一个介于-1和1之间的值,表示两个变量所观察到的数据的相关强度。

线性回归线的方程式为Y = a + bX,其中X是解释变量,Y是因变量。线的斜率是b,a是截距(x = 0时y的值)。

最小二乘回归

拟合回归线的最常见方法是最小二乘法。此方法通过最小化每个数据点到该线的垂直偏差的平方和来计算观测数据的最佳拟合线(如果点正好位于拟合线上,则其垂直偏差为0)。因为偏差首先被平方,然后求和,所以在正值和负值之间没有抵消(具体介绍参见我的另一篇文章)。

至于为什么最小二乘是线性回归时的最优方法,参见我的另一篇推导过程(‘最小二乘误差及其概率解释’)。


http://chatgpt.dhexx.cn/article/KnHxWSXr.shtml

相关文章

机器学习之广义线性模型

深夜博客在今天开张啦 一年前接触了机器学习,纯属个人兴趣,还没想到要入坑,现在沉迷无法自拔了哈哈哈。好了也不说太多废话了,今天的主题是广义线性模型啦!这篇博客是参考斯坦福cs229 lecture1中的Generalize Linear …

广义线性模型理解

本文纯属个人理解,恳求指正。 广义线性回归能做什么?为什么我们要使用广义线性回归? 这俩天看到了广义线性回归这个概念,百度上面基本是吴恩达的copy版本,知乎上面都是大神写的,表示看完等于没看。 看了p…

广义线性模型1

1.1 Generalized Linear Models[广义线性模型] 线性模型[linear model],也称经典线性模型[classical linear model]或一般线型模型[general linear model,GLM]。广义线性模型[generalized linear model,GENMOD]由Nelder & Wedderburn[19…

R之广义线性模型

R之广义线性模型 一、广义线性模型和glm()函数 结果变量是类别型的。二值变量(比如:是/否、有效/无效、活着/死亡)和多分类变量(比如差/良好/优秀)都显然不是正态分布;结果变量是计数型的。(比…

第5章 广义与一般线性模型

第1章 多元统计分析概述 第2章 多元数据的数学表达 第3章 多元数据的直观表示 第4章 多元相关与回归分析 第5章 广义与一般线性模型 5.1 模型的选择5.2 广义线性模型5.3 一般线性模型 第6章 判别分析及R使用 第7章 聚类分析及R使用 第8章 主成分分析及R使用 第9章 因子分析及…

广义线性模型

今天我来介绍一种在机器学习中应用的比较多的模型,叫做广义线性模型(GLM)。这种模型是把自变量的线性预测 函数当作因变量的估计值。在机器学习中,有很多模型都是基于广义线性模型的,比如传统的线性回归模型&#xff…

广义线性模型(Generalized Linear Model)

转载于:广义线性模型(Generalized Linear Model) - 肉鹅阿笨 - 博客园 (cnblogs.com) 1.指数分布族 我们在建模的时候,关心的目标变量Y可能服从很多种分布。像线性回归,我们会假设目标变量Y服从正态分布,而…

R|广义线性模型知识点归纳

本文分为两个部分: (1)广义线性模型的分类及其运用场景; (2) 相关R代码。需要说明的是,参考资料是上课课件,根据本人理解整理,如果有不对的地方,欢迎探讨! 目录 引言 1. 广义线性模型 (1)二…

IOS CoreData 多表查询(上)

在网上搜索了下,发现只有部分讲解CoreData关系的,但对多表之间的查询并没有相应的介绍。 因此操作自己写了个。 先创建几个表。 1、部门表:department dp_id Integer primary key dp_deptname varchar(20) //使用coredata实体创建时用…

iOS CoreData详解(五)多线程

原创blog,转载请注明出处 blog.csdn.net/hello_hwc 欢迎关注我的iOS SDK详解专栏,这里有很多基础的文章 http://blog.csdn.net/column/details/huangwenchen-ios-sdk.html 前言:很多小的App只需要一个ManagedContext在主线程就可以了&…

CoreData在Xcode 8 中的使用

如需转载,请注明出处 在Xode8之前,CoreData的使用是非常方便的,先创建一个DataModel , ,然后创建NSManagedObject SubClass,都是一个界面上操作,非常方便,但是更新过Xcode 8后,CoreData的创建需要进行一…

CoreData

Core Data数据持久化是对SQLite的一个升级,它是ios集成的,在说Core Data之前,我们先说说在CoreData中使用的几个类。(1)NSManagedObjectModel(被管理的对象模型) 相当于实体,不过它包含 了实体间的关系(2)N…

Core Data详解

转载于:程序媛与程序猿 7.1. 什么是Core Data Core Data是一个Cocoa框架,用于为管理对象图提供基础实现,以及为多种文件格式的持久化提供支持。管理对象图包含的工作如撤销(undo)和重做(redo&#xff…

Coredata的版本升级

在开发的后期,可能因为完善和修复功能,需要对Coredata数据库表进行修改,这样就需要对CoreData进行版本升级。 比如你修改了DB字段以后,用户在旧版本上升级为新版本时会crash. 因为升级只升级了应用app,没有升级目录下的数据据db文…

在建好的项目中加入CoreData

这几天在做一个ios的小项目,项目中需要对数据进行基本的增删改查操作。于是就想用一把CoreData。但在创建项目初期,没有包含进CoreData。于是就在已建好的项目中加入CoreData。由于第一次用CoreData,各方面还不是很熟悉,在网上爬文…

CoreData的简单使用

简介 Core Data是iOS5之后才出现的一个框架,它提供了对象-关系映射(ORM)的功能,即能够将OC对象转化成数据,保存在SQLite数据库文件中,也能够将保存在数据库中的数据还原成OC对象。在此数据操作期间,我们不需要编写任何…

数据持久化(五)之CoreData

简单的说,Core Data就是可以存储到磁盘的对象图,[...]Core Data可以帮我们做很多任务作.它可以作为软件的整个模型层。它不仅仅在磁盘上存储数据,也把我们需要的数据对象读取到内存中。 ——Marcus Zarra, Core Data Core Data是Mac OS X中Cocoa API的一部分&#…

coredata 详解

原文:Core Data Overview,感谢CocoaChina翻译组帮忙校对。 Core Data可能是OS X和iOS里面最容易被误解的框架之一了,为了帮助大家理解,我们将快速的研究Core Data,让大家对它有一个初步的了解,对于想要正确…

Core Data 详解

Core Data是一个Cocoa框架,用于为管理对象图提供基础实现,以及为多种文件格式的持久化提供支持。管理对象图包含的工作如撤销(undo)和重做(redo)、有效性检查、以及保证对象关系的完整性等。对象的持久化意…

Core Data概述

昨晚熬夜看发布会(本以为屌丝终于能买得起苹果了,谁知道。。。),因为看不了视频直播,所以就正好有空就把www.objc.io最新的一篇文章翻译了一下,同时感谢CocoaChina翻译组提供校对,以下为正文: Core Data可能…