(学习笔记)地理加权回归(GWR)、多尺度地理加权回归(MGWR)原理与软件实现

article/2025/9/30 8:16:50

1回归

1.1回归

回归分析是最常用的社会科学统计方法。回归用于评估两个或更多要素属性之间的关系。通过回归分析,我们可以对空间关系进行建模、检查和探究;回归分析还可以帮助解释所观测到的空间模式背后的诸多因素,例如为什么有些地区会持续发生年轻人早逝或者糖尿病的发病率比预期要高的情况。

回归可以分为两类,一类是线性回归,另一类是非线性的基于机器学习算法的回归。

线性回归,用来确定两种或两种以上变量间相互依赖的定量关系。包括普通最小二乘法OLS (Ordinary Least Squares)、广义线性回归GLR(Generalized Linear Regression)、以及地理加权回归GWR(Geographically weighted Regression)等等。

1.2线性回归存在问题

线性回归经常会遇到两个问题:

一是解释变量多重共线性,或者说冗余,这会导致模型估计失真或难以估计准确,我们希望因变量与不同的解释变量之间存在线性关系,同时不同的解释变量彼此之间不是线性相关的。

二是模型过拟合,过拟合是指为了得到一致假设而使假设变得过度严格。一般是由于强化了太多的局部特征,而导致模型的适应性(泛化)太弱。

三是最小二乘回归存在两个基本假设:误差随机模型残差不相关。但是,空间数据间的联系总是存在着空间异质性和空间自相关,从而违背了OLS模型的使用原则。

2 地理加权回归(GWR)

2.1简介

早期空间统计分析技术多从全局假设的角度出发,认为空间变量关系是固定的,不随空间位置的变化而改变。这个前提假设明显违背了现实地理世界空间关系的异质性或非平稳性规律。因此,区别于传统研究“单一普适”的空间关系统计分析方法,如何对空间异质性进行精确局部描述的空间分析方法越来越多地受到重视,如随机系数模型、空间变参数回归分析模型和局部加权回归分析模型。

在总结了前人关于局部回归和变参研究的基础上,美国科学院院士,英国圣安德鲁斯大学的A. Stewart Fotheringham教授在1996年,正式提出了地理加权回归模型(Geographical Weighted Regression , GWR)。地理加权回归是一种基于空间变化关系建模的局部线性回归方法,它在研究区域的每一处产生一个描述局部关系的回归模型,从而能很好的解释变量的局部空间关系与空间异质性。

ps.引入的空间关系是什么?

2.2公式与解析

基础 GWR 模型一般可表达如下:

式中,为在位置处的因变量值;为位置处的自变量值;为回归分析点的坐标;为截距项;为回归分析系数。

虾神说对GWR的解释

 2.3应用

计算全局莫兰斯指数,具有空间异质性时使用。

3 分类与具体实现

3.1模型对比

 (来源bilibli: BV1S14y1A7vb)

3.2多尺度地理加权MGWR实操

3.2.1数据与软件准备

(1)数据:自变量、因变量、样本的经纬度坐标(投影)

(2)软件:GWR(GWR409.ZIP (dropbox.com))(需翻墙)

MGWR2.2(Windows SPARC MGWR |地理科学与城市规划学院 (asu.edu))(直接访问)

 3.2.2具体操作

 3.2.3数据分析

 (1)GWR结果分析

R方数值越大说明模型拟合越好

(2)MGWR结果分析

 

 上述处理后得到图片(可进行冷热点分析)


http://chatgpt.dhexx.cn/article/xwPFJuRn.shtml

相关文章

ArcGIS与地理加权回归GWR【一】

公众号原文 ArcGIS与地理加权回归GWR【一】https://mp.weixin.qq.com/s/fMPYxO3G7ff2192ZQICN-A 开个新坑啊,写一写关于地理加权回归基础的东西(深了我也不会啊),希望也能用通俗的语言来记录一下我以前学习空间统计过程中的理解…

[信息论与编码理论专题-2]:信息与熵

作者主页(文火冰糖的硅基工坊):https://blog.csdn.net/HiWangWenBing 本文网址:https://blog.csdn.net/HiWangWenBing/article/details/118526747 前言:什么是熵 熵的概念是由德国物理学家克劳修斯于1865年所提出。最初是用来描述“能量退化…

熵编码(算术+霍夫曼)编解码基础知识总结

在MPEG的TMC13模型中,对于surface point cloud compression,对block和vertices进行熵编码;对于lidar point cloud compression,需要对量化残差进行算术编码。这里对熵编码相关的知识进行了总结。 熵编码: (1)https://blog.csdn.n…

2 熵与编码

先来尝试编码一副扑克牌,首先考虑花色rank的方式编码,如下图,即第一张牌是0,最后一张是51(一共52张牌) 在一个集合中,假设最大元素为M,那么我们对M编码需要的最小编码长度为log2M&a…

编码原理详解(五)---熵编码(CAVAL)

上一篇我们讲到了ZigZag扫描,经过这一扫描之后,发现原本是4*4的像素矩阵,就变成了一连串的数字,可以说是二维到一维的一个转换吧,而且经过ZigZag扫描后,一连串的数字的最后大部分为0,以及一些1,…

信息熵与编码定理

惊奇度与信息量 定性描述 惊奇度:一个事件的惊奇度是指该事件发生时我们所感到的惊奇程度 信息量:一条信息的信息量是指该信息所含信息的多少。一条信息越是让我们感到惊奇,它所含信息量就越大 对于一个掷骰子的试验,假设E代表掷…

熵编码算法Range encoding工程原理和实现

在压缩算法中,熵编码是其中重要的无损压缩步骤。熵编码算法根据香农定理,对出现概率大的源符号用较少的编码符号进行编码,对概率小的源符号用较多的编码符号进行编码,尽可能地逼近压缩的极限。 目前各类压缩工具使用的熵编码算法主…

七、熵编码算法(1):基础知识

一、熵编码的概念 熵 化学和热力学,用于度量能量退化的指标熵越高,物体或系统的做功能力越低 信息学中的熵 表示信源所发出信息的不确定性越是随机的、前后不相关的信息,其熵越高 信源编码定理 说明了香农熵与信源符号概率之间的关系信息的熵…

【Codecs系列】CABAC熵编码详解

Date: 2018.5.9 转载自:https://blog.csdn.net/listener51/article/details/60970635 目录 1. 信息熵的概念 2. 定长编码 3. 变长编码 3.1 哈夫曼编码 3.2 算术编码  3.2.1 传统编码方法 3.2.2 算术编码 3.2.3 二进制算术编码 4. …

第8章 熵编码

http://www.cnblogs.com/xkfz007/archive/2012/07/29/2614250.html 1. 熵编码 熵(Entropy):信源的平均信息量,更精确的描述为表示信源所有符号包含信息的平均比特数 信源编码要尽可能的减少信源的冗余,使之接近熵 用…

熵编码之CABAC

CABAC(Context-based Adaptive Binary Arithmetic Coding),基于上下文的自适应二进制算术编码。CABAC是H.264/AVC标准中两种熵编码中的一种,它的编码核心算法就是算术编码(Arithmetic Coding)。 算术编码 传…

信息熵、编码冗余/信息熵冗余、压缩与解压缩速度

信息熵:是指数据所带的信息量。信息量与信源包含的事件发生的概率有关,事件概率越大,信息量越小;事件概率越小,信息量越大。将信源所有可能事件的信息量进行平均,就得到信息的熵(Entropy&#x…

信息熵和压缩编码

目录 一、信息熵是什么?二、两种编码压缩2.1 香农-范诺编码简述2.2 特例详解 三、哈夫曼编码3.1 哈夫曼编码简述3.2 特例详解 四、RGB图像压缩 一、信息熵是什么? 信息:信息,指音讯、消息、通讯系统传输和处理的对象,…

6.信息论(一):信息量、熵和最优编码

前言 信息论是由克劳德香农发展,用来找出信号处理与通信操作的基本限制,如数据压缩、可靠的存储和数据传输等。自创立以来,已被应用多个领域,例如自然语言处理(NLP)、机器学习等领域。 定长编码(Block Codes) 让我们从一个例子…

信息熵与编码

文章目录 一、信息熵的概念二、利用编码求压缩率1.香农-凡诺编码2.霍夫曼编码 三、实验证明图像字节四、文献参考 一、信息熵的概念 信息是个很抽象的概念。人们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到…

熵编码原理

熵编码原理 一.熵编码原理1.原理介绍2.常见方案3.整数位元法4.熵编码模型二.熵编码CABAC介绍1.二进制化2.上下文建模3.二进制算术编码常规编码区间重归一化旁路编码 一.熵编码原理 1.原理介绍 熵编码即编码过程中按熵原理不丢失任何信息的编码。信息熵为信源的平均信息量&…

熵编码:CABAC

基于上下文的二进制算术编码(Context-Based Adaptive Binary Arithmetic Coding,CABAC)将自适应二进制算术编码和上下文模型相结合。是H.265/HEVC的主要熵编码方案。 主要包括三个步骤: 二进制化; 上下文建模; 二进…

熵编码:算术编码

算术编码不是简单的将每个信源符号映射成一个码字,而是对整个输入序列分配一个码字,所以平均意义上可以为每个信源符号分配长度小于1的码字。 算术编码操作简单,下面以一个实例讲解算术编码的原理: 设信源有a,b,c,d四种符号&…

GitLab-CI基础使用总结

思路梳理 下图是GitLab-ci的实现结构图: (实际结构会有出入,画成这样只是便于理解) GitLab:是一个基于 Git 的代码托管平台,提供了代码仓库管理、问题跟踪、CI/CD 等功能。它可以用于团队协作开发、版本控制、代码审查等场景。GitLab-runne…