白话空间统计二十四:地理加权回归(八)结果解读(一)

article/2025/9/29 21:54:57
地理加权回归分析完成之后,与OLS不同的是会默认生成一张可视化图,像下面这张一样的:


这种图里面数值和颜色,主要是系数的标准误差。主要用来衡量每个系数估计值的可靠性。标准误差与实际系数值相比较小时,这些估计值的可信度会更高。较大标准误差可能表示局部多重共线性存在问题。根据官方的说法,需要检查超过2.5倍标准差的地方……这些地方可能会有问题。

虽然在软件里面,默认只显示这样一张图,但是整个GWR分析完成之后,会生成大量的数据,今天我们就来看看ArcGIS的GWR工具的结果生成的哪些结果代表了什么东西。

首先,工具运行完成之后,会生成一张辅助表 (以_supp为后缀的) ,里面会有如下信息:


下面简单对这些指标进行一下解释:

Bandwidth 或 Neighbors:
模型中,用于各个局部估计的带宽或相邻点数目的值(看你选择的是可变还是固定,如果是可变,就是带宽,固定,就是相邻点的数目),以前一而再再而三的强调过,核估计中,核函数对结果的影响很小,但是带宽对结果影响很大,所以这个参数是“地理加权回归”的最重要参数。它控制模型中的平滑程度。

这里用山东省的数据,采用AICc模型估计的带宽,因为数据用的投影坐标系,单位是米,所以这里的160536表示160公里左右。那么我们来看看,160公里的带宽,在以山东为研究区域的范围内,覆盖多大的范围:
以淄博市沂源县的中心点,进行160公里的估算,结果如下:

差不多能够包括三分之一个山东省吧,当然,我这里的这个距离是通过AICc方法估算出来的,代表了在某种最优的带宽。关于AICc或者CV模型的原理,可以参考以前的文章:

白话空间统计二十四:地理加权回归(五)

这里需要注意的时候,当你选择不同的方法的时候,得出来的所谓“最优”距离都是不一样的。

当然,如果你在设置分析参数的时候,也可以选择固定距离或者固定临近点的数目,这里就会出现你参数里面设置的值了。

ResidualSquares

指模型中的残差平方和(残差为观测所得 y 值与 GWR 模型所返回的 y 值估计值之间的差值)。此测量值越小,GWR 模型越拟合观测数据。此值还在其他多个诊断测量值中使用。

EffectiveNumber
这个值与带宽的选择有关。是拟合值的方差与系数估计值的偏差之间的折衷表示。好吧,这个说法有些拗口。下面简单来解释一下这个东东是干嘛的。

首先,地理加权回归很倚赖于带宽(或者说,依赖于临近要素),那么如果我的带宽无穷大的时候,整个分析区域里面的要素都变成了我的临近要素,这样地理加权就没有意义了,变成了全局回归也就是OLS……这样,每个系数的估计值就变成OLS的估计值。

那么对于大的带宽来说,所有的要素都被包含进回归方程里面,那么回归方程系数的有效数量接近实际的数量(地理加权的权重都是1)。而对于局部来说,它的估计值就具有相对较小的方差(局部和全局差不多,值散布范围很小),但是偏差就大了(异质性何在……)



但是如果我的带宽无限接近0的时候,除要素本身以外,旁边所有的临近要素的权重都是0,这样回归方程的有效系数就变成了回归点本身(只有观测点一个有效系数)。那么局部系数估计值将具有较大方差但偏差较低。(所有的观察点,都有独立的表现,所有要素都具有独立性,完全体现异质性)。


这两种情况,正好是两个极端,都不是我们希望的,那么,我们就需要在中间找到一个平衡点。EffectiveNumber这个值,就是用于衡量这个平衡点的数值。这个数值主要用于诊断不同的模型中使用。

Sigma
西格玛值为标准化剩余平方和(剩余平方和除以残差的有效自由度)的平方根。它是残差的估计标准差。此统计值越小越好。主要用于 AICc 计算。

AICc(关于赤则的信息,查看上面给出的白话空间统计二十四:地理加权回归(五))
AICc是模型性能的一种度量,有助于比较不同的回归模型。考虑到模型复杂性,具有较低 AICc 值的模型将更好地拟合观测数据。AICc不是拟合度的绝对度量,但对于比较适用于同一因变量且具有不同解释变量的模型非常有用。

如果两个模型的AICc值相差大于3,具有较低AICc值的模型将被视为更佳的模型。

在很多论文里面,将GWR的AICc值与OLS的AICc值进行比较,然后根据AICc的值,得出局部回归模型(GWR)比全局模型(OLS)具有更大的优势。(而不是单纯的通过比较拟合度或者性能)。

R2:R 平方是拟合度的一种度量。其值在 0.0 到 1.0 范围内变化,值越大越好。此值可解释为回归模型所涵盖的因变量方差的比例。R2 计算的分母为因变量值平方和。所以增加一个解释变量的时候,分母不变,但是分子发生改变,这就有可能出现拟合度上升的情况(大部分都是假象),所以这个值仅作为参考,更准确的度量,大多数用下面的校正R平方。

R2Adjusted:由于上述 R2 值问题,校正的 R 平方值的计算将按分子和分母的自由度对它们进行正规化。这具有对模型中变量数进行补偿的效果,因此校正的 R2 值通常小于 R2 值。但是,执行此校正时,无法将该值的解释作为所解释方差的比例。

在 GWR中,自由度的有效值是带宽的函数,因此与像OLS之类的全局模型相比,校正程度可能非常明显。因此,AICc是对模型进行比较的首选方式。

然后后面就是你的因变量和自变量了……这个不用解释。

待续未完。


http://chatgpt.dhexx.cn/article/bwGKOTgf.shtml

相关文章

GWmodel | 地理加权模型(Ⅱ-2):如何查看地理加权回归的显著性

《地理加权模型》系列自推出来,深受各位读者喜爱。前几天有读者问:使用gwr()等函数运行模型后,怎么去查看它里面的信息呢?比如如何看变量系数的显著性。本篇就来介绍如何在R语言中去查看GWR模型的输出结果。 对于一般模型如线型模…

多尺度地理加权回归(MGWR),地理加权回归(GWR),最小二乘法(OLS)回归模型的对比分析

MGWR(Multiscale Geographic Weighted Regression多尺度地理加权回归) 一,概念 经典GWR由Fotheringham在1996年提出,基于构建空间权重矩阵的回归模型,普遍用于空间的影响因素分析上。SGWR(半参数地理加权…

白话空间统计二十四:地理加权回归(四)

本来这一章准备直接写(照抄)ArcGIS的帮助文档,写地理加权回归工具的使用……,然后就直接结束地理加权回归的,但是近来收到不少同学的邮件,很多都是掉在了当年虾神挖出的大坑里面,比如写了方法&a…

白话空间统计二十四:地理加权回归(二)

六千多字的大篇……诚意满满啊…… 橘生淮南则为橘,生于淮北则为枳,叶徒相似,其实味不同。所以然者何?水土异也。——《晏子春秋内篇杂下》 水土不服、南北差异,(包括地域歧视)是自古以来的一…

白话空间统计二十四:地理加权回归(三)

本章有数学公式……对数学过敏者慎入…… 前文再续,书接上一回……上一次说到,在改进全局回归的基础上,GWR终于横空出世了,从此空间分析领域终于有了自己专用的回归算法。如果说,空间统计有别于经典统计学的两大特征&…

用ArcGIS做GTWR 时空地理加权回归分析

空间异质性是空间计量回归的重要研究对象,通常采用地理加权回归模型进行分析,而ArcGIS自带工具箱只能支持截面数据的地理加权回归。要分析面板数据则采用地理和时间加权回归( GTWR),该模型是一个局部线性回归模型&…

ArcGIS与地理加权回归【三】

开 工 大 急 原址链接: ArcGIS与地理加权回归【三】https://mp.weixin.qq.com/s/x85EXKImSHio1IZovW9qdA 接着5个月之前.......ArcGIS与地理加权回归GWR【二】以及MGWR软件下载 在ASU下载了样例“关于影响佐治亚州受教育水平”的数据。在上一篇已简单介绍…

白话空间统计二十四:地理加权回归(一)

二十四在人的生活中有举足轻重的地位,一年有二十四个节气,一天有二十四个小时。中国的正史称之为“二十四史”(有人说加清史就二十五了……但是正史这个词,出自清乾隆钦定二十四史,所以一直“正史”这个词,…

ArcGIS Pro中的回归分析浅析(下)地理加权回归工具(GWR)使用小结

内容导读 1)回归概念介绍; 2)探索性回归工具(解释变量的选择)使用; 3)广义线性回归工具(GLR)使用; *加更:广义线性回归工具的补充内容 4)地理加权回归工…

地理加权回归简易总结

地理加权回归 空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,那么地理加权回归,就可以用来量化空间异质性。 1.地理加权回归的出现: 1)因为地理位置的变…

(学习笔记)地理加权回归(GWR)、多尺度地理加权回归(MGWR)原理与软件实现

1回归 1.1回归 回归分析是最常用的社会科学统计方法。回归用于评估两个或更多要素属性之间的关系。通过回归分析,我们可以对空间关系进行建模、检查和探究;回归分析还可以帮助解释所观测到的空间模式背后的诸多因素,例如为什么有些地区会持…

ArcGIS与地理加权回归GWR【一】

公众号原文 ArcGIS与地理加权回归GWR【一】https://mp.weixin.qq.com/s/fMPYxO3G7ff2192ZQICN-A 开个新坑啊,写一写关于地理加权回归基础的东西(深了我也不会啊),希望也能用通俗的语言来记录一下我以前学习空间统计过程中的理解…

[信息论与编码理论专题-2]:信息与熵

作者主页(文火冰糖的硅基工坊):https://blog.csdn.net/HiWangWenBing 本文网址:https://blog.csdn.net/HiWangWenBing/article/details/118526747 前言:什么是熵 熵的概念是由德国物理学家克劳修斯于1865年所提出。最初是用来描述“能量退化…

熵编码(算术+霍夫曼)编解码基础知识总结

在MPEG的TMC13模型中,对于surface point cloud compression,对block和vertices进行熵编码;对于lidar point cloud compression,需要对量化残差进行算术编码。这里对熵编码相关的知识进行了总结。 熵编码: (1)https://blog.csdn.n…

2 熵与编码

先来尝试编码一副扑克牌,首先考虑花色rank的方式编码,如下图,即第一张牌是0,最后一张是51(一共52张牌) 在一个集合中,假设最大元素为M,那么我们对M编码需要的最小编码长度为log2M&a…

编码原理详解(五)---熵编码(CAVAL)

上一篇我们讲到了ZigZag扫描,经过这一扫描之后,发现原本是4*4的像素矩阵,就变成了一连串的数字,可以说是二维到一维的一个转换吧,而且经过ZigZag扫描后,一连串的数字的最后大部分为0,以及一些1,…

信息熵与编码定理

惊奇度与信息量 定性描述 惊奇度:一个事件的惊奇度是指该事件发生时我们所感到的惊奇程度 信息量:一条信息的信息量是指该信息所含信息的多少。一条信息越是让我们感到惊奇,它所含信息量就越大 对于一个掷骰子的试验,假设E代表掷…

熵编码算法Range encoding工程原理和实现

在压缩算法中,熵编码是其中重要的无损压缩步骤。熵编码算法根据香农定理,对出现概率大的源符号用较少的编码符号进行编码,对概率小的源符号用较多的编码符号进行编码,尽可能地逼近压缩的极限。 目前各类压缩工具使用的熵编码算法主…

七、熵编码算法(1):基础知识

一、熵编码的概念 熵 化学和热力学,用于度量能量退化的指标熵越高,物体或系统的做功能力越低 信息学中的熵 表示信源所发出信息的不确定性越是随机的、前后不相关的信息,其熵越高 信源编码定理 说明了香农熵与信源符号概率之间的关系信息的熵…