Python空间分析| 03 利用Python进行地理加权回归(GWR)

article/2025/9/29 21:19:58

地理加权回归(GWR)

GWR本质上是一种局部加权回归模型,GWR根据每个空间对象的周围信息,逐个对象建立起回归方程,即每个对象都有自己的回归方程,可用于归因或者对未来的预测。GWR最大的优势是考虑了空间对象的局部效应

本实验基于GWR官网提供的Georgia数据,美国佐治亚州受教育程度及各因素的空间差异性进行分析

数据下载地址: https://sgsup.asu.edu/sparc/mgwr

author:jiangroubao

date:2021-5-21

导入包

import numpy as np
import libpysal as ps
from mgwr.gwr import GWR, MGWR
from mgwr.sel_bw import Sel_BW
import geopandas as gp
import matplotlib.pyplot as plt
import matplotlib as mpl
import pandas as pddata_dir="/home/lighthouse/Learning/pysal/data/"

导入数据

georgia_data = pd.read_csv(data_dir+"GData_utm.csv")
georgia_shp = gp.read_file(data_dir+'G_utm.shp')

查看数据概况

数据共有13个字段,其含义分别是:

  • AreaKey:地区代码
  • TotPop90:1990年人口数量
  • PctRural:乡村人口占比
  • PctBach:本科以上人口占比
  • PctEld:老龄人口占比
  • PctFB:外国出生人口占比
  • PctPov:贫困人口占比
  • PctBlack:非洲裔美国人占比
  • ID:地区ID
  • Latitude:纬度(地理坐标系)
  • Longitud:经度(地理坐标系)
  • X:投影坐标系X坐标
  • Y:投影坐标系Y坐标
georgia_data.head()

绘制分布概况

ax = georgia_shp.plot(edgecolor='white',column="AreaKey",cmap='GnBu',figsize=(6,6))
georgia_shp.centroid.plot(ax=ax, color='r',marker='o')
ax.set_axis_off()

up-aa69643cb25ed01295a44d935a80fcddefb.png

准备输入GWR中的变量

  • 因变量:PctBach(本科以上人口占比)作为
  • 自变量:TotPop90(1990年总人口)、PctRural(农村人口占比)、PctEld(老年人口占比)、PctFB(外国人口出生占比)、PctPov(生活在贫困线以下居民占比)、PctBlack(非裔美国人占比)
# 因变量
g_y = georgia_data['PctBach'].values.reshape((-1,1))# 自变量
g_X = georgia_data[['TotPop90','PctRural','PctEld','PctFB','PctPov','PctBlack']].values# 坐标信息Latitude	Longitud
u = georgia_data['Longitud']
v = georgia_data['Latitude']
g_coords = list(zip(u,v))# z标准化
# g_X = (g_X - g_X.mean(axis=0)) / g_X.std(axis=0)
# g_y = g_y.reshape((-1,1))
# g_y = (g_y - g_y.mean(axis=0)) / g_y.std(axis=0)

GWR模型拟合

# 带宽选择函数
gwr_selector = Sel_BW(g_coords, g_y, g_X)
gwr_bw = gwr_selector.search(search_method='golden_section',criterion='AICc')
print('最佳带宽大小为:',gwr_bw)
最佳带宽大小为: 151.0
# GWR拟合
gwr_results = GWR(g_coords, g_y, g_X, gwr_bw, fixed=False, kernel='bisquare', constant=True, spherical=True).fit()

输出GWR拟合结果

gwr_results.summary()
===========================================================================
Model type                                                         Gaussian
Number of observations:                                                 159
Number of covariates:                                                     7Global Regression Results
---------------------------------------------------------------------------
Residual sum of squares:                                           1816.164
Log-likelihood:                                                    -419.240
AIC:                                                                852.479
AICc:                                                               855.439
BIC:                                                               1045.690
R2:                                                                   0.646
Adj. R2:                                                              0.632Variable                              Est.         SE  t(Est/SE)    p-value
------------------------------- ---------- ---------- ---------- ----------
X0                                  14.777      1.706      8.663      0.000
X1                                   0.000      0.000      4.964      0.000
X2                                  -0.044      0.014     -3.197      0.001
X3                                  -0.062      0.121     -0.510      0.610
X4                                   1.256      0.310      4.055      0.000
X5                                  -0.155      0.070     -2.208      0.027
X6                                   0.022      0.025      0.867      0.386Geographically Weighted Regression (GWR) Results
---------------------------------------------------------------------------
Spatial kernel:                                           Adaptive bisquare
Bandwidth used:                                                     151.000Diagnostic information
---------------------------------------------------------------------------
Residual sum of squares:                                           1499.592
Effective number of parameters (trace(S)):                           13.483
Degree of freedom (n - trace(S)):                                   145.517
Sigma estimate:                                                       3.210
Log-likelihood:                                                    -404.013
AIC:                                                                836.992
AICc:                                                               840.117
BIC:                                                                881.440
R2:                                                                   0.708
Adjusted R2:                                                          0.680
Adj. alpha (95%):                                                     0.026
Adj. critical t value (95%):                                          2.248Summary Statistics For GWR Parameter Estimates
---------------------------------------------------------------------------
Variable                   Mean        STD        Min     Median        Max
-------------------- ---------- ---------- ---------- ---------- ----------
X0                       15.043      1.455     12.234     15.907     16.532
X1                        0.000      0.000      0.000      0.000      0.000
X2                       -0.041      0.011     -0.062     -0.039     -0.025
X3                       -0.174      0.046     -0.275     -0.171     -0.082
X4                        1.466      0.703      0.489      1.495      2.445
X5                       -0.095      0.069     -0.206     -0.094      0.001
X6                        0.010      0.033     -0.039      0.002      0.076
===========================================================================

拟合参数空间化

# 回归参数
var_names=['cof_Intercept','cof_TotPop90','cof_PctRural','cof_PctEld','cof_PctFB','cof_PctPov','cof_PctBlack']
gwr_coefficent=pd.DataFrame(gwr_results.params,columns=var_names)# 回归参数显著性
gwr_flter_t=pd.DataFrame(gwr_results.filter_tvals())# 将点数据回归结果放到面上展示 
# 主要是由于两个文件中的记录数不同,矢量面中的记录比csv中多几条,因此需要将没有参加gwr的区域去掉
georgia_data_geo=gp.GeoDataFrame(georgia_data,geometry=gp.points_from_xy(georgia_data.X, georgia_data.Y))
georgia_data_geo=georgia_data_geo.join(gwr_coefficent)# 将回归参数与面数据结合
georgia_shp_geo=gp.sjoin(georgia_shp,georgia_data_geo, how="inner", op='intersects').reset_index()

绘制回归系数分布图

fig,ax = plt.subplots(nrows=2, ncols=4,figsize=(20,10))
axes = ax.flatten()for i in range(0,len(axes)-1):ax=axes[i]ax.set_title(var_names[i])georgia_shp_geo.plot(ax=ax,column=var_names[i],edgecolor='white',cmap='Blues',legend=True)if (gwr_flter_t[i] == 0).any():georgia_shp_geo[gwr_flter_t[i] == 0].plot(color='lightgrey', ax=ax, edgecolor='white') # 灰色部分表示该系数不显著ax.set_axis_off()if i+1==7:axes[7].axis('off')plt.show()

up-16e4dfcca1f60b80794a73f8a7ff874a42f.png

因此,从系数的分布就可以看出各个因素在每个州对于受教育程度的影响大小是不同的,并且有的因素的影响可能并不显著

参考链接

  • https://pysal.org/notebooks/model/mgwr/GWR_Georgia_example.html
  • https://github.com/pysal/mgwr/blob/master/notebooks/GWR_Georgia_example.ipynb
  • https://pysal.org/notebooks/model/mgwr/MGWR_Georgia_example.html
  • https://geopandas.org/docs/user_guide/mergingdata.html
  • https://www.codenong.com/10035446/
  • https://www.jianshu.com/p/834246169e20

http://chatgpt.dhexx.cn/article/HvXNZd6W.shtml

相关文章

白话空间统计二十四:地理加权回归(九)结果解读(二)

实际上,除了辅助表以外,GWR还会生成一份全要素的表。对回归的每一个样本都给出相应的信息,今天就来看看这些信息代表了什么内容。 生成的新的要素类字段信息如下: 实际上,Coeffcient(系数)和…

ArcMap|时空地理加权回归(GTWR)

ArcGIS的GTWR插件下载地址:https://www.researchgate.net/publication/329518786_GTWR_ADDIN_Valid_till_Dec_31_2022 更详细的操作参考: https://www.bilibili.com/video/BV1fR4y1M7xB?spm_id_from333.999.0.0 https://blog.csdn.net/weixin_40008135…

白话空间统计二十四:地理加权回归(六)ArcGIS的GWR工具参数说明一

(再次接近6000字,诚意满满啊) 从这一章开始进入实际操作环节……首先还是用ArcGIS,毕竟这个东西比较容易。 实际上要说起来,GWR有专门的软件,叫做GWR,但是这个软件暂时我还没有用过,所以等我先…

地理加权回归 | 模型如何应用于新数据的预测?

专注系列化、高质量的R语言教程 推文索引 | 联系小编 | 付费合集 有读者不知道如何用地理加权回归去预测新的数据。本篇以常用的两个工具包为例进行介绍。 本篇目录如下: 0 数据准备1 spgwr工具包2 GWmodel工具包3 结语 相关推文: spgwr | R语言与地理加…

城市数据派(多尺度地理加权回归理论与应用——关于地理加权回归GWR和多尺度地理加权回归MGWR)

目前,GWR已经成为处理空间异质性的主要方法之一。与经典的全局回归模型的OLS不同,GWR是局部回归模型,模型系数是通过观测周围的样本来回归得到。 在这里插入图片描述

R语言地理加权回归数据分析

在自然和社会科学领域有大量与地理或空间有关的数据,这一类数据一般具有严重的空间异质性,而通常的统计学方法并不能处理空间异质性,因而对此类型的数据无能为力。以地理加权回归为基础的一系列方法:经典地理加权回归,…

白话空间统计二十四:地理加权回归(五)

这是写概念的最后一节……从下一节开始,大家就可以告别枯燥的理论和概念了(此处应有掌声) 上一章节写到,地理加权中,空间关系的比广义的空间关系的限制要多得多,常用的就是用距离衰减的方法,而…

白话空间统计二十四:地理加权回归(八)结果解读(一)

地理加权回归分析完成之后,与OLS不同的是会默认生成一张可视化图,像下面这张一样的: 这种图里面数值和颜色,主要是系数的标准误差。主要用来衡量每个系数估计值的可靠性。标准误差与实际系数值相比较小时,这些估计值…

GWmodel | 地理加权模型(Ⅱ-2):如何查看地理加权回归的显著性

《地理加权模型》系列自推出来,深受各位读者喜爱。前几天有读者问:使用gwr()等函数运行模型后,怎么去查看它里面的信息呢?比如如何看变量系数的显著性。本篇就来介绍如何在R语言中去查看GWR模型的输出结果。 对于一般模型如线型模…

多尺度地理加权回归(MGWR),地理加权回归(GWR),最小二乘法(OLS)回归模型的对比分析

MGWR(Multiscale Geographic Weighted Regression多尺度地理加权回归) 一,概念 经典GWR由Fotheringham在1996年提出,基于构建空间权重矩阵的回归模型,普遍用于空间的影响因素分析上。SGWR(半参数地理加权…

白话空间统计二十四:地理加权回归(四)

本来这一章准备直接写(照抄)ArcGIS的帮助文档,写地理加权回归工具的使用……,然后就直接结束地理加权回归的,但是近来收到不少同学的邮件,很多都是掉在了当年虾神挖出的大坑里面,比如写了方法&a…

白话空间统计二十四:地理加权回归(二)

六千多字的大篇……诚意满满啊…… 橘生淮南则为橘,生于淮北则为枳,叶徒相似,其实味不同。所以然者何?水土异也。——《晏子春秋内篇杂下》 水土不服、南北差异,(包括地域歧视)是自古以来的一…

白话空间统计二十四:地理加权回归(三)

本章有数学公式……对数学过敏者慎入…… 前文再续,书接上一回……上一次说到,在改进全局回归的基础上,GWR终于横空出世了,从此空间分析领域终于有了自己专用的回归算法。如果说,空间统计有别于经典统计学的两大特征&…

用ArcGIS做GTWR 时空地理加权回归分析

空间异质性是空间计量回归的重要研究对象,通常采用地理加权回归模型进行分析,而ArcGIS自带工具箱只能支持截面数据的地理加权回归。要分析面板数据则采用地理和时间加权回归( GTWR),该模型是一个局部线性回归模型&…

ArcGIS与地理加权回归【三】

开 工 大 急 原址链接: ArcGIS与地理加权回归【三】https://mp.weixin.qq.com/s/x85EXKImSHio1IZovW9qdA 接着5个月之前.......ArcGIS与地理加权回归GWR【二】以及MGWR软件下载 在ASU下载了样例“关于影响佐治亚州受教育水平”的数据。在上一篇已简单介绍…

白话空间统计二十四:地理加权回归(一)

二十四在人的生活中有举足轻重的地位,一年有二十四个节气,一天有二十四个小时。中国的正史称之为“二十四史”(有人说加清史就二十五了……但是正史这个词,出自清乾隆钦定二十四史,所以一直“正史”这个词,…

ArcGIS Pro中的回归分析浅析(下)地理加权回归工具(GWR)使用小结

内容导读 1)回归概念介绍; 2)探索性回归工具(解释变量的选择)使用; 3)广义线性回归工具(GLR)使用; *加更:广义线性回归工具的补充内容 4)地理加权回归工…

地理加权回归简易总结

地理加权回归 空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,那么地理加权回归,就可以用来量化空间异质性。 1.地理加权回归的出现: 1)因为地理位置的变…

(学习笔记)地理加权回归(GWR)、多尺度地理加权回归(MGWR)原理与软件实现

1回归 1.1回归 回归分析是最常用的社会科学统计方法。回归用于评估两个或更多要素属性之间的关系。通过回归分析,我们可以对空间关系进行建模、检查和探究;回归分析还可以帮助解释所观测到的空间模式背后的诸多因素,例如为什么有些地区会持…

ArcGIS与地理加权回归GWR【一】

公众号原文 ArcGIS与地理加权回归GWR【一】https://mp.weixin.qq.com/s/fMPYxO3G7ff2192ZQICN-A 开个新坑啊,写一写关于地理加权回归基础的东西(深了我也不会啊),希望也能用通俗的语言来记录一下我以前学习空间统计过程中的理解…