【数据统计】— 峰度、偏度、点估计、区间估计、矩估计、最小二乘估计

article/2025/8/22 23:25:38

【数据统计】— 峰度、偏度、点估计、区间估计、矩估计、最小二乘估计

  • 四分位差
  • 异众比率
  • 变异系数
    • 利用数据指标指导建模思路
  • 形状变化
    • 数据分布形态
      • 峰度: 度量数据在中心聚集程度
      • 偏度
    • 利用数据指标指导建模思路
  • 参数估计
    • 点估计
    • 区间估计
    • 矩估计
      • 举例:黑白球(矩估计)
    • 最小二乘估计(Least Square Estimate, LSE)
      • 举例:黑白球(最小二乘估计)

四分位差

  • 一组数据的上四分位数和下四分位数的差,也称为内矩
  • 若上四分位数为𝑄𝑈,下四分位数为𝑄𝐿,则四分位差为在这里插入图片描述
  • 特点
    • Q是区间[𝑄𝐿, 𝑄𝑈]的长度
    • 区间[𝑄𝐿, 𝑄𝑈]含有50%的数据
    • 四分位数不会受到数据中极端值的影响
      在这里插入图片描述

异众比率

在这里插入图片描述

变异系数

在这里插入图片描述

利用数据指标指导建模思路

  • 若均值与中位数接近,且偏度接近0,可知数据分布是近似对称的,建模时可考虑运用对称信息
  • 若极差或四分位差较大,建模时需考虑数据是否有长尾现象在这里插入图片描述

形状变化

数据分布形态

  • 数据分布形态反映了一组数据分布的整体形状信息。
  • 两种最常用的反映数据形状变化的指标:
    • 峰度
    • 偏度

峰度: 度量数据在中心聚集程度

  • 峰度(Kurtosis)是描述总体中所有取值
    分布形态陡峭程度 or 平坦程度
  • 峰度的具体计算公式为:在这里插入图片描述
  • 正态分布的峰度值为3
    • 个别软件将峰度值减3, 如:SPSS等
  • 与正态分布相比较
    • 峰度=0表示该总体数据分布与正态分布的陡缓程度相同
    • 峰度>0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰
    • 峰度<0表示该总体数据分布与正态分布相比较为平坦,为平顶峰
      在这里插入图片描述

偏度

  • 偏度(Skewness)描述的是某总体取值分布的对称性

  • 偏度的具体计算公式为:在这里插入图片描述

  • 正态分布的偏度值为0

  • 某个总体

    • 偏度=0表示数据分布形态与正态分布的偏斜程度相同
    • 偏度>0表示数据分布形态与正态分布相比为正偏或右偏,即有一条长尾巴拖在右边,数据右端有较多的极端值
    • 偏度<0表示数据分布形态与正态分布相比为负偏或左偏,即有一条长尾拖在左边,数据左端有较多的极端值在这里插入图片描述

利用数据指标指导建模思路

  • 峰度的应用
  • 正态分布
  • 拉普拉斯分布:更好的拟合0出现概率较大的稀疏数据在这里插入图片描述
  • 泊松分布:
    • 例如,POI(兴趣点)位置的访问频率
  • 幂律分布:对数空间下呈现出线性关系(80-20法则)
    • 例如:社交网络(Social Network), 图网络分析
      在这里插入图片描述在这里插入图片描述

参数估计

  • 参数(parameter)
    • 参数 是用来描述总体数据特征的度量
  • 统计量(statistic)
    • 统计量 是用来描述样本数据特征的度量
      • 由试验计算得出,不依赖于任何其他未知的量(特别是不能依赖于总体分布中所包含的未知参数)
  • 参数估计(parameter estimation)
    • 是统计推断的基本问题之一:用样本统计量估计总体的参数
      • 参数未知的真实
      • 统计量已知的估计
    • 例:掷骰子例子

点估计

  • 点估计:用样本统计量𝜃 的某个取值直接作为总体参数𝜃的估计值
    • 简单来说,直接以样本指标来估计总体指标
    • 总体的某个特征值,如数学期望、方差和相关系数等
    • 用样本均值 x x x直接作为总体均值 μ μ μ的估计值
    • 用样本方差 s 2 s^2 s2直接作为总体方差 σ 2 σ^2 σ2的估计值
    • 点估计的常用方法
      • 矩估计
      • 最小二乘估计
      • 极大似然估计
      • 最大后验概率
      • 贝叶斯估计

区间估计

  • 区间估计:从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计
    • 用数轴上的一段经历或一个数据区间,表示总体参数的可能范围。这一段距离或数据区间称为区间估计的置信区间

矩估计

  • 原理:大数定律(大量试验中的事件出现频率=它的概率)

  • 矩估计是基于 “替换”思想,即用样本矩估计总体矩

    • 均值,方差
  • 随机变量的矩

    • K阶原点矩:一阶原点矩表示期望在这里插入图片描述
    • K阶中心距:在这里插入图片描述
      • 二阶中心矩表示方差
      • 三阶中心矩表示偏度
      • 四阶中心矩表示峰度
    • 在这里插入图片描述
  • 数学上,“矩”是一组点组成的模型的特定的数量测度

举例:黑白球(矩估计)

  • 例:假如有一个罐子,里面有黑白两种颜色的球,数目多少不知,两种颜色的比例也不知。每次任意从已经摇匀的罐中拿1个球出来,记录球的颜色,然后把拿出来的球再放回罐中。假如在前面的100次重复记录中,有70次是白球。请问罐中白球所占的比例是多少?
  • 解:用样本中白球比例的均值作为估计代替总体均值。即估计结果为罐中白球所占的比例70% =7/10。符合直观

最小二乘估计(Least Square Estimate, LSE)

  • 参数估计量应该使得模型能最好地拟合样本数据,即估计值与观测值之差的平方和最小
  • 目标:最小化估计值𝑦与观测值 y ^ \hat{y} y^之差的平方和 m i n L ( θ ) = ∑ i = 1 N ( y − y ^ ) 2 min L(θ)=\sum^N_{i=1}(y-\hat{y})^2 minL(θ)=i=1N(yy^)2
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

举例:黑白球(最小二乘估计)

  • 问题:假如有一个罐子,里面有黑白两种颜色的球,数目多少不知,两种颜色的比例也不知。每次任意从已经摇匀的罐中拿1个球出来,记录球的颜色,然后把拿出来的球再放回罐中。假如在前面的100次重复记录中,有70次是白球。请问罐中白球所占的比例是多少?
  • 请使用最小二乘估计方法,求解上述问题在这里插入图片描述

http://chatgpt.dhexx.cn/article/DZnVLV0G.shtml

相关文章

7.1 参数的点估计

小结&#xff1a; 点估计是一种统计推断方法&#xff0c;它用于通过样本数据估计总体参数的值。在统计学中&#xff0c;总体是指一个包含所有个体的集合&#xff0c;而样本是从总体中选出的一部分个体。总体参数是总体的某种特征&#xff0c;如平均值、标准差、比例等。 点估…

【数理统计】参数估计及相关(点估计、矩估计法、最大似然估计、原点矩中心距)

1 基础知识 1.1 常见分布的期望和方差 1.2 对数运算法则 log ⁡ a ( M N ) log ⁡ a M log ⁡ a N log ⁡ a ( M / N ) log ⁡ a M − log ⁡ a N log ⁡ a ( 1 / N ) − log ⁡ a N log ⁡ a M n n log ⁡ a M \log _{a}(M N)\log _{a} M\log _{a} N \\ \log _{a}(M / N…

二、机器学习基础11(点估计)

点估计&#xff1a;用实际样本的一个指标来估计总体的一个指标的一种估计方法。点估计举例&#xff1a;比如说&#xff0c;我们想要了解中国人的平均身高&#xff0c;那么在大街上随便找了一个人&#xff0c;通过测量这个人的身高来估计中国人的平均身高水平&#xff1b;或者在…

统计学之参数估计(点估计和参数估计)含例题和解答

统计学之参数估计 参数点估计矩估计法极大似然估计法点估计的评价准则&#xff08;无偏性一致性有效性&#xff09; 区间估计主要公式置信区间区间估计的内容总体均值的区间估计(大样本)总体均值的区间估计(小样本)单一总体均值的区间估计总结两个总体均值之差的区间估计(大样本…

点估计(矩估计法和最大似然估计法)

估计即是近似地求某个参数的值&#xff0c;需要区别理解样本、总体、量、值 大致的题型是已知某分布&#xff08;其实包含未知参数&#xff09;&#xff0c;从中取样本并给出样本值 我只是一个初学者&#xff0c;可能有的步骤比较繁琐&#xff0c;请见谅~ 1、矩估计法 做题步骤…

概率论--点估计

首先我们来看下什么是参数估计 那么参数估计问题又是什么&#xff1f; 参数估计分为两大类&#xff0c;一类是点估计&#xff0c;还有一类是区间估计&#xff0c;点估计分为矩估计和最大似然估计&#xff0c;就比如说估计降雨量&#xff0c;预计今天的降雨量如果是550mm就…

点估计及矩估计的一些理解

点估计指的是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。在这个定义中,总体参数也即是总体分布的参数,一般我们在讨论总体分布的时候,只有在简单随机样本(样本独立同分布)情况下才有明确的意义,总体…

参数估计(点估计和区间估计)

“参数估计是以抽样分布为中介&#xff0c;用样本的参数特征对总体的参数进行数值估计的过程。” 一、点估计 1.点估计就是用样本统计量来估计总体参数。 概念理解&#xff1a;当我们想知道某一总体的某个指标的情况时&#xff0c;测量整体该指标的数值 的工作量太大&#xff…

概率论:参数估计——点估计

首先&#xff0c;我们要知道点估计是什么&#xff1a; 简单来讲&#xff0c;点估计一般就是拿出很多样本来&#xff0c;拿他们的均值和方差之类的当成参数&#xff0c;或者是通过均值和方差计算出他的参数。 简单来说&#xff0c;参数空间就是这个分布的参数可以的取值。 先学习…

参数估计之点估计(矩估计,最大似然估计) 详解+例题

统计学 参数估计之点估计(矩估计,最大似然估计) 详解含推导 1.何为点估计 在了解点估计之前,我们先介绍一下估计量与估计值的概念 1.1估计量与估计值 参数估计 就是用样本统计量去估计总体的参数,如用样本均值 x ⃗ \vec x x 去估计总体均值 μ ,用样本比例 p 估计总体比…

whl文件安装方法

whl格式本质上是一个压缩包&#xff0c;里面包含了py文件&#xff0c;以及经过编译的pyd文件。使得可以在不具备编译环境的情况下&#xff0c;选择合适自己的python环境进行安装 问题描述&#xff1a;whl下载了后不会安装 解决方法&#xff1a; 1.把下载的文件拖到桌面 2.…

pip下载whl查看对应版本

查看方法&#xff1a;python -m pip debug --verbose 直接安装可能会报错&#xff1a; 报错原因&#xff1a;当前的whl安装包和当前版本的python版本不匹配 解决方法&#xff1a;先查看当前python版本支持的whl文件名称&#xff0c;根据相应的文件名去下载相应的包

whl 文件怎么安装

whl 文件怎么安装 1.首先进入官网下载whl文件&#xff0c;然后保存位置要记住 2.从保存位置之间进入cmd 3.在打开的cmd中之间 pip install 文件名 卸载pip pip uninstall 文件名

Pycharm 手动安装whl文件

一、下载whl文件 1、在界面直接搜索待安装模块对应的.whl文件。 比如安装numpy失败就找到numpy文件的位置&#xff0c;根据自己的需要选择版本下载。 以第一个为例&#xff0c;1.19.1表示numpy版本&#xff0c;cp39表示对应python版本为3.9&#xff0c;win32表示适合32位机器…

python 安装whl文件

前言 WHL文件是以Wheel格式保存的Python安装包&#xff0c;Wheel是Python发行版的标准内置包格式。在本质上是一个压缩包&#xff0c;WHL文件中包含了Python安装的py文件和元数据&#xff0c;以及经过编译的pyd文件&#xff0c;这样就使得它可以在不具备编译环境的条件下&#…

python如何安装whl_python3 whl怎么安装

1、先弄清楚自己的Python是什么版本的&#xff0c;以方便后续下载合适的.whl文件。 winR进入命令运行窗口&#xff0c;输入cmd打开命令提示符&#xff0c;接着输入python即可。 这是我的版本3.6.3&#xff0c;win32 2、选择需要的.whl文件下载&#xff0c;一般选择最后的&…

python whl_python whl是什么文件

在安装whl文件之前&#xff0c;我们需要先搞清楚什么是whl文件&#xff0c; whl格式本质上是一个压缩包&#xff0c;里面包含了py文件&#xff0c;以及经过编译的pyd文件。使得可以在不具备编译环境的情况下&#xff0c;选择合适自己的python环境进行安装。 在Win7下安装whl文件…

whl是什么

在使用 pip 命令进行安装时&#xff0c;会发现下载一些 https://xxxx.org/xxx/xxx.whl 的文件 .whl格式的文件本质上是一个压缩包&#xff0c;里面包含了py文件&#xff0c;以及经过编译的pyd文件。方便在机器上进行python模块的安装。 使用该文件也非常简单&#xff0c;进行…

python打包whl文件

应用场景 在python的使用过程中&#xff0c;当遇到通过pip无法安装包&#xff0c;可以通过去Python安装包大全中( whl包下载 )下载 whl 包来安装解决问题&#xff0c;也可以在别处打包成 whl 文件&#xff0c;拷贝过来运行 介绍 whl 文件是以 wheel 格式保存的Python安装包。文…

Python安装.whl文件流程及问题解决

安装.whl文件流程及问题解决 文章目录 安装.whl文件流程及问题解决1.提前安装Python及pip工具2.下载合适的whl安装包3.安装.whl文件 Python中&#xff0c;.whl文件是使用wheel格式存储的一种Python安装包&#xff0c;同时也是一个标准的内置包格式。可以将其看作Python库的一个…