python金融分析小知识(6)——偏度与峰度的计算

article/2025/8/22 21:25:52

Hello 大家好,我是一名新来的金融领域打工人,日常分享一些python知识,都是自己在学习生活中遇到的一些问题,分享给大家,希望对大家有一定的帮助!

相信大家在平时的统计分析中,一定会用到数组偏度以及峰度的计算,那么什么是偏度?什么是峰度呢?

偏度(skewness)也称为偏态、偏态系数,是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。——来自百度百科

峰度(peakedness;kurtosis)又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度。样本的峰度是和正态分布相比较而言统计量,如果峰度大于三,峰的形状比较尖,比正态分布峰要陡峭。反之亦然。——来自百度百科

咱们直接来看公式吧:

偏度 = 三阶中心距 / 标准差的三次方

峰度 = (四阶中心矩 / 方差的平方)- 3

好了,知道了偏度与峰度的定义以及计算公式,我们直接上代码:


方法1:通过pandas计算偏度与峰度 

 首先我们构建一个array数组,然后把它转为Serise数据格式

a = np.array([3,6,3,9,10,12,36,3])
s1 = pd.Series(a)
print(s1)

我们打印一下结果看看:

0     3
1     6
2     3
3     9
4    10
5    12
6    36
7     3
dtype: int32

下面我们计算偏度和峰度,pandas使用起来特别方便如下所示:

print(s1.skew(),s1.kurt(),s1.kurtosis())

我们看看结果,第一个数是偏度,第二个数和第三个数都是峰度(两者的结果是一样的)

2.2834315607184914 5.684904087149228 5.684904087149228

2.通过stats计算偏度与峰度

from scipy import stats
print(stats.skew(a),stats.kurtosis(a))

 我们来看一下结果,第一个数是偏度,第二个数是峰度

1.8308182642189486 2.0404305176901083

咦,怎么两种方法算出来的结果不一样呢?

我们看一下两种方法所求的标准差:

print(s1.std()) ## (除以n-1) 无偏 pandas方法
print(stats.tstd(s1)) ## (除以n-1) 无偏 stats方法
print(np.std(s1)) ## (除以n) 有偏 numpy方法
print(np.std(s1,ddof=1)) ## (除以n-1) 无偏 numpy方法

我们看看结果:

10.977249200050075
10.977249200050075
10.268276388956425
10.977249200050075

我们发现,第1,2,4结果是一样的,第3个结果与其他的不一样,其实这里的不同就体现在标准差的计算中,也就是无偏与有偏的区别。

使用Pandas计算峰度与偏度是无偏的,而使用Stats计算偏度与峰度是有偏的,这就导致计算出的结果不一致。

3.自己通过代码来实现计算偏度与峰度

first_central_moment = (sum(a - np.mean(a)))/len(a)  ##一阶中心矩
Third_central_moment = (sum((a - np.mean(a))**3))/len(a)  ##三阶中心矩
Four_central_moment = (sum((a - np.mean(a))**4))/len(a)  ##四阶中心矩
skew = Third_central_moment/(np.std(a)**3) ##skew
kurt = (Four_central_moment/(np.var(a))**2) - 3 ##kurt

 我们来打印一下结果,第一项是偏度,第二项是峰度:

1.8308182642189486 2.0404305176901083

这个结果是和stats计算出来的结果一样的!结果都是有偏的

其实方差就是二阶中心矩,让我们来看看不同方法的计算结果:

s1.var() #pandas方法
np.var(a,ddof=1) #numpy方法
stats.tvar(a) #stats方法
(sum((a - np.mean(a))**2))/(len(a)-1) #自定义二阶中心矩计算方法

我们打印一下结果:

 发现他们的结果是一样的,并且结果都是无偏结果。

以下代码计算的应该都是无偏的结果,我们打印一下:

first_central_moment = (sum(a - np.mean(a)))/(len(a)-1) ##一阶中心矩
Third_central_moment = (sum((a - np.mean(a))**3))/(len(a)-1) ##三阶中心矩
Four_central_moment = (sum((a - np.mean(a))**4))/(len(a)-1)  ##四阶中心矩
skew = Third_central_moment/(np.std(a,ddof=1)**3) ##skew
kurt = (Four_central_moment/(np.var(a,ddof=1))**2) - 3 ##kurt
print(skew,kurt)
1.7125736705388683 1.4103767029788452

 发现还是和pandas计算的结果不一样,原因我还在寻找。。。

附上两篇优秀的文章:

有偏估计和无偏估计  python pandas库和stats库计算偏度和峰度(附程序)

今天的文章就分享到这里啦!


http://chatgpt.dhexx.cn/article/XaAWg51c.shtml

相关文章

使用Excel计算峰度(Kurtosis)和偏度(Skewness)

峰度(Kurtosis)和偏度(Skewness) 峰度是描述总体中所有取值分布形态陡缓程度的统计量。计算公式是: 在Excel中的公式是:KURT 因为是与标准正态分布比较,而标准正态分布的四阶矩为3,…

Resnet解读

pytorch的resnet模块在torchvision的models中。 里面可以选择的resnet类型有: _all_列表的每一个resnet都提供了实现的函数: def resnet18(pretrainedFalse, progressTrue, **kwargs):"""Constructs a ResNet-18 model.Args:pretrained …

ResNet算法

Daily learning2 Q1:过拟合(overfitting),欠拟合(underfitting)? A1:欠拟合:根本原因是特征维度过少,模型过于简单,导致拟合的函数无法满足训练集&#xff0c…

Resnet代码详解

这篇文章是用来讲解Resnet(残差网络)代码的,结合代码理解残差网络结构。 目录 Bottleneck类 Conv33 Conv11 BasicBlock ResNet _make_layer代码解析 完整的ResNet代码: 可以直接调用torch内置的resnet官方代码。 from torchvision.models impo…

ResNet结构的pytorch实现

文章目录 1.ResNet的创新1)亮点2)原因 2.ResNet的结构1)浅层的残差结构2)深层的残差结构3)总结 3.Batch Normalization4.参考代码 1.ResNet的创新 现在重新稍微系统的介绍一下ResNet网络结构。 ResNet结构首先通过一个…

Resnet论文解读

摘要: 提出了一种残差结构,这些残差网络的集合在ImageNet测试集上实现了3.57%的误差。该结果在ILSVRC 2015分类任务中获得第一名。 介绍: 主要讲述的就是针对 深度越深,精确度达到了一种饱和的状态,然后就会产生退化…

了解ResNet

产生背景 网络的层数越多,就能够提取更多的特征,但是如果只是简单的增加深度,就会导致梯度爆炸。也有文章提出,解决该问题的方法是正则化初始化和中间的正则化层,但是这样会导致另一个问题,退化,网络的层数…

ResNet网络

1.1.ResNet的提出 残差网络(ResNet) 是由来自Microsoft Research的4位学者提出的卷积神经网络,在2015年的ImageNet大规模视觉识别竞赛(ImageNet Large Scale Visual Recognition Challenge, ILSVRC)中获得了图像分类和物体识别的优胜。 网络…

ResNet详解——通俗易懂版

ResNet学习 什么是ResNet为什么要引入ResNet?ResNet详细解说 本篇博客主要是自己对论文的一些解读以及参考一些博客后的理解,如若有不对之处,请各位道友指出。多谢! 2015年刚提出ResNet的Paper 2016对ResNet进行改进之后的Paper …

CNN经典网络模型(五):ResNet简介及代码实现(PyTorch超详细注释版)

目录 一、开发背景 二、网络结构 三、模型特点 四、代码实现 1. model.py 2. train.py 3. predict.py 4. spilit_data.py 五、参考内容 一、开发背景 残差神经网络(ResNet)是由微软研究院的何恺明、张祥雨、任少卿、孙剑等人提出的, 斩获2015年ImageNet竞赛…

ResNet详解+PyTorch实现

1.Resnet简介 深度残差网络(Deep residual network, ResNet)的提出是CNN图像史上的一件里程碑事件,由于其在公开数据上展现的优势,作者何凯明也因此摘得CVPR2016最佳论文奖。 Resnet是残差网络(Residual Network)的缩写&#xff…

点估计

1.说明: 设总体 X 的分布函数形式已知, 但它的一个或多个参数为未知, 借助于总体 X 的一个样本来估计总体未知参数的值的问题称为点估计问题. 在统计问题中往往先使用最大似然估计法, 在最大似然估计法使用不方便时, 再用矩估计法. 2.常用构造估计量的方法 1&#…

【应用统计学】参数统计-点估计与估计量的评价标准

一、点估计 参数的点估计就是根据样本构造一个统计量,作为总体未知参数的估计。这个统计量称为未知参数的估计量。 在统计中,经常使用的点估计量有: 二、估计量的评价标准 1、无偏性 无偏性即指估计量抽样分布的数学期望等于总体参数的真值。 2、有效…

功能点估算方法,如何让估算偏差更小?

1、何为软件功能点 ​ ​软件功能点是站在业务角度对软件规模的一种度量,功能点的多少代表软件规模的大小,这里说的功能点是标准的功能点,按照标准的估算方法,每个人对特定需求估算出的功能点数是一致的。 功能点估算方法&…

三点估算法

施工时间划分为乐观时间、最可能时间、悲观时间 乐观时间:也就是工作顺利情况下的时间为a 最可能时间:最可能时间,就是完成某道工序的最可能完成时间m 悲观时间:最悲观的时间就是工作进行不利所用时间b。 活动历时均值(或估计值)(乐观估计4最可能估计悲观估计)/6 …

点估计、区间估计(利用回归方程进行预测)

回归模型经过各种检验并标明符合预定的要求后,可利用它来预测因变量。预测(predict)是指通过自变量x的取值来预测因变量y的取值。 1、点估计 利用估计的方程,对于x的一个特定值 ,求出y的一个估计值就是点估计。点估计分为两种&…

数理统计中的点估计

• 统计推断的基本问题有二:估计问题,和假设检验问题. • 本章讨论总体参数的点估计和区间估计.理解这两种估计的思想,掌握求参数估计量的方法和评判估计量好坏的标准. 点估计 问题的提出 设灯泡寿命 T~N(μ,σ2) ,但参数 μ 和 σ2 未知. 现在要求通过对总体抽样得到的…

统计学-点估计和区间估计

点估计和区间估计 点估计 矩估计法 正态分布是一种统计量,目的是描述总体的某一性质。而矩则是描述这些样本值的分布情况,无论几阶矩,无外乎是描述整体的疏密情况。K阶矩分为原点矩和中心矩: 前者是绝对的:1阶就是平均…

点估计和区间估计——统计学概念

概念简介: 点估计和区间估计是通过样本统计量估计总体参数的两种方法。点估计是在抽样推断中不考虑抽样误差,直接以抽样指标代替全体指标的一种推断方法。因为个别样本的抽样指标不等于全体指标,所以,用抽样指标直接代替全体指标&…

【定量分析、量化金融与统计学】统计推断基础(3)---点估计、区间估计

一、前言 我发现很多人学了很久的统计学,仍然搞不清楚什么是点估计、区间估计,总是概念混淆,那今天我们来盘一盘统计推断基础的点估计、区间估计。这个系列统计推断基础5部分分别是: 总体、样本、标准差、标准误【定量分析、量化…