离散分布的分布函数_数据分析|概率分布

article/2025/5/1 15:58:54

dbed09687b07e98dd35404301146fca0.png

当我们对一组数据作分析的时候,一定要明确的是,这组数据只是研究对象(population)中的一部分样本(sample)。我们只是对一部分样本进行分析,然后去推测出整个对象的规律。概率分布可以很好的发现数据的内在规律;又根据随机变量所属类型的不同,概率分布取不同的表现形式

edfbb4dc89dacda7993bc467add5270b.png

目录

  1. 随机事件及其概率

  2. 概率的性质与运算法则

  3. 离散型随机变量及其分布

  4. 连续型随机变量及其分布

一、随机事件及其概率

随机事件(random event):每次试验可能出现也可能不出现的实践。包括:简单事件,必然事件,不可能事件

随机事件的概率:事件A的概率是一个介于0和1之间的一个值,用以度量试验完成时事件A发生的可能性大小,记作P(A)

P(A) = 事件A发生的次数 / 重复试验次数 =m/n = p

古典概率

1.结果有限。如抛硬币试验中,只可能出现"正面朝上"与"反面朝上"

2.各个结果出现的可能性被认为是相同的。

P(A) = 事件A所包含的基本事件个数/样本空间所包含的基本事件个数=m/n

二、概率的性质与运算法则

概率的基本性质

1.对于任一随机事件A,有 0<=P(A) <= 1

2.必然事件概率为1,不可能事件概率为0

3.若A和B互斥,则P(A∪B) = P(A)+ P(B)

概率的加法法则

P(A∪B) =P(A) + P(B) - P(A∩B)

条件概率

条件概率:在事件B已经发生的条件下事件A发生的概率,称为已知事件B时事件A的概率记为

P(A|B) =P(AB)/P(B)

f8ce3aa0ca66f40dcbe0c67410979683.png

乘法公式(条件概率的转换)

1.用户计算两事件交的概率

2.以条件概率的定义为基础

3.设A,B为两个事件,若P(B) >0,

P(AB) =P(B)P(A|B) 或 P(AB) = P(A)P(B|A)

独立事件

1.若P(A|B) = P(A) 或 P(B|A) =P(B) ,则称事件A与B事件独立,或称独立事件

2.若两个事件相互独立,则这两个事件同时发生的概率等于它们各自发生的概率相乘

P(AB) = P(A)· P(B)

3.若事件A1,A2...An 相互独立,则P(A1,A2,...An) = P(A1) ·P(A2) ...P(An)

全概率公式与贝叶斯公式

全概率公式:

2964dbcf531a031142160fb383f8cad7.png

贝叶斯公式(逆概率公式):

03b4727160bb2cc56eaceed1932b381d.png

P(Bi)被称为数据Bi的先验概率(priority probability)

p(Bi|A)被称为事件Bi的后验概率( posterior probability )

三、离散型随机变量及其分布

随机变量

1.一次试验的结果数值性描述

2.一般用X,Y,Z来表示

3.根据取值情况的不同分为离线型随机变量和连续型随机变量

离散型随机变量(discrete random variable):如果表示试验结果的变量X,其可能取值至多为可列个且以各种确定的概率取这些不同的值

离散型随机变量的概率分布

1.列出离散型随机变量X的多元可能取值

2.列出随机变量取这些值的概率

3.P(X=xi) =Pi 称为离散型随机变量的概率函数

 Pi>= 0    ΣPi = 1

离散型随机变量的数学期望和方差

期望

1.离散型随机变量X的所有可能取值Xi与其取对应的概率Pi乘积之和

2.描述离散型随机变量取值的集中程度

3.记为u 或者E(x)

方差

1.随机变量X的每一个取值与期望值的离差平方和的数学期望

2.描述离散型随机变量取值的分散程度

3.记作∆² 或者D(x)

4.方差的平方根为标准差

5.离散系数 = ∆ /E(x)

二项分布

二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p

满足以下条件的试验成为二项试验:

1.试验由一系列相同的n个试验组成;

2.每次试验有两种可能的结果,成功或者失败;

3.每次试验成功的概率是相同的,用p来表示;

4.试验是相互独立的。

设x为n次试验中的成功的次数,由于随机变量的个数是有限的,所以x是一个离散型随机变量。x的概率分布成为二项分布。

code:

import numpy as npimport matplotlib.pyplot as plt# 二项分布list_a = np.random.binomial(n=10,p=0.3,size=1000000)# 取样1000000次,每次进行十组试验,单组试验成功概率为0.3,list_a为每组试验中成功的组数个数print(list_a)print(len(list_a))plt.hist(list_a,bins=8,color='g',alpha=0.4,edgecolor='b')plt.show()

e1cfed716db1dc81dfbe456b3e54d602.png

泊松分布

泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。泊松分布适合于描述单位时间内随机事件发生的次数。

# 泊松分布import numpy as npimport matplotlib.pyplot as plt# 设一个某站台平均每小时会经过8辆公共汽车,求每小时经过12俩的概率list_a = np.random.poisson(8, 100000)  # 试验重复100000次print(list_a)print(len(list_a))plt.hist(list_a,bins=8,color='g',alpha=0.4,edgecolor='b')plt.show()

4246117fbf75773855583dbeb987f787.png

常用的离散型概率分布总结

5bb0680ffb0aa7665aa7b4ba3b42a6ab.png

四、连续型随机变量及其分布

连续型随机变量(continue random variable):如果表示试验结果的变量X,其可能取值为某范围内的任何数值,且X在其取值范围内的任意区间中取值时,其概率是确定的

连续型随机变量的概率分布

连续型随机变量可以取某一区间或整个实数轴上的任意一个值

它取任何一个特定的值的概率都等于0

不能列出每一个值及其相应的概率

通常研究它取某一区间值的概率

用概率密度函数的形式和分布函数的形式来描述

概率密度函数

1.设X为一连续型随机变量,x为任意实数,x的概率密度函数记为f(x) ,它满足条件

94c118309c790ffdc703db6726d96af1.png

2.f(x)不是概率

连续型随机变量的期望和方差

1.连续型随机变量的数学期望

0031d40a6f62356d9ce4b5f3f6566d6e.png

2.方差

56112c2bd25d56038cc5f6001cd73465.png

正态分布

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形

ded798dd2e40340970f76e0b1aba2a39.png

性质:

图形关于x=u对称钟形曲线,且峰值在x=u处

均值u和标准差σ一旦确定,分布的具体形式也唯一确定

均值u可取实数轴上面的任意数值,决定正态曲线的具体位置

标准差决定曲线的“陡峭”或“扁平”。σ越大,正态曲线扁平;σ越小,正态曲线月高陡峭

标准正态分布:均值为0,方差为1

code:

# 正态分布# list_d = np.random(loc,scale,size=None)#loc为期望 scale为标准差 size为取样数量,默认为None,即仅返回一个数list_d = np.random.normal(0,1,1000)plt.hist(list_d, bins=8, color='g', alpha=0.4, edgecolor='b')plt.show()

a19c3ae5613ffdc1256a57fc072f43c0.png

均匀分布

均匀分布的概率密度函数为:f(x) = 1/(b-a),0

数学期望和方差

E(x) = (a+b)/ 2    D(x) = (b-a)² /12

4b57fee2f3fbfd3f6bf23113a8823f60.png

code:

import numpy as npimport matplotlib.pyplot as plt# 均匀分布list_c = np.random.uniform(0,10,10000)#low和high为分布范围 size为样本数目plt.hist(list_c,bins=8,color='g',alpha=0.4,edgecolor='b')plt.show()

a3d7134d3e97cbe503394bb23ceafc51.png

指数分布

概率密度函数:

98f488efc557b78ed5db05e43ec1c761.png

数学期望和方差

E(x) = 1 /λ    D(x) = 1 / λ²

606af992dc361dda74a3037cb856bdf8.png

code:

# 指数分布list_e = np.random.exponential(0.125,1000)plt.hist(list_e,bins=8,color='g',edgecolor='b',alpha=0.4)plt.show()

a68c3da74132f710da2d858602273b0a.png

常用的连续型概率分布总结

5a86c937785fd1cd19244efd98426ec0.png

往期精选

机器学习|梯度下降法

机器学习|逻辑回归

机器学习|决策树

机器学习|随机森林

机器学习|Adaboost

数据分析|数据的整理&展示

数据分析|数据分布特征的描述

1b06442cc4d4d923c254ec1b9582a14a.png

关注公众号,加小编微信即可拉入线上交流群

文章来源:https://blog.csdn.net/weixin_39873741/article/details/109936841
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://chatgpt.dhexx.cn/article/Mgh613MY.shtml

相关文章

离散分布

离散随机变量只能取有限个离散值&#xff0c;取每个值都对应着发生的概率&#xff0c;随机变量的取值以及取值的概率就构成了随机变量的分布&#xff0c;经典的离散随机变量分布包括伯努利分布&#xff0c;二项分布&#xff0c;泊松分布&#xff0c;几何分布&#xff0c;负二项…

离散分布概率:几何分布、二项分布和泊松分布

离散分布主要包括3个重要的分布&#xff1a;几何分布、二项分布和泊松分布&#xff0c;这里主要介绍下这三种分布解决的典型概率问题&#xff0c;区别和联系。 1. 几何分布&#xff1a; 问题&#xff1a;查德在任意一次滑雪中&#xff08;假定每次滑雪都是独立事件&#xff0…

离散分布总结

目录 离散分布的基础定义 经典离散分布 矩母函数 Moment Generating Function 切比雪夫定理 Tchebysheff’s Theorem 离散分布的基础定义 一个离散变量Y的概率分布可以表示成每个离散概率分布都满足以下两个条件&#xff1a; 对于每个y&#xff0c; &#xff0c;所有y的非…

JS获取日历每个月有多少天

new Date(year, month, 0).getDate()使用 new Date() 创建时间对象时&#xff0c;如果 date 传入 0&#xff0c;就能直接通过 getDate() 获取到最后一天的日期

输入年月判断每月有多少天

/* * Copyright(c)2011,烟台大学计算机学院 * All right reserved. * 文件名称&#xff1a;test.cpp * 作者&#xff1a; 张凯 * 完成日期&#xff1a;2013年10月16日 * 版本号&#xff1a; v1.0 * 输入描述&#xff1a;输入年月 * 问题分析&#xff1a;先判断是闰年还是平年…

java编程三月有几天_3月有多少天

2019-04-19 阴历1993年3月26日到2014年3月26日一共多少天&#xff1f; 亲&#xff0c;1993阴历有2个三月&#xff0c;有闰一个月的&#xff0c;你指的是哪个农历三月啊&#xff1f; 我先给你算第一个三月&#xff0c;如果你是闰月的就自己再减掉一个月 93年阴历3月26日 阳历4月…

本月有多少天

上机内容&#xff1a;编写程序计算某年某月多少天 上机目的&#xff1a;练习使用switch * Copyright (c) 2012, 烟台大学计算机学院 * All rights reserved. * 作 者&#xff1a; 徐本锡 * 完成日期&#xff1a;2012 年 10 月27 日 * 版 本 号&#xff1a;v1.0 * * …

jqery获取每个月天数_jQuery日期选择器-正确计算每个月有多少天

如下图所示,我们有时需要做这样的一个日期选择表单: 相对的难点是如何正确显示2月份的具体天数。通常是28天,闰年是29天。 HTML结构: --- 年 --- 月 --- 日 jQuery代码: function contactFormDate() {if ($(.birthday).length != 0) {/* 填充年份下拉菜单 */ $cur_year = …

java日期输入12月以上,java 编写程序,打印1-12月每个月各有多少天

java 编写程序&#xff0c;打印1-12月每个月各有多少天 关注:134 答案:5 mip版 解决时间 2021-02-05 15:07 提问者预订小鲜肉 2021-02-04 17:41 java 编写程序&#xff0c;打印1-12月每个月各有多少天 最佳答案 二级知识专家琉璃知世 2021-02-04 19:07 通过Calendar 自带的方…

用java计算每月天数_如何自动计算每月天数(快逸免费版)

对于一串有规律的数字&#xff0c;如果靠手动填写就显的机械化。例如&#xff0c;一年有十二个月&#xff0c;一个月有多少天都是有规律的&#xff0c;对于这样的数字我们可以用to函数去实现&#xff0c;但是如果随便输入一个年份&#xff0c;随便输入一个月份&#xff0c;自动…

scipy基础—io

scipy是构建在numpy的基础之上的&#xff0c;它提供了许多的操作numpy的数组的函数。scipy.io包提供了多种功能来解决不同格式的文件的输入和输出。 举个例子&#xff1a; import numpy as np import scipy.io as ioif __name__ __main__:B np.mat([[12], [-2], [10]])x [1…

磁盘IO是什么意思?如何判断服务器硬盘io性能好不好?

IO实际上是计算机用语&#xff0c;也写作I/O&#xff0c;指输入/输出(Input/Output)。硬盘IO就是指对字节的读取速度&#xff0c;即硬盘的读写能力。这里我们只讨论服务器磁盘IO。服务器硬盘IO的性能也是服务器硬件配置中需要考虑的问题。那么如何判断服务器硬盘IO的性能好不好…

【io】io等待为什么引发cpu过高?

磁盘读频繁&#xff0c;数据量大 ---> iowait高 ---> CPU飙升 IO&#xff08;input output&#xff09;主要指&#xff1a;文件IO&#xff0c;网络IO。 “等待IO就绪“究竟等的什么&#xff1f; 你一定不止在一个地方看到类似"cpu等待IO就绪&#xff0c;线程挂起.…

platformIO环境安装

使用Platform IO作为Arduino的交叉编译环境 文章目录 使用Platform IO作为Arduino的交叉编译环境1.1 PlatformIO简介1.2 VScode下安装PlatformIO1.3软件启动界面1.4 软件配置 2. 开发平台和固件安装 最新安装方法请查看我另一篇博文&#xff1a; https://blog.csdn.net/kimiyan…

文件IO、标准IO的区别及其效率

系统IO&#xff1a;Unix/Linux下的系统文件IO&#xff0c;即文件访问机制不经过操作系统内核的缓存&#xff0c;数据直接在磁盘和应用程序地址空间进行传输。 标准IO&#xff1a;带缓存的IO&#xff0c;又称为标准IO(C标准库中提供了标准IO库&#xff0c;即stdio)&#xff0c;…

如何理解 iowait

Linux中&#xff0c;%iowait 过高可能是个问题&#xff0c;严重的时候&#xff0c;它能使服务停止&#xff0c; 但问题是&#xff0c;多高才算高&#xff1f; 什么时候应该担心呢&#xff1f; 本文将讨论 iowait 的含义、相关的统计数据、原理以及 iowait的瓶颈问题 什么是 i…

Mysql的IO介绍及原因详解

有输入输出类型的交互系统都可以认为是I/O系统。 目录 一、IO操作 二、IO成本 三、IO分类 四、Mysql网络层IO&#xff08;网络IO&#xff09; 五、Mysql存储IO&#xff08;磁盘IO&#xff09; 一、IO操作 在计算机系统中I/O就是输入&#xff08;Input&#xff09;和输出(Outp…

IO概念

IO概念和五种IO模型 一、什么是IO&#xff1f; 我们都知道unix世界里、一切皆文件、而文件是什么呢&#xff1f;文件就是一串二进制流而已、不管socket、还是FIFO、管道、终端、对我们来说、一切都是文件、一切都是流、在信息交换的过程中、我们都是对这些流进行数据的收发操…

顺序IO和随机IO

顺序IO和随机IO 什么是顺序IO和随机IO如何解决随机IO造成的性能损失&#xff1f;问题什么是IOPS?机械硬盘和固态硬盘在随机IO上性能的影响因素&#xff1f;SSD作为随机存储设备&#xff0c;其访问任意一块的时间应该是相等的&#xff0c;为什么顺序IO还是快于随机IO? 什么是顺…

绘图工具-draw.io

draw.io是一个可配置的图表/白板可视化应用程序。draw.io 由英国软件公司JGraph Ltd拥有和开发。这是一个开源项目&#xff08;但对贡献是封闭的&#xff09;&#xff0c;github链接&#xff1a;https://github.com/jgraph&#xff0c;可以绘制流程图、UML、类图、组织结构图、…