伯努利分布,二项分布,多项分布

article/2025/9/18 3:57:15

师兄给我说,做机器学习的方法有两种:一种是修改公式的那种,另外一种是类比。我觉得我适合的应该就是类比的这种,公式太难了。。

伯努利分布

记住这种分布的话,就开始想抛硬币,只抛一次硬币。正面朝上的概率是p,反面朝上的概率是q。k=1

二项分布

这种分布也是抛硬币,只不过是抛多次硬币。B(n,p) 也就是这里面总共有两个参数,一个是n,另外一个是p。n是总共抛硬币的总数,p是正面朝上的概率,那个反面朝上的概率就是1-p。

对于抛硬币,我们可以想象两种不同的过程。
第一种过程是我们最终的目的是要估计总体的参数,也就是p,也就是给我很多样本,让我估计这两个值。就相当于是让我抛硬币,抛很多次,记录每一次是正面朝上还是反面朝上,那么我抛的次数越多,最终得到的p的值就准确。
第二种就是高中数学常考的题目,就我们根据常识已经知道抛一次硬币的话,正面朝上的概率是1/2,也就是我们已经知道总体的参数了,然后给我说,我抛8次硬币,2正面朝上的概率是多少。这时候我们可以用概率质量函数来求P(x)=C2 8 (1/2) 2(1-1/2)6 。在这个过程中,我们求的是概率。

上面这两个过程分别是求似然和求概率的过程。第一个过程可以表示成为L(p|A),第二个过程可以表示为P(A|p),这里面的p就是那个总体参数,A就是抛1次,2次,3次……这样的抛硬币的过程。
并且L(p|A)=P(A|p)。

举例
https://www-pnas-org.eproxy.lib.hku.hk/doi/full/10.1073/pnas.1419161111#eq3
https://www.sciencedirect.com/science/article/pii/S0002929720302354
这篇文章中使用了二项分布
在这里只考虑了两种情况
在这里插入图片描述

接下来开启类比模式:
在RNA-seq中,经过测序,我们得到n个reads, 根据上面这两张图,我们把reads分成两类,一类是比对到 exon inclusion isoform 上的reads,另外一类是比对到exon skipping isoform上的reads 。
上面的过程就类比成了抛硬币,总共抛了n次硬币,每一次有两种可能性,比对到exon inclusion isoform上 (正面朝上),比对到exon skipping isoform (反面朝上)。
在科研里面我们都是要求参数,在这里面也就是求p ,也就是抛硬币里面的1/2。因为我们有很多个样本,我们是想根据这些所有的样本得到一个总体的参数。根据这些给出的样本,我们可以计算出来L(p|A),然后再根据最大似然,求出参数p。
接下来我们就看看文章中方法部分的公式:
在这里插入图片描述
在这里面最终要估计的参数是psi, I是能够比对到exon inclusion isoform上的count数,S是能够比对到exon exclusion isoform上的count数。p是来自exon inclusion isoform的reads的比例。
把上面的话用硬币的方式来表示应该就是 : 在给定p的情况下,总共抛了n次硬币,正面朝上的概率是多少。然后这个p指的就是正面朝上的概率,它对应的应该就是这个reads 比对到exon inclusion isoform的比例。 n是总共的reads数,通过样本,我们可以得到p,但是我们的目的是求psi,也就是isoform 1 /(isoform1 +isoform2) .。 p和psi 之间的关系可以通过f(PSI) 这个函数表示出来。在其中加入两种isoform 的effect length。

多项分布

多项分布可以看成是掷色子,可能出现的结果有多个。每一次掷色子是离散随机变量。

举个例子
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-021-02461-5#Sec8
理解了二项分布的过程,多项分布就很容易了。
在这里插入图片描述
在这里把reads比对到isoform的过程分成了三种类型,第一种就是直接比对到isoform1上的,第二种是比对到isoform2上的,第三种是ambiguous reads 。
在这里插入图片描述
在这里我们可以根据多个样本计算出每一个细胞,每一个基因的ψ值,因为每一个reads属于哪一个isoform服从多项分布。ρ是每一种类型的reads占总数的reads的比例,然后ρ和psi的关系用公式1来表示。

二项混合模型

混合模型是基于单个模型,有多个components 。
举个例子
https://www.nature.com/articles/s41467-022-28845-0#Sec2
未完待续


http://chatgpt.dhexx.cn/article/oFGiFkt4.shtml

相关文章

伯努利分布,二项分布和泊松分布以及最大似然之间的关系(未完成)

首先说伯努利试验 伯努利分布 伯努利试验说的是下面一种事件情况:在生活中,有一些事件的发生只有两种可能,发生或者不发生(或者叫成功或者失败),这些事件都可以被称为伯努利试验。 伯努利试验的概率分布称…

多元伯努利分布 multivariate bernoulli distribution

今天看论文发现了一个名次,多元伯努利分布,百度好久也没查到明确的定义,去google了一下,发现其实就是 基本概统里的一次伯努利试验推广到多次试验后的结果分布,如下图: 引用来源: https://www…

MATLAB生成伯努利图分布,C++ - 随机生成器 伯努利分布(bernoulli distribution) 的 详解 及 代码...

随机生成器 伯努利分布(bernoulli distribution) 的 详解 及 代码 本文地址: http://blog.csdn.net/caroline_wendy/article/details/17335871 伯努利分布(bernoulli distribution), 是判断某件事情发生或者未发生的概率; 给定参数p, 可以修改概率的值, 发生概率(true)是p,未发…

基于python/scipy学习概率统计(2):伯努利分布(Bernoulli Distribution)

目录 1. 概念 2. 概率分布 2.1 概率质量函数 2.2 概率分布函数 2.3 生存函数,风险函数 2.4 百分点函数 3. 常用统计特征 3.1 均值,Mean 3.2 中位数,Median 3.3 众数,Mode 3.4 方差,Variance 3.5 偏度&#…

matlab伯努利分布,常用的概率分布:伯努利分布、二项式分布、多项式分布、先验概率,后验概率...

一,伯努利分布(bernouli distribution) 又叫做0-1分布,指一次随机试验,结果只有两种。也就是一个随机变量的取值只有0和1。记为: 0-1分布 或B(1,p),其中 p 表示一次伯努利实验中结果为正或为1的概率。 概率计算: P(X0)…

伯努利分布(一种离散分布)

伯努利分布(0-1分布) 笔记来源:Introduction to the Bernoulli Distribution 伯努利分布(1次试验)是二项分布(n次试验)的特例,其中进行了一次实验( n 1 n1 n1&#xff…

伯努利分布(Bernoulli distribution)

伯努利分布 是一种离散分布,有两种可能的结果。1表示成功&#xff0c;出现的概率为p(其中0<p<1)。0表示失败&#xff0c;出现的概率为q1-p。这种分布在人工智能里很有用&#xff0c;比如你问机器今天某飞机是否起飞了&#xff0c;它的回复就是Yes或No&#xff0c;非常明确…

伯努利分布、二项分布、多项分布、Beta分布、Dirichlet分布

https://blog.csdn.net/michael_r_chang/article/details/39188321 https://www.cnblogs.com/wybang/p/3206719.html https://blog.csdn.net/jteng/article/details/60334628 1. 伯努利分布 伯努利分布(Bernoulli distribution)又名两点分布或0-1分布&#xff0c;介绍伯努利分…

【愚公系列】2022年09月 微信小程序-自定义tabBar的实现

文章目录 前言一、自定义tabBar的实现1.全局配置2.主页面3.CustomTabBar组件4.效果 前言 小程序自带的tabBar可以参考这篇文章&#xff1a;https://codeboy.blog.csdn.net/article/details/123040278 因为小程序自带的tabBar&#xff0c;比较单一&#xff0c;无法满足多样化需…

[cryptoverse ctf 2022] cvctf

一直在等wp&#xff0c;一直没找着&#xff0c;没有wp就没有进步。 把已知部分写出来吧&#xff0c;抛砖引玉 这个比赛只有crypto,reverse和misc(除一个签到外&#xff0c;都推特油管和谷歌网盘的题作不了) 目录 crypto Warmup 3 Warmup 1 Warmup 2 Substitution RSA 1…

Python | NumPy | 3D 数据可视化 - 散点图

本文介绍如何使用NumPy相关的数据实现数据的3D散点图可视化。 Updated: 2022 / 03 / 06 Python | NumPy | 3D 数据可视化 - 散点图 数据导入及清洗导入清洗获取全部坐标筛选特定坐标 数据3D可视化散点图单图多子图 参考链接 数据导入及清洗 先导入坐标集数据&#xff0c;再进行…

使用 Learner Lab - 使用 API Gateway 与 Lambda 上传图片到 S3

使用 Learner Lab - 使用 API Gateway 与 Lambda 上传图片到 S3 AWS Academy Learner Lab 是提供一个帐号让学生可以自行使用 AWS 的服务&#xff0c;让学生可以在 100 USD的金额下&#xff0c;自行练习所要使用的 AWS 服务&#xff0c;如何进入 Learner Lab 请参考 使用 Lear…

12306查询车票(爬虫小练_1)

文章目录 导入模块导入City.json文件内容分析撸代码city.json文件 导入模块 # 数据请求模块 import requests # 序列化和反序列化 import json # 表格格式输出&#xff08;美化输出&#xff09; import prettytable as pt 导入City.json文件 里面存放的是城市的对应标识(放在文…

K8S+Jenkins+Harbor+Docker+gitlab集群部署

K8SJenkinsHarborDockergitlab服务器集群部署 所需资源下载地址 将此文章写给我最心爱的女孩 目录 K8SJenkinsHarborDockergitlab服务器集群部署1.准备以下服务器2.所有服务器统一处理执行2.1 关闭防火墙2.2 关闭selinux2.3 关闭swap&#xff08;k8s禁止虚拟内存以提高性能&a…

多项式运算

多项式求逆 已知 f ( x ) f(x) f(x)&#xff0c;求 g ( x ) g(x) g(x)满足 f ( x ) g ( x ) ≡ 1 ( m o d x n ) f(x)g(x)\equiv 1\pmod{x^n} f(x)g(x)≡1(modxn)。 若 f 0 0 f_00 f0​0&#xff0c;那么显然不可能存在形式幂级数 g ( x ) g(x) g(x)满足条件。于是假定 f 0 …

Beyond Accuracy:Behavioral Testing of NLP Models with Checklist 论文阅读

本文主要介绍以及翻译一篇ACL2020 Best Paper Beyond Accuracy:Behavioral Testing of NLP Models with Checklist Abstract 尽管传统评估模型好坏的方法是在测试集上观察accuracy指标&#xff0c;然而这个指标常常高估了NLP模型的真实表现&#xff0c;而另外一些评估模型的方法…

国密 SM4 高并发服务 加压测服务 加生成秘钥 结合上篇一起使用 国密 SM2 SM3 SM4 后续升级版本,内容丰富单独写一篇百万压测4000毫秒加解密

介绍 这篇是专门适用于高并发场景的加解密功能服务&#xff0c;提供了并发代码 &#xff0c;压测代码 以及压测报告结合上篇文章一起使用最好&#xff0c;先看上篇在看这篇&#xff0c;循序渐进&#xff0c;上篇主要看SM4 方面即可其他概要观看即可&#xff0c;有需要可以看看也…

创建dependencies.gradle文件报错

创建AS项目统一管理build.gradle但是报错 1.Only Project and Settings build scripts can contain plugins {} blocks 大概意思&#xff0c;是使用plugins目前还不能在自己创建的gradle文件中使用所以还是需要使用apply plugin 2.dependencies.gradle No signature of method…

JCE cannot authenticate the provider BC

我是用hutool做RSA加密时候出现这个问题的&#xff0c;具体原因网上各说各的&#xff0c;解决办法也试过下载jar、配置jvm&#xff0c;用是能用&#xff0c;但是我们是在公共包写的&#xff0c;部署新服务的时候就麻烦了。 看了下hutool报错的地方&#xff0c;顺着找了找&#…

JDK8安装JCE无限强度

原文&#xff1a;https://www.jianshu.com/p/de81059a9e97 https://blog.csdn.net/arctan90/article/details/68066660 报错提示&#xff1a; Exception in thread "main" org.jasypt.exceptions.EncryptionOperationNotPossibleException: 下载jar&#xff1a;h…