朴素贝叶斯基本原理和预测过程、先验概率、后验概率、似然概率概念

article/2025/9/8 1:49:31

贝叶斯原理是英国数学家托马斯·贝叶斯提出的。

贝叶斯原理

建立在主观判断的基础上:在我们不了解所有客观事实的情况下,同样可以先估计一个值,然后根据实际结果不断进行修正。

举例:

一个袋子里有10个球,其中6个黑球,4个白球;那么随机抓一个黑球的概率是0.6!(已知黑球白球数量—了解事情再判断

如果我们事先不知道袋子里面黑球和白球的比例,而是通过我们摸出来的球的颜色,能判断出袋子里面黑白球的比例么?(未知事情全貌—还能判断吗?

三个概率:

  • 先验概率:通过经验来判断事情发生的概率。一般都是单独事件概率,如 P ( x ) 、 P ( y ) P(x)、P(y) P(x)P(y)
  • 后验概率:发生结果A之后,推测原因B的概率 P ( B ∣ A ) P(B|A) P(BA)
  • 条件概率:事件 A 在另外一个事件 B 已经发生条件下的发生概率,表示为 P ( A ∣ B ) P(A|B) P(AB)
P(y|x) 是后验概率,一般是我们求解的目标。P(x|y) 是条件概率,又叫似然概率,一般是通过历史数据统计得到。一般不把它叫做先验概率,但从定义上也符合先验定义。P(y) 是先验概率,一般都是人主观给出的。贝叶斯中的先验概率一般特指它。P(x) 其实也是先验概率,只是在贝叶斯的很多应用中不重要(因为只要最大后验不求绝对值),需要时往往用全概率公式计算得到。
  • 贝叶斯原理就是求解后验概率

  • 贝叶斯公式
    P ( y ∣ x ) = P ( x ∣ y ) ∗ P ( y ) P ( x ) P(y|x) = \frac{P(x|y) * P(y) }{P(x)} P(yx)=P(x)P(xy)P(y)

似然函数(likelihood function):

把概率模型的训练过程理解为求参数估计的过程。似然在这里就是可能性的意思,它是关于统计参数的函数

最大似然理论

  • 认为P(x|y)最大的类别y,就是当前文档所属类别。
  • M a x P ( x ∣ y ) = M a x { p ( x 1 ∣ y ) ∗ p ( x 2 ∣ y ) ∗ . . . p ( x n ∣ y ) } Max P(x|y) = Max\{ p(x1|y)*p(x2|y)*...p(xn|y)\} MaxP(xy)=Max{p(x1y)p(x2y)...p(xny)} for all y

贝叶斯理论:
在这里插入图片描述

  • 认为需要增加先验概率p(y),因为有可能某个y是很稀有的类别几千年才看见一次,即使P(x|y)很高,也很可能不是它。

  • 所以 y = M a x P ( x ∣ y ) ∗ P ( y ) y = Max P(x|y) * P(y) y=MaxP(xy)P(y), 其中p(y)一般是数据集里统计出来的。

朴素贝叶斯

假设每个输入变量是独立的

朴素贝叶斯模型由两种类型的概率组成:

  1. 每个类别的概率P(Cj);
  2. 每个属性的条件概率P(Ai|Cj)。

训练朴素贝叶斯模型,我们需要先给出训练数据,以及这些数据对应的分类
在这里插入图片描述
对于所有类别来说P(x)相同,则:
在这里插入图片描述

贝叶斯原理、贝叶斯分类和朴素贝叶斯区别

  • 贝叶斯原理是最大的概念,它解决了概率论中“逆向概率”的问题
  • 在这个理论基础上,人们设计出了贝叶斯分类器
  • 朴素贝叶斯分类是贝叶斯分类器中的一种,也是最简单,最常用的分类器。(朴素贝叶斯之所以朴素是因为它假设属性是相互独立的)

朴素贝叶斯预测过程

朴素贝叶斯分类常用于文本分类,尤其是对于英文等语言来说,分类效果很好。它常用于垃圾文本过滤、情感预测、推荐系统等。

第一阶段:准备阶段

  • 需要确定特征属性
  • 并对每个特征属性进行适当划分,然后由人工对一部分数据进行分类,形成训练样本。

(分类器的质量很大程度上由特征属性、特征属性划分及训练样本质量决定。)

第二阶段:训练阶段

  • 生成分类器
  • 主要工作是计算每个类别在训练样本中的出现频率每个特征属性划分对每个类别的条件概率

第三阶段:应用阶段

  • 使用分类器对新数据进行分类。
  • 输入是分类器和新数据,输出是新数据的分类结果。

贝叶斯算法的优缺点

优点:

  1. 朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率
  2. 小规模的数据表现很好,能个处理多分类任务,适合增量式训练,尤其是数据量超出内存时,我们可以一批批的去增量训练。
  3. 缺失数据不太敏感算法也比较简单,常用于文本分类。

缺点:

  1. 理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为朴素贝叶斯模型给定输出类别的情况下,假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时,分类效果不好。而在属性相关性较小时,朴素贝叶斯性能最为良好。对于这一点,有半朴素贝叶斯之类的算法通过考虑部分关联性适度改进。
  2. 需要知道先验概率,且先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳。
  3. 由于我们是通过先验和数据来决定后验的概率从而决定分类,所以分类决策存在一定的错误率。
  4. 输入数据的表达形式很敏感

http://chatgpt.dhexx.cn/article/51STp67E.shtml

相关文章

先验概率与后验概率浅析

#先验概率和后验概率 先验(Apriori;又译:先天)在拉丁文中指“来自先前的东西”,或稍稍引申指“在经验之前”。近代西方传统中,认为先验指无需经验或先于经验获得的知识。它通常与后验知识相比较&#xff0c…

先验概率、似然函数与后验概率

先验概率、似然函数与后验概率 先验概率 Prior probability 在贝叶斯统计中,先验概率分布,即关于某个变量 p 的概率分布,是在获得某些信息或者依据前,对 p 的不确定性进行猜测。例如, p 可以是抢火车票开始时&#x…

先验概率and后验概率

from: https://blog.csdn.net/yangang908/article/details/62215209 and : https://my.oschina.net/xiaoluobutou/blog/688245 先验概率: 事件发生前的预判概率。可以是基于历史数据的统计,可以由背景常识得出,也可以是人的主观观点给出。…

先验概率、后验概率、条件概率等

概率定义 先验概率:事件发生前的预判概率。可以是基于历史数据的统计,可以由背景常识得出,也可以是人的主观观点给出。一般都是单独事件概率,如P(x),P(y)。后验概率:事件发生后求的反向条件概率;或者说&am…

机器学习34:贝叶斯先验概率

机器学习34:贝叶斯先验概率: 理解贝叶斯先验概率是为了更好的理解正则化的概念。 (1)贝叶斯先验概率和贝叶斯后验概率: 1.先验概率是指根据以往经验和分析得到的概率,即在事情发生之前事情发生的概率。它往往作为"由因求果&…

先验概率、后验概率、贝叶斯公式_学习笔记

先验概率(prior probability): 先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现的概率。 在贝叶斯统计推断中,不确定数量的先验概率…

先验概率VS后验概率

先验概率P(A) 先验概率,在贝叶斯统计推断中,是一个事件在收集新数据之前的概率。在进行实验之前,这是基于现有知识对结果概率进行的最佳合理评估。 随着新数据或信息的出现,事件发生的先验概率将被修正,以产生对潜在…

五分钟了解先验概率和后验概率

五分钟了解先验概率和后验概率 本文摘自我的公众号【车子的心智探索】 欢迎关注我! 不理解先验概率和后验概率?莫慌,本文可以帮你。 从面积的角度看概率 在说正题之前,咱们从面积的角度认识一下概率。 拿掷骰子来说&#xff0…

先验概率、后验概率和似然概率

老是容易把先验概率,后验概率,似然概率混淆,所以下面记录下来以备日后查阅。区分他们最基本的方法就是看定义,定义取自维基百科和百度百科: 先验概率 百度百科定义:先验概率(prior probability)是指根据以往经验和分析…

2018 之后,Android 工程师将何去何从?

热文导读 | 点击标题阅读 欢迎加入Java和Android架构知识星球 阿里资深无线开发专家给程序员职业发展的几点建议 架构面试进阶大揭秘:5月份优秀文章精选推荐,值得推荐 作者:hamberluo链接:https://juejin.im/post/5af296226fb9a07…

Android开发12年高级工程师-作为-IT-行业的过来人,我想对你们说~

如果工作安排不清晰,请主动与上司沟通,明确关键的时间点和交付物。沟通前自己要有预案。>>(没有上司喜欢不带着脑子跑来问问问的下属的)如果完成工作需要其他资源,先尽力协调,再向上司求助&#xff0…

2019 Android开发工程师面经

文章目录 1. Java基础1.1 什么是乐观锁?1.2 volatile关键字1.3 hashmap 原理,红黑树是什么?1.4 jvm内存分配1.5 String,StringBuffer,StringBuilder 区别 2. 安卓基础2.1 安卓各版本大变化(Android 6.0到10.0有哪些大点变化),兼容适配2.2 热修复原理2.3 MVC,MVP,MVVM2.4 组件…

一个高薪的Android开发工程师需要具备什么能力?

前言 任何工作,任何行业想要拿到高薪都需要这几点条件,时间,技术,关系。 时间,无非就是在这个行业摸爬滚打很久有自己一套赚钱的方法; 关系,说白了就是家中有人帮忙铺路; 技术&a…

走心的中级Android工程师跳槽经验分享

这些经验是我最近四个月,从准备面试到找到合适工作的汗水和泪水,希望对你们能有帮助! define 跳槽跳槽前要思考的问题 钱不到位怎么办心委屈怎么办离职前的思考确定要走时需要做的准备行情怎么样 安卓跳槽需要复习的知识 基础知识进阶知识不…

寒冬已至?四面楚歌的Android工程师该何去何从

本文首发于 刘望舒的博客 地址:http://liuwangshu.cn/life/android-wheretogo.html 寒冬真的来了吗?可能是吧,因为最近几年每年都说是寒冬,说的真的叫人焦虑。不过互联网的整体环境确实不如前几年,即使不说我想大家也能…

如何成为一名合格的Android工程师?

首先需要申明的是,我并不是一名合格的Android工程师,无论从开发经验或者是技术水平上来说,我都没有资质承担以为Android工程师的责任,但是我把它作为一个目标,也一如既往的努力着。如果我的论点有不准确的,…

android工程师找工作都需要什么要求呢

不同的Android工程师的技术水平都有一定的差距,所在找工作的时候公司会对不同能力的Android工程师的岗位也会区分开来,分别是初级Android工程师,中级Android工程师,高级Android工程师三种,不同级别的Android工程师岗位…

面试复习——Android工程师之Android面试大纲

Activity面试题 1、Activity是什么 Activity是四大组件之一,它提供一个界面让用户点击和各种滑动操作,这就是Activity 2、Activity四种状态 runingpausedstoppedkilled 3、Activity生命周期 onCreate()onStart()onResume()onPause()onStop()onDestr…

如何通过自学成为一名 Android 应用开发工程师?

作者:陈昱全 链接:https://www.zhihu.com/question/21565227/answer/142800222 来源:知乎 1、初级之路 1.1 项目引路 对于自学的人来说,在边做边学的过程中是最容易起步的了。我的技术之路也是这样开始的,当年参加创…

如何成为一名合格的Android开发工程师——技能篇

前言 前段时间,一位计算机专业大四即将毕业的同学关注了我的公众号,然后问了我一系列的问题,表达出他对未来的迷茫: 我是一个二本科班的应届生,今年毕业,想知道需要掌握什么样的安卓技能才能参加工作&…