机器学习数学基础

article/2025/10/14 12:37:00

目录

  • 1 线性代数
    • 1.1 矩阵定义
    • 1.2 矩阵中的概念
      • 1.2.1 向量
    • 1.3 矩阵的运算
    • 1.4 矩阵的转置
    • 1.5 矩阵的逆
  • 2 微积分
    • 2.1 导数的定义
    • 2.2 偏导数
    • 2.3 方向导数
    • 2.4 梯度
    • 2.5 凸函数和凹函数
  • 3 概率统计
    • 3.1 常用统计变量
      • 3.1.1 数学期望和大数定律
      • 3.1.2 协方差
      • 3.1.3 相关系数
    • 3.2 常见概率分布
    • 3.3 重要概率公式


1 线性代数

导语:这些只是很基础的大学数学课本中的知识,如果考研的话,似乎看完这些也只是个知识点回顾,对做题并没有什么帮助.但是对于机器学习这些知识是必知必会的,要不然容易遇到看不懂!

1.1 矩阵定义

img

由 m × n 个数 aij (i = 1,2,…,m; j = 1,2,…,n) 排成的 m 行 n 列的数表 A 就称为 m 行 n 列的矩阵

这 m × n 个数称作矩阵 A 的元素,元素 aij 位于矩阵 A 的第 i 行第 j 列

m × n 矩阵 A 可以记作 Am×n,其中 m是行数,n是列数,m, n > 0

对于Am×n,如果 m = n,即矩阵的行数与列数相等,那么称A为方阵

1.2 矩阵中的概念

img

1.2.1 向量

在这里插入图片描述
有些时候看到向量是横着写,有时候是竖着写,其实列向量横着写然后加转置符号,其实就是和竖着写一摸一样,之所以要横着写是为了有些出版社和作者为了节省纸张与空间,横着写加转置多么节省空间,这个其中并没有什么规定非要横着写或者竖着写.

img

img

1.3 矩阵的运算

如果是同型矩阵或者是同行同列的就可以进行加减,就是对应的每个元素加减
在这里插入图片描述

img

注意:A × B,那么有 A 矩阵 m × n,B 矩阵 n × k,要求左侧矩阵的列数 n,必须等于右侧矩阵的行数 n,结果矩阵 C 为 m × k 矩阵。

img
img

1.4 矩阵的转置

img

1.5 矩阵的逆

img
补充一下:矩阵的秩A=(aij)m×n的不为零的子式的最大阶数称为矩阵A的秩,记作rA,或rankA或R(A)。特别规定零矩阵的秩为零。r(A)<=min(m,n),A是m*n型矩阵,也就是最小的内个数是矩阵的秩.

2 微积分

2.1 导数的定义

在这里插入图片描述
如果是一阶导数y=kx那么导数就是k,导数就是斜率
img

2.2 偏导数

img
在这里插入图片描述

2.3 方向导数

一个函数沿着指定方向的变化率
img

2.4 梯度

梯度就是方向取得导数的最大值,下降最快的一点
在这里插入图片描述

img

2.5 凸函数和凹函数

在这里插入图片描述

3 概率统计

3.1 常用统计变量

方差和标准差就是一种离散程度,离散程度越大说明数据的差值距离均值越大,方差越小说明数值越稳定.

在这里插入图片描述
均方误差(MSE)和均方根误差(RMSE)和平均绝对误差(MAE)
均方根误差,亦称标准误差

RMSE
Root Mean Square Error,均方根误差
是观测值与真值偏差的平方和与观测次数m比值的平方根。
是用来衡量观测值同真值之间的偏差

MAE
Mean Absolute Error ,平均绝对误差
是绝对误差的平均值
能更好地反映预测值误差的实际情况.

标准差
Standard Deviation ,标准差
是方差的算数平方根
是用来衡量一组数自身的离散程度

在这里插入图片描述

简单来说,标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。

3.1.1 数学期望和大数定律

在这里插入图片描述
大数定律就是我们从统计学中推测真相的理论基础。

大数定律说如果统计数据足够大,那么事物出现的频率就能无限接近它的期望值。

也就是如果某城市增长到100万人口那么每个家庭中的孩子也就逼近于某个数.
可能不好理解

拿我们最熟悉的投色子举例,游戏规则是投中1点获得1元,投中2点获得2元,以此类推。
在这里插入图片描述
这个期望3.5代表什么意思呢?不是最后能拿到3.5元

而是,只要你一直玩下去,你每次游戏的预期收益是3.5元。可能你某次赢了1元,某一次赢了6元,只要你长期投下去, 你平均下来每次就赢3.5元。

3.1.2 协方差

在这里插入图片描述
XY随机变量的相关性统计

协方差(Covariance)在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

概念比较难以理解简单的说:

在这里插入图片描述
补充说下:如果是0,也就没啥相关性

在这里插入图片描述

3.1.3 相关系数

在这里插入图片描述

弥补XY的相似程度的计算,就可以更清晰的得到相关性.

3.2 常见概率分布

img
正态分布:哔哩哔哩数学大叔
在这里插入图片描述

3.3 重要概率公式

img


http://chatgpt.dhexx.cn/article/aqiCxQtZ.shtml

相关文章

图解机器学习算法(1) | 机器学习基础知识(机器学习通关指南·完结)

作者&#xff1a;韩信子ShowMeAI教程地址&#xff1a;https://www.showmeai.tech/tutorials/34本文地址&#xff1a;https://www.showmeai.tech/article-detail/185声明&#xff1a;版权所有&#xff0c;转载请联系平台与作者并注明出处 1. 机器学习概述 1&#xff09;什么是机…

机器学习基础思维导图

机器学习基础思维导图

机器学习基础学习笔记

机器学习基础 一、机器学习概述 机器学习直白来讲&#xff0c;是根据已有的数据&#xff0c;进行算法选择&#xff0c;并基于算法和数据构建模型&#xff0c;最终对未来进行预测&#xff1b;输入一组数据X-Y&#xff0c;想要得到X-Y间的一个目标函数 f 。根据大量历史数据&am…

机器学习入门——机器学习基础概念

引言 本文介绍机器学习的一些基本概念。包括机器学习的主要任务&#xff0c;机器学习的分类等。 下一篇&#xff1a;机器学习入门——numpy与matplotlib的使用简介 用到的数据 鸢尾花(IRIS)是比较常见的在我们学习机器学习时用到的数据。数据来源: http://archive.ics.uci.e…

机器学习的数学基础

一、概述 我们知道&#xff0c;机器学习的特点就是&#xff1a;以计算机为工具和平台&#xff0c;以数据为研究对象&#xff0c;以学习方法为中心&#xff1b;是概率论、线性代数、数值计算、信息论、最优化理论和计算机科学等多个领域的交叉学科。所以本文就先介绍一下机器学…

机器学习基础环境部署 | 机器学习系列

目录 前言 Anaconda安装 使用conda配置python3.6环境 Spyder配置与使用 安装PyTorch 总结 前言 本文主要是分享一下机器学习初期&#xff0c;基本的环境搭建。也适用于其他python工程化项目环境搭建。都差不多。 Anaconda安装 anaconda官方链接&#xff1a;Anaconda | T…

机器学习基础(Machine Learning,ML)

什么是机器学习 机器学习是人工智能的一个子集&#xff0c;目前已经发展出许多有用的方法&#xff0c;比如支持向量机&#xff0c;回归&#xff0c;决策树&#xff0c;随机森林&#xff0c;强化方法&#xff0c;集成学习&#xff0c;深度学习等&#xff0c;一定程度上可以帮助人…

机器学习基础

一、机器学习概述 1.1 人工智能概述 1.人工智能起源&#xff1f; 图灵测试、达特茅斯会议 2.人工智能的3个阶段 1980年代是正式形成期 1990-2010年代是蓬勃发展期 2012年之后是深度学习期 3.人工智能、机器学习和深度学习之间的关系 机器学习是人工智能实现的一个途径; 深度学…

机器学习基础知识

文章目录 概述一、机器学习分类1.1 主要任务1.2 分类方式1.3 监督学习1.3.1 判别式模型1.3.2 生成式模型 1.4 无监督学习1.4.1 聚类1.4.2 降维 1.5 深度学习1.6 强化学习 二、机器学习步骤三、模型评估指标3.1 分类问题3.2 回归问题 四、机器学习预备知识4.1 数学基础4.2 Pytho…

机器学习之基础知识(全)

目录 1.机器学习概述 1.1 人工智能概述 1.1.1 人工智能使用场景 1.1.2 人工智能小案例 1.2 人工智能发展历程 1.2.1 图灵测试 1.2.2 发展历程 1.2.3 小结 1.3 人工智能主要分支 1.3.1 人工智能、机器学习和深度学习 1.3.2 主要分支介绍 1.3.3 人工智能发展必备三要…

C3D Learning Spatiotemporal Features with 3D Convolutional Networks

Learning Spatiotemporal Features with 3D Convolutional Networks Abstract 摘要主要介绍在大规模有监督的视频数据集下训练出了一种简单且高效的三维卷积神经网络的方法来学习时空特征。且此发现具有三重的效果&#xff1a; 1&#xff09;相比较于二维&#xff0c;三维卷积…

C3D网络笔记

C3D网络 论文链接 论文翻译 该论文发现&#xff1a; 1、3D ConvNets比2D ConvNets更适用于时空特征的学习&#xff1b; 2、对于3D ConvNet而言&#xff0c;在所有层使用333的小卷积核效果最好&#xff1b; 3、我们通过简单的线性分类器学到的特征名为C3D(Convolutional 3D…

《Action Recognition》-Learning Spatiotemporal Features with 3D Convolutional Networks(C3D)

《Action Recognition》-Learning Spatiotemporal Features with 3D Convolutional Networks(C3D) 目录 《Action Recognition》-Learning Spatiotemporal Features with 3D Convolutional Networks(C3D)ContributionsFrameworkResultConclusion Contributions We experimenta…

使用C3D的一些问题(2)

使用C3D的resume功能时&#xff0c;报错RuntimeError: expected device cpu but got device cuda:0 报错位置在optimizer.step()。原因是optimizer加载参数时,tensor默认在CPU上&#xff0c;故需将所有的tensor都放到GPU上。 解决方案&#xff1a; 在这一段代码后面加入 for st…

3D卷积入门 | 多论文笔记 | R2D C3D P3D MCx R(2+1)D

文章转自微信公众号&#xff1a;【机器学习炼丹术】。有问题或者需要加入粉丝交流群可以私信作者~ 文章目录 0 前言1 R2D2 C3D2.1 R3D 3 P3D4 MCx5 R(21)D 【前前沿】&#xff1a;某一次和粉丝交流的时候&#xff0c;收获一句话&#xff1a; 人点亮技能书&#xff0c;不是一次…

基于pytorch实现的视频分类——C3D模型论文复现

最近在学习视频分类任务&#xff0c;想要跑通一个更换数据集用到自己的课题上。 看到了这篇文章及代码 论文链接&#xff1a;http://vlg.cs.dartmouth.edu/c3d/c3d_video.pdf 代码链接&#xff1a;https://github.com/jfzhang95/pytorch-video-recognition 贴一下学习这个代…

我的一些视觉工具(1)之动作预测--逐行详解C3D代码(Pytorch)

该博客主要参考这个工程提供的代码 我们在他们代码的基础之上进行魔改 当然了&#xff0c;既然要魔改人家的数据&#xff0c;肯定要先把人家的思路看明白。 对于3D神经网络来讲&#xff0c;好多小伙伴最关心的肯定还是数据的喂入方法和数据集的格式喽。 下第一个部分就是详细第…

C3D-network论文笔记

前几天一直在看Faster-Rcnn源码和YOLOv3&#xff08;C语言&#xff09;源码&#xff0c;感觉时间浪费了不少&#xff0c;但是一个都没有看懂&#xff0c;总结出一句话就是&#xff1a;这TM写的是个啥&#xff1f;我为啥一个都看不懂&#xff0c;原理理解是一回事&#xff0c;看…

c3d代码

##c3d代码 原文链接&#xff1a;https://blog.csdn.net/ZJRN1027/article/details/80199248 cross_entropy_mean tf.reduce_mean( tf.nn.sparse_softmax_cross_entropy_with_logits(labelslabels,logitslogit) ) tf.summary.scalar( name_scope ‘_cross_entropy’, cross_en…

【C3D代码运行步骤】

1. 克隆或者下载项目 方法一&#xff1a;在github上直接下载项目&#xff1a;项目地址 方法二&#xff1a;使用git克隆&#xff08;推荐&#xff09;,相关内容参考Git的安装及github远程仓库ssh连接 git clone https://github.com/Niki173/C3D.git https://github.com/jfzhan…