机器学习基础——损失函数与风险函数

article/2025/10/14 12:36:59

机器学习的目标是从模型的假设空间中选取最优的模型,其具体的策略有经验风险最小化和结构风险最小化。下面简单介绍损失函数和风险函数的相关概念。参考自李航《统计学习方法》。

损失函数

损失函数(loss function)用来预测模型单次预测的好坏,即模型的预测值f(X)和真实值Y之间的差别,记作L(Y,f(x))。损失函数越小,表示模型预测越准确。

机器学习常用的损失函数有:
(1)0-1损失函数
请添加图片描述
(2)平方损失函数
请添加图片描述
(3)绝对损失函数
请添加图片描述
(4)对数损失函数
请添加图片描述

风险函数

风险函数(risk function) 又称 期望损失(expected loss),是损失函数的期望,度量平均意义下模型预测的好坏。机器学习的目标就是选择期望风险最小的模型。

风险函数的表达式为:
请添加图片描述

由于P(X,Y)是未知的,上式风险函数无法计算,而机器学习利用风险函数最小化学习模型本身需要用到联合概率分布P(X,Y),因此监督学习本身就是一个病态问题,上式所表示的风险函数并没法实际用到机器学习当中。这就要用到经验风险结构风险

经验风险

经验风险(empirical risk) 是模型f(X)关于训练数据集的平均损失。其表达式为:
请添加图片描述

根据大数定律,当样本容量N趋于无穷时,经验风险趋于期望风险,因此当训练数据样本足够大时,可以近似用经验风险最小化的策略优化和选择模型。
经验风险最小化(empirical risk minimization,ERM) 策略认为:经验风险最小的模型是最优的模型。

结构风险

当训练数据样本较少时,用经验风险最小化策略常常效果不好,会产生过拟合现象。于是提出了结构风险最小化,也就等价于正则化。结构风险在经验风险上加上表示模型复杂度的正则化项
请添加图片描述

其中,J(f)为模型的复杂度,模型越复杂J(f)就越大。因此,结构风险最小化策略要求经验风险和模型复杂度同时小。


http://chatgpt.dhexx.cn/article/dklb99vr.shtml

相关文章

机器学习基础知识之概率论基础详解

机器学习基础知识之概率论基础详解 文章目录 机器学习基础知识之概率论基础详解引言一、随机事件以及其运算1、样本空间的概念2、随机事件3、随机变量4、事件之间的关系4.1包含关系4.2相等关系4.3互不相容 5、事件间的运算5.1并5.2交5.3差5.4对立事件5.5运算性质 6、事件域 二、…

【机器学习基础】机器学习模型与算法最全分类汇总!

机器学习 Author:louwill Machine Learning Lab 本文总共涉及了26种机器学习模型与算法,几乎涵盖了全部主流的机器学习算法。包括线性回归、逻辑回归、Lasso回归、Ridge回归、线性判别分析、近邻、决策树、感知机、神经网络、支持向量机、AdaBoost、GBDT…

python基础教程免费下载-《Python机器学习基础教程》高清版免费PDF下载

Python机器学习基础教程-[德] 安德里亚斯穆勒(Andreas C.Mller)[美]莎拉吉多(Sarah Guido) 著,张亮(hysic) 译 下载地址1:网盘下载 下载地址2:网盘下载 内容简介 本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中常用的…

机器学习开发框架

目录 目录 1.什么是机器学习开发框架 2.机器学习框架和深度学习框架的关系 3.常见深度学习框架 1.什么是机器学习开发框架 机器学习开发框架本质上是一种编程库或工具,目的是能够让开发人员更容易、更快速地构建机器学习模型。 机器学习开发框架封装了大量的可…

《Python机器学习基础教程》学习记录(一)

开篇 为了提升自己,准备学习《Python机器学习基础教程》作者: [德]安德里亚斯穆勒 / [美]莎拉吉多,译者: 张亮 ;写此博客,用作记录书中的代码,学习心得等。 第一章 1.4.4 matplotlib matplotlib 是Python 主要的科学…

【机器学习基础】9 大主题!机器学习算法理论面试题大汇总

机器学习是一门理论性和实战性都比较强的技术学科。在应聘机器学习相关工作岗位时,我们常常会遇到各种各样的机器学习问题和知识点。 算法理论基础不仅包含基本概念、数学基础,也包含了机器学习、深度学习相关。今天给大家推荐一个不错的算法理论基础面试…

机器学习数学基础

目录 1 线性代数1.1 矩阵定义1.2 矩阵中的概念1.2.1 向量 1.3 矩阵的运算1.4 矩阵的转置1.5 矩阵的逆 2 微积分2.1 导数的定义2.2 偏导数2.3 方向导数2.4 梯度2.5 凸函数和凹函数 3 概率统计3.1 常用统计变量3.1.1 数学期望和大数定律3.1.2 协方差3.1.3 相关系数 3.2 常见概率分…

图解机器学习算法(1) | 机器学习基础知识(机器学习通关指南·完结)

作者:韩信子ShowMeAI教程地址:https://www.showmeai.tech/tutorials/34本文地址:https://www.showmeai.tech/article-detail/185声明:版权所有,转载请联系平台与作者并注明出处 1. 机器学习概述 1)什么是机…

机器学习基础思维导图

机器学习基础思维导图

机器学习基础学习笔记

机器学习基础 一、机器学习概述 机器学习直白来讲,是根据已有的数据,进行算法选择,并基于算法和数据构建模型,最终对未来进行预测;输入一组数据X-Y,想要得到X-Y间的一个目标函数 f 。根据大量历史数据&am…

机器学习入门——机器学习基础概念

引言 本文介绍机器学习的一些基本概念。包括机器学习的主要任务,机器学习的分类等。 下一篇:机器学习入门——numpy与matplotlib的使用简介 用到的数据 鸢尾花(IRIS)是比较常见的在我们学习机器学习时用到的数据。数据来源: http://archive.ics.uci.e…

机器学习的数学基础

一、概述 我们知道,机器学习的特点就是:以计算机为工具和平台,以数据为研究对象,以学习方法为中心;是概率论、线性代数、数值计算、信息论、最优化理论和计算机科学等多个领域的交叉学科。所以本文就先介绍一下机器学…

机器学习基础环境部署 | 机器学习系列

目录 前言 Anaconda安装 使用conda配置python3.6环境 Spyder配置与使用 安装PyTorch 总结 前言 本文主要是分享一下机器学习初期,基本的环境搭建。也适用于其他python工程化项目环境搭建。都差不多。 Anaconda安装 anaconda官方链接:Anaconda | T…

机器学习基础(Machine Learning,ML)

什么是机器学习 机器学习是人工智能的一个子集,目前已经发展出许多有用的方法,比如支持向量机,回归,决策树,随机森林,强化方法,集成学习,深度学习等,一定程度上可以帮助人…

机器学习基础

一、机器学习概述 1.1 人工智能概述 1.人工智能起源? 图灵测试、达特茅斯会议 2.人工智能的3个阶段 1980年代是正式形成期 1990-2010年代是蓬勃发展期 2012年之后是深度学习期 3.人工智能、机器学习和深度学习之间的关系 机器学习是人工智能实现的一个途径; 深度学…

机器学习基础知识

文章目录 概述一、机器学习分类1.1 主要任务1.2 分类方式1.3 监督学习1.3.1 判别式模型1.3.2 生成式模型 1.4 无监督学习1.4.1 聚类1.4.2 降维 1.5 深度学习1.6 强化学习 二、机器学习步骤三、模型评估指标3.1 分类问题3.2 回归问题 四、机器学习预备知识4.1 数学基础4.2 Pytho…

机器学习之基础知识(全)

目录 1.机器学习概述 1.1 人工智能概述 1.1.1 人工智能使用场景 1.1.2 人工智能小案例 1.2 人工智能发展历程 1.2.1 图灵测试 1.2.2 发展历程 1.2.3 小结 1.3 人工智能主要分支 1.3.1 人工智能、机器学习和深度学习 1.3.2 主要分支介绍 1.3.3 人工智能发展必备三要…

C3D Learning Spatiotemporal Features with 3D Convolutional Networks

Learning Spatiotemporal Features with 3D Convolutional Networks Abstract 摘要主要介绍在大规模有监督的视频数据集下训练出了一种简单且高效的三维卷积神经网络的方法来学习时空特征。且此发现具有三重的效果: 1)相比较于二维,三维卷积…

C3D网络笔记

C3D网络 论文链接 论文翻译 该论文发现: 1、3D ConvNets比2D ConvNets更适用于时空特征的学习; 2、对于3D ConvNet而言,在所有层使用333的小卷积核效果最好; 3、我们通过简单的线性分类器学到的特征名为C3D(Convolutional 3D…

《Action Recognition》-Learning Spatiotemporal Features with 3D Convolutional Networks(C3D)

《Action Recognition》-Learning Spatiotemporal Features with 3D Convolutional Networks(C3D) 目录 《Action Recognition》-Learning Spatiotemporal Features with 3D Convolutional Networks(C3D)ContributionsFrameworkResultConclusion Contributions We experimenta…