算法工程师知识补充 - 机器学习1

article/2025/10/31 8:25:45

书籍及视频:周志华 机器学习

公式推导:github地址

代码讲解:机器学习实战

第1章 绪论

相关术语:数据、算法、模型、预测(测试样本、泛化能力)

模型:有监督学习(分类、回归)、无监督学习(聚类)

第2章 模型评估与选择

怎样去评估和选择模型,分为几种不同的情况

1.一种训练集一种算法

(1)经验误差与过拟合

样本个数m、输入x、期望输出y、实际输出y’、错误个数a

错误率error rate: E = a/m

accuracy精度:1-E

error误差:|y-y‘|

(2)评估方法(测试泛化能力)

训练集

测试集:留出法、交叉验证法、自助法

验证集(调参)

(3)性能度量  公式

均方误差MSE(wi:一定的权重)

 错误率与精度(E与1-E)

 查准率P

 查全率R

 有时候查准率并不有效,所以需要查全率

查准率P与查全率R是反向关系,可以看P-R反向关系图

关于阈值确定,可以看P-R反向关系图,使用平衡点、F1度量(加权)、Fbeta(P和R的加权调和平均)

多分类任务:直接支持多分类的算法、分解成多个二分类问题(度量时的P、R、F1)

 2.一种训练多种算法

/1 PR曲线

比较多个模型,可以先看面积

无法比较可以再看F1、Fbeta

/2 ROC曲线  AUC曲线

ROC曲线越饱满越好

AUC = 1  -  rank loss

3.多种训练集一种算法

 /1  代价敏感函数的错误率计算 = 1/m(圈2 *cost01+圈3 *cost10)

/2  代价曲线  

x轴  p  不断变化

y轴 想要总代价(损失期望)最小

4.比较检验(大量的概率论知识)

测试集的泛化  不等于  实际泛化

所以要进行检验

( 建议刷视频,本文只是提纲)


http://chatgpt.dhexx.cn/article/h895IL7e.shtml

相关文章

2018年机器学习算法工程师——秋招自我总结

2018年机器学习算法工程师——秋招自我总结 (2018.3.12 ~ 2018.10.14) (1)简历 - 笔试 - 面试(一面,二面,……,HR面,加面) - offer - 签约 - 入职&#xff0…

【算法工程师】机器学习面试问题总结

哎呀,要秋招了啊~ 不禁感叹:How time flys~ 重新出发~ 后期我发现还是需要把相关文章的链接放上来的,方便大家深入理解记忆,如果你没时间就直接看文字,如果有时间记得把链接点开看看…

机器学习算法工程师面试总结(基于个人简历自用)

机器学习 回归和分类的相同点和不同点? 相同点:都是对输入做预测,属于有监督学习。 不同点:输出不同、目的不同、结果不同。 分类的输出是离散的、是所属类别、是定性的,回归的输出是连续的、是值、是定量的。 分类的目…

机器学习算法工程师面试问题汇总(持续更新)

目录 一、通用基础知识 1.1ReLU与Leaky ReLU 1.2损失函数 1.3怎么去选择损失函数呢? 1.4Focal loss及其优缺点 1.5特征归一化/标准化的意义 1.5Batch Normalization的原理与作用 1.6解决过拟合的方法。 二、特征工程 2.1如何进行特征选择? 三…

如何系统的学习机器学习,算法工程师入门路径

我作为一名五年前从安卓开发,成功转行算法工程师的程序员,认真回顾一下当年的学习心得。在当年研究生阶段,漫长的学习过程中,非常焦虑,并且由于机器学习先验知识较多,不像开发那样能有及时的正反馈&#xf…

如何成为一名合格的算法工程师?我们做了一次技能拆分…

文 / 张相於 成为一名合格的开发工程师不是一件简单的事情,需要掌握从开发到调试到优化等一系列能力,这些能力中的每一项掌握起来都需要足够的努力和经验。而要成为一名合格的机器学习算法工程师(以下简称算法工程师)更是难上加难…

三五族化合物半导体的杂质能级

一些重要的实验结果 1. 二族元素掺入三五族半导体中,通常取代三族元素,而位于其格点位置上,因为比三族元素少一个价电子,而倾向于接收一个价电子,而起受主的作用,引入浅受主能级 2. 六族元素掺入三五族半…

5、杂质半导体

杂质半导体 杂质半导体主要靠多数载流子导电,掺入的杂质越多,多子的浓度越高,导电性越强,实现导电性能可控。 N型半导体(电子为多数载流子,N型 因为多数载流子带负电(negative)&am…

杂质半导体

通过扩散工艺,在本征半导体中掺入少量合适的杂质元素,便可得到杂质半导体。按掺入的杂质元素不同,可形成N型半导体和P型半导体;控制掺入杂质元素的浓度,就可控制杂质半导体的导电性能。 一,N型半导体 在纯…

为什么在制作N型半导体时掺杂五价原子?而不是掺杂六价原子甚至七价原子,不是自由电子更多吗?

作者:流落的橙子星人 链接:https://www.zhihu.com/question/370990032/answer/1012032939 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 所谓N型半导体,其实就是电子型半导体&a…

半导体、本征半导体和杂质半导体

在电子电路中最常用的半导体器件就是:半导体二极管和三极管,他们是由本征半导体构成的。 导体最外层电子在外电场作用下很容易产生定向移动,形成电流。 绝缘体最外层电子受原子核束缚力很强,只有在外电场强到一定程度时才能导电…

两种杂质半导体

目录 1. P型半导体2. N型半导体 1. P型半导体 内部结构 由于P的最外层电子缺少1个电子,即形成一个空穴。邻近原子的电子填补这个空穴,就会留下新的空穴 空穴为多子,自由电子为少子 注意:整个半导体还是呈电中性的。 2. N型半导体…

半导体器件(一) 学习笔记

目录 一、半导体基础知识 1.1、概念 1.2、本征半导体 1.2.1、本征半导体的晶体结构 1.2.2、共价键结构平面示意图 1.2.3、本征半导体中的两种载流子 1.2.4、温度逐渐升高(热激发) 1.2.5、空穴位的导电作用 1.2.6、结论 1.3、杂质半导体 1.2.1、N型半导体&#xff08…

半导体物理学习笔记(一)

半导体物理学习笔记(一) 什么是半导体晶体的概念化学键和晶体结构原子的负电性离子键和离子晶体共价键与共价晶体金刚石结构金属键和金属晶体混合键和混合键型晶体 小结 什么是半导体 按照导电能力区分 表示导电能力的物理量:电阻率&#xff…

半导体基础知识及其特征

半导体基础知识及其特征 一、半导体特征 1.什么是半导体 半导体是导电能力介于绝缘体和导体之间的材料 2. 半导体的特性 掺杂特性:掺入杂质则导电率增加几百倍,如:半导体元件温度特性:温度升高会使导电率大为增加,…

什么是半导体,半导体包括哪些

什么是半导体? 半导体是通常由硅组成的材料产品,其导电性比玻璃之类的绝缘体高,但比铜或铝之类的纯导体导电性低。可以通过引入杂质(称为掺杂)来改变其导电性和其他性能,以满足其所驻留的电子组件的特定需…

固体微电子学与半导体物理学(四)

写这篇文章的时候已经是四月中旬了,校园里满是春天的躁动洋溢着青春和活力。同龄人精彩的大学生活着实令我羡慕。我也想出去走走看看,但不是今年,也不是今天,更不是现在。 减少外出,多读点书;低头赶路&…

半导体物理学——(二)半导体中杂志和能级缺陷

实际半导体与理想半导体的区别 理想半导体:假设晶格原子严格按照周期性排列并静止在格点位置上,实际半导体中原子不是静止的,而是在其平衡位置附近振动。理想半导体是纯净不含杂质的,实际半导体含有若干杂质。理想半导体的晶格结…

固态器件理论(4)电子和“空穴”

文章目录 写在前面正文电子结构半导体杂质用于生产半导体的元素结论 交个朋友 写在前面 原文链接 相关博文 博客首页 注:知识搬运,供学习交流使用,侵联删! 正文 与金属相比,纯半导体是相对较好的绝缘体,…

半导体物理-固体晶格结构

参考尼曼《半导体物理与器件》 1.1 半导体材料 半导体是导电性能介于金属和绝缘体之间的一种材料。 半导体基本上可分为两类:位于元素周期表Ⅳ族的元素半导体材料和化合物半导体材料。 大部分化合物半导体材料是族和V族元素化合形成的。 双元素化合物半导体,比如GaAs或GaP…