《解析深度学习》部分笔记

article/2025/9/28 15:35:58

记录一些书里的知识点,摘自魏秀参的《解析深度学习-卷积神经网络原理与视觉实践》

 

  • 第三章 卷积神经网络经典结构

1.在深度学习中,深度卷积神经网络呈现“分布式表示”,既“语义概念”到神经元是一个多对多映射。直观讲就是:每个语义概念由许多分布在不同神经元中被激活的模式表示;而每个神经元又可以参与到许多不同语义概念的表示中去。(对某个模式,会有不同卷积核产生响应;对某个卷积核,也会在不同模式上产生响应)

2.神经网络响应的区域多呈现“稀疏”特性,即响应区域集中且占原图比例较小。

3.深度特征的层次性。卷积操作可以获取图像区域不同类型的特征,而池化等操作可以对这些特征进行融合和抽象,随着若干卷积和池化操作的堆叠,从各层得到的深度特征逐渐从泛化特征(如边缘、纹理等)过渡到高层语义表示(躯干、头部等)。

  • 第四章 卷积神经网络的压缩

(这部分知识点挺多,后续若有使用的地方专门补充)

  • 第五章 数据扩充

1.特殊的数据扩充方式:Fancy PCA

首先对所有训练数据的R、G、B像素进行主成分分析,得到对应的特征向量和特征值,然后根据特征向量和特征值可以计算一组随机值,将其作为扰动项加入到原像素值中即可。

参考文献:Alex Krizhevsky,Ilya Sutskever,and Geoffrey E. Hinton. ImageNet classification with deep convolutiional neural networks. 2012

2.特殊的数据扩充方式:监督式数据扩充

海康威视研究院提出的一种监督式(利用图像标记信息)的新型数据扩充方式。在场景分类问题中,主要依靠图片所蕴含的高层语义进行分类,此时若采用随机截取等简单的数据扩充方法,会很容易漏掉关键信息,还会引入一些影响分类判断的错误标记,可以使用以下方法:首先用原始数据训练出一个初始分类模型,并利用该模型生成每个图的heat map,这张特征图可以指示图像区域与场景标记之间的相关概率。之后,依据此概率映射会原图选择较强相关的图像区域作为扣取的图像块。

这种数据扩充方式适用于一些高层语义图像分类任务,比如场景分类和基于图像的节日分类等。

  • 第六章 数据预处理

1.归一化。卷积神经网络中的数据预处理操作,通常是计算训练集图像像素均值,之后在处理训练集、验证集和测试集图像时需要分别减去该均值。减均值操作的原理是:我们默认自然图像是一类平稳的数据分布(既数据每一个维度的统计都服从相同分布),此时,从每个样本上减去数据的统计平均值(逐样本计算)可以移除共同部分,凸显个体差异。

  • 第十一章 超参数设定和网络训练 

1.小卷积核相比大卷积核有两项优势:(1)增加网络容量和模型复杂度;(2)减少卷积参数个数

2.批规范化操作(BN),该方法在一定程度上换建立深层网络的“梯度弥散”问题

  • 第十二章 不平衡样本的处理

1.数据层面的处理

(1)数据重采样

包括上采样和下采样,上采样可以复制少的类别的图像使其与样本最多类别的样本数一致,也可以使用数据扩充的方式代替简单的复制操作。下采样并不是直接随机丢弃一部分图像(那样做会降低训练数据多样性进而影响模型泛化能力),正确的下采样方式为,在 批处理训练 时对 每批 随机抽取的图像严格控制其样本较多类别的图像数量(既每批训练的时候随机抽样来保证正负样本量一致,并不丢弃多的样本)。此外,还需注意的是,仅使用数据上采样有可能引起模型过拟合问题,更保险且有效的数据重采样是将上采样和下采样结合使用。

(2)类别平衡采样

该策略是把样本按类别分组,由每个类别生成一个样本列表。在训练过程中先随机选择1个或者几个类别,然后从各个类别所对应的样本列表中随机选择样本,这样可以保证每个类别参与训练的机会比较均衡。(在此之上提出一个优化的方法:类别重组法)

2.算法层面处理

(1)代价敏感方法

增加小样本错分的“惩罚代价”并将此“惩罚代价”直接体现在目标函数中。这样,通过优化目标函数就可以调整模型在小样本上的“注意力”。

以分类问题为例,介绍以下两种方法

-基于代价敏感矩阵的代价敏感:

假设N个样本,\left \{ x_{n},y_{n} \right \} n=1,...,N,其中样本标记y属于K类,利用K×K的矩阵C对不同样本类别施加错分惩罚(亦可称权重):

C=\begin{bmatrix} C\left ( 1,1 \right ) &C\left ( 1,2 \right ) &... &C\left ( 1,K \right ) \\ C\left ( 2,1 \right ) &C\left ( 2,2 \right ) &... &C\left ( 2,K \right ) \\ ...& ... & ... & ...\\ C\left ( K,1 \right ) &C\left ( K,2 \right ) &... &C\left ( K,K \right ) \\ \end{bmatrix}

其中C\left ( y_{i},y_{j} \right )\epsilon [0,+\infty )表示类别yi错分为yj的“惩罚”,对角线元素为0。

施加代价之后的训练目标变为:训练得到的某分类器g,使得期望代价之和\sum_{n}C(y_{n},g(x_{n}))最小。

可以看出,代价敏感矩阵反映是是类别级别的错分惩罚。

-基于代价敏感向量的代价敏感:

代价敏感向量反映的是样本级别的错分惩罚。

对某样本(x_{n},y_{n}),有对应的一个K维代价敏感向量Cn,其中Cn的第k维表示该样本被错分为第k类的惩罚,自然第yn类为0。

基于代价敏感向量的方法在模型训练阶段,是将样本级别的代价敏感向量与样本以\left ( x_{n},y_{n},c_{n} \right )的三元组形式一同作为输入数据送入学习算法。

代价敏感矩阵实际上是代价敏感向量的一种特殊形式,即对于某类的所有样本,其错分惩罚向量为同一向量。

 

3.代价敏感法中权重的指定方式

(1)按照样本比例指定

样本数量多的,对应逞罚权重可以设为稍小值

(2)按照混淆矩阵指定

一种方式可以直接以错分样本数为矩阵取值;更优的方法是考虑各类的错分比例,并以此比例调整各类错分权重。

 

  • 第十三章 模型集成方法

(知识点很多,后续有使用专门补充)

 

参考资料:

《解析深度学习-卷积神经网络原理与视觉实践》 魏秀参

 

 

 


http://chatgpt.dhexx.cn/article/EDEYNvVm.shtml

相关文章

新型计算机离我们还有多远

作者:高如如,魏秀参 本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅《程序员》 自1946年ENIAC(Electronic Numerical Integrator And Calculator,即电子数字积分计算机)问世&am…

Must Know Tips/tricks in DNN

Must Know Tips/Tricks in Deep Neural Networks (byXiu-Shen Wei) 转载于http://lamda.nju.edu.cn/weixs/project/CNNTricks/CNNTricks.html Deep Neural Networks, especially Convolutional Neural Networks (CNN), allows computational models that are composed of mult…

[读书笔录]解析卷机神经网络(魏秀参)——第二章

解析卷积神经网络——基础理论篇 第二章 卷机神经网络基本部件 2.1 “端到端”思想(end-to-end manner) 深度学习的一个重要思想即”端到端”的学习方式,属于表示学习的一种。整个学习流程并不进行人为的子问题划分,而是完全交…

[读书笔录]解析卷机神经网络(魏秀参)——第三章

#解析卷积神经网络——基础理论篇 第三章 卷机神经网络经典结构 3.1 CNN网络结构中的重要概念 ####感受野 感受野(receptive filed)原指听觉、视觉等神经系统中一些神经元的特性,即神经元只接受其所支配的刺激区域内的信号。 以单层卷积操作为例,如左…

[读书笔录]解析卷积神经网络(魏秀参)——第一章

解析卷积神经网络——基础理论篇 第一章 卷机神经网络基础知识 1.1发展历程 卷积神经网络发展历史中的第一件里程碑事件发生在上世纪60年代左右的神经科学中,1959 年提出猫的初级视皮层中单个神经元的“感受野”概念,紧接着于1962年发现了猫的视觉中枢…

如何看旷视南京负责人魏秀参跳槽高校工作?

链接:https://www.zhihu.com/question/404733616 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删 跳槽本是正常现象,之所以会在知乎引起讨论,说明其中有让大家值得关注的点。但我们吃瓜群众&#xff0c…

[阅读笔记]《解析卷积神经网络_深度学习实践手册》魏秀参著

书籍下载地址:http://lamda.nju.edu.cn/weixs/book/CNN_book.pdf 这本书名虽然有实践两个字,但内容还是主要介绍在实践框架中涉及的基本概念、方法和技巧介绍,侧重于实践中的概念介绍并不是手把手告诉你如何在某平台上搭建一个卷积神经网络&a…

CVPR 2020评审结果放出,魏秀参博士教你如何rebuttal!!!

关注上方“深度学习技术前沿”,选择“星标公众号”, 资源干货,第一时间送达! 来源:知乎 作者:魏秀参 链接:https://zhuanlan.zhihu.com/p/104298923 近日,在此文章中,旷视…

魏秀参:如何理解全连接层的作用?

点击上方“机器学习与生成对抗网络”,关注"星标" 获取有趣、好玩的前沿干货! 来自 | 知乎 作者 | 魏秀参 文仅分享,侵删 https://www.zhihu.com/question/41037974/answer/150522307 全连接层到底什么用?我来谈三点。…

28岁少帅统领旷视南京研究院,LAMDA魏秀参专访

记者和魏秀参专访约在旷视科技北京总部,北临清华大学,西靠中关村的融科写字楼,公司三层中厅是一整面落地屏幕,实时显示着人脸识别、人脸检测、年龄估计、人体关键点预测等多种视觉应用demo。 这家计算机视觉公司在2017年10 月 31 …

极市直播丨南京理工大学魏秀参、沈阳:大规模细粒度图像检索

| 极市线上分享 第102期 | 一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,并完成了101期极市线上直播分享。往期分享请前往:http://bbs.cvmart.net/topics/149,也欢迎各位…

[读书笔录]解析卷积神经网络(魏秀参)——目录和绪论

解析卷积神经网络——基础理论篇 *南京大学计算机系机器学习与数据挖掘所(LAMDA)在读博士魏秀参开放了一份较系统完整的 CNN 入门材料《解析卷积神经网络——深度学习实践手册》。这是一本面向中文读者轻量级、偏实用的深度学习工具书,内容侧…

R Talk | 旷视南京研究院魏秀参:细粒度图像分析综述

「R Talk 」是旷视研究院推出的一个深度学习专栏,将通过不定期的推送展示旷视研究院的学术分享及阶段性技术成果。「R」是 Research 的缩写,也是旷视研究院的内部代号;而所有的「Talk」都是来自旷视的 Researcher。「R Talk 」旨在通过一场场…

【Web】控制台操作

浏览器控制台 重定向空白页面使用调用函数eval()执行函数命令使用时间类函数执行代码通过匿名function()执行脚本创建Function对象并执行代码通过apply执行代码通过call执行函数通过成员对象执行函数通过top执行函数通过WINDOW.WINDOW或任何等价值执行函数通过页面事件执行代码…

浏览器控制台Network面板简述

浏览器控制台Network面板简述 如何打开NetWork面板控制台Network的作用面板组成请求列表请求列表每列:查看单个资源的详细信息查看HTTP头信息General部分:Response Headers(响应头)部分:Request Headers (请求头&#…

浏览器随笔 -- 谷歌浏览器控制台使用

谷歌浏览器控制台使用 1. 使用说明2. 整体布局介绍3. Element3.1 页面元素查找&修改css样式3.2 操作HTML元素 4. Console4.1 日志打印4.2 代码编辑器 5. Sources6. Network6.1 接口状态码6.2 接口传参&数据返回 7. Application -- 浏览器存储7.1 cookie 存储7.2 localS…

如何监听浏览器控制台的打印信息?

注意: 拦截并监听控制台打印并不是一个好的行为,为了网站安全请谨慎使用 需求背景 当我们在项目中引入某些第三方依赖时,该第三方依赖会在浏览器控制台打印相关信息,如 stompjs 会打印 stomp 连接情况 今天有个新需求是需要将控…

Chrome 控制台console的用法

转自:http://www.open-open.com/lib/view/open1421131601390.html 原文出处: ctriphire 大家都有用过各种类型的浏览器,每种浏览器都有自己的特色,本人拙见,在我用过的浏览器当中,我是最喜欢Chrome的&am…

Chrome控制台console的各种用法(方便调试)

https://www.cnblogs.com/qubernet/p/5794812.html 1、输出信息 console.log(消息内容!); //输出普通信息   console.info(消息内容!); //输出提示信息   console.error(消息内容!);//输出错误信息   console.warn(消息内容&#xff0…

chrome控制台中console的强大

在使用谷歌浏览器进行前端开发的时候,console作为控制台的一个主要方法,相信大家都用过,一般都是用console.log()来输出部分内容,但是console还有很多强大之处,下面主要说一下console的更重强大的地方: 首…