【傻瓜攻略】深度学习之从入门到放弃

article/2025/9/29 22:00:23

从研究生进来之后,一直到现在已经进行了一年关于DP的学习,写篇文章总结一下我蹒跚的学习过程。总结来说是一个从入门学习到几乎想要放弃的过程。顺带列举下面几个坑,希望能帮助一下同样在这条路上行走的旅人们。

1、overfitting这个东西

很多刚刚进门的新人,包括刚刚做完一个项目的我,都会认为自己的神经网络效果不好可能是过拟合了。但是实际上过拟合这种事情听说的人多,看到的人很少。当你的激活函数是ReLu,你的优化器是Adam的时候,那就更少概率能碰到overfitting,如果你还有dropout层,那你的碰到的概率更少了。(ps,最近补课李宏毅老师的课得到的知识。)

碰到效果不好的时候,首先应该看看自己training set的效果怎么样,如果正确率很低,那就是没有train起来。这是该考虑的是你的神经网络架构的问题,以及你的优化器,还有学习速率这些。当然还有epoch 以及batch size的大小。

一般来说batch size越大,你的训练时间越少,但是你的神经网络误差会越大。所以batch size大小选择需谨慎。另外,初始的学习速率也不能过大。

但是,也有人会考虑到epoch过大,以及batch size过小,导致训练速度过慢怎么办?这个问题我也遇到过,我的建议是把你的GPU跑起来。

2、关于GPU

在断更的这段时间,我在做项目,跟深度学习有关。那个时候特别傻,一直用CPU在跑,还不敢问老师要个服务器(ps:当然也有不会用服务器的原因),这一跑就是三四天,甚至是一个星期。问题是,CPU跑这个东西,很容易电脑死机,特别是我这种老年机。可想而知,这结果就很悲惨了。特别是由于我这么个愚笨的人,对于神经网络学习了一年,还是不太精进,所以结果很悲惨。虽然,最终结果还是出来了,结果还不错。但是过程真的是悲惨。

等结束项目之后,我好好地看了一下我的电脑,以及我的配置架构。发现我并没有使用GPU!!!所以开始配置GPU了。

网上有很多博客说,python3.6,应该安装CUDAxx版本,CUDnnxx版本,不然就跑不了了。作为一个死倔强的人,其实是个很懒的人,我真的不想卸了我的CUDA和CUDnn重装。大家都懂的,NVIDIA这个坑爹的官网卡就算了,CUDA这类东西又大又有n个补丁,下的慢也就算了,还有各种环境变量要设置,设置完了还要重启,真的是去了半条命。python版本重装也是要人命。后来,在我的不懈努力下,我终于找到了一个博客,他提供了一个GitHub的连接。

这个连接中有对应各个环境的tensorflow,https://github.com/fo40225/tensorflow-windows-wheel,就是这个网站。

找到对应的版本下下来,然后放在你的python文件夹-->Lib->site-packpages 文件夹下,别的文件夹下我也试过,但是我安装后好像还是用不了,不知道是不是环境变量的原因。皮实的小朋友可以试试。

打开Anaconda prompt ,cd到这个文件夹,然后pip install tensoflowXXXXX,这个tensorflowXXX就是下载的那个文件。

找不到Anaconda prompt,可以在开始->Anaconda文件夹下找到。

安装好了之后,可以试试import tensorflow……,就是常用的那个代码。

安装tensorflow-gpu的孩子,可以试试,tf.test.is_built_with_cuda(),是否为Ture,

如果不是,则检查你的python文件夹-->Lib->site-packpages->tensorflow->python->platform->build_info.py 文件

如图,这个文件写了你的tensorflow需要的CUDA 和CUDnn需要的版本。如果它跟你已经安装的版本不符,那说明你下错了。对了,GitHub中的AVX在i3之后的版本都有。

还有CUDA的版本查看是 nvcc -V,直接在cmd 命令敲进去就行

CUDnn版本,是在你的CUDA安装文件夹->include->cudnn.h

如图就是,7.0.5版本。因为你当初安装cudnn的时候就是把文件放进cuda安装目录下安装的。

一般正常的安装话,这个文件应该在

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.1\include

CUDnn版本的信息还是很难找到的。

最后,关于你是否使用了GPU,你可以写个代码,然后下载个GPU-Z软件进行查看。

这个GPU load就是你GPU的使用率。

最后强调一下我的环境配置,(叉腰,超牛逼)WIN7+CUDA9.1.85+Python3.6+CUDnn7.0.5+tensorflow-gpu 1.5

我也想用1.10版本,但是可惜我的cuda和python和cudnn版本决定了我只能用1.5,╮(╯▽╰)╭

3、关于学习的方法。

我一开始是看书的,但是,你们懂得,现在关于机器学习的书里面一堆的公式,一堆的概念,一堆概率论什么的,然后我就从入门到放弃了。

然后我开始通过网络搜索各种架构,一点一点搭建起来了DP的一些基本概念。要是形容来说的话,就类似于,我看到了一个绝世大帅哥的轮廓的感觉。你们可以通过看我以前的博客内容,这样就不需要走我以前的老路,一点一点搜集资料了。个人感觉,对于一个以前一点都没有接触过bp内容的人来说,这个基础内容的普及是相当重要的,这相当于让我看到了DP的门槛。

接着,我也尝试着写一写代码,却发觉无从下手。因为我根本不知道该怎么搭建网络。于是,我从网上开始下载各种例程,由于项目需要,我对于YOLO的框架看的格外仔细,虽然仍旧一知半解,只能说会移植知道怎么用,但是用的磕磕绊绊(从我一直用CPU跑完整个项目就能看出,我真的用的磕磕绊绊)但是这个还是有好处的。

YOLO这个东西坑就坑在这货在Ubuntu上面的资料一应俱全,各种帖子特多。但是在windows上就很少很少,只有一个github的工程YAD2K,这个工程关于文件的描述少之又少。所以导致了我在YOLO上研究了很长时间。当然也包括对于VOC的研究以及在Ubuntu上搭建环境什么的。Ubuntu上正版的YOLO我也跑了,叉腰,超牛逼。

总之磕磕绊绊,研究了两三个月。这段时间对于YOLO代码的研究,使得我大概了解了tensorflow以及keras的大概轮廓,以及神经网络的大体架构。

这个时候我回过头去听李宏毅老师的课,真的是受益匪浅。以前听的时候没什么感觉,但是现在去听,却能发觉当初走了很多弯路,而且当初对于YOLO代码的分析有很多的错误。

这个老师讲课真的很精辟,而且讲课风格很幽默,墙裂推荐去听听!!!!

但是我一点也不后悔当初走过的弯路,以及CPU训练代码训练了半天效果还是不好的那段即将放弃的艰苦日子。不走过这些弯路,对于李宏毅老师的课我不可能抓住重点而且没法理解的这么深。我的意思不是说走弯路,而且提倡跟我一样在学习dp的孩子们,在听老师讲实训课之前,最好拿个代码研究一下,这样对于课程的理解会有极大的好处。另外,推荐keras!!!

写的太多了,那么这里就结束了。


http://chatgpt.dhexx.cn/article/75EjBR1N.shtml

相关文章

android异步编程,使用RxAndroid处理异步任务

欢迎Follow我的GitHub, 关注我的简书. 其余参考Android目录. Demo Android Rx是响应式编程的意思, 本质是观察者模式, 是以观察者(Observer)和订阅者(Subscriber)为基础的异步响应方式. 在Android编程时, 经常会使用后台线程, 那么就可以使用这种方式. 目前的异步编程方式都会导…

RxAndroid 入门笔记

参考链接: http://gank.io/post/560e15be2dca930e00da1083#toc_10 https://mcxiaoke.gitbooks.io/rxdocs/content/Observables.html http://blog.chengyunfeng.com/?p948 http://www.apkbus.com/blog-705730-62567.html 要了解RxAndroid,必须先要了解RxJava,应…

【Rxandroid】Rxandroid源码解读

目录 1.AndroidSchedulers类的源码 2.RxAndroidPlugins类的源码 3.RxAndroidSechedulersHook类的源码 4.LooperScheduler类的源码 5.HandlerScheduler类的源码 6.BuildConfig类的源码 7.MainThreadSubscription类的源码 总结 将Rxandroid(1.2.1)…

Retrofit + RxAndroid 实践总结

在接入 Retrofit RxAndroid 之前,项目代码中主要存在如下问题: 服务器 API 的定义方式不一致,有的集中定义,有的定义在业务代码中,没有分类不便于维护。Request / Response / API 三者没有对应关系(Reque…

Rxjava3 RxAndroid

文章目录 Rxjava && Rxandroid引用方式 概念流程图代码示例ObservableObservable#subscribeOn(NonNull Scheduler scheduler)Observable#observeOn(NonNull Scheduler scheduler)ObservableSubscribeOnObservableObserveOn本文开头的代码示例等同于如下代码 Schedulers…

RxJava和RxAndroid学习记录

目录 1 概念和说明 1.1 响应式编程 1.2 RxJava 1.3 关于RxJava和RxAndroid 1.4 关于响应式编程和普通编程 2. 基本使用 2.1 基本元素关系图 2.2 代码示例: 2.3 关于subscribe() 2.4 线程调度 2.4.1 线程调度 2.4.2 RxJava内置的常用…

RxAndroid的基础使用

作为一个android开发者,在开发应用的过程中避免不了异步这个问题。android系统为我们提供了Handler这个类帮助我们进行线程间的通信和切换,但是GitHub上也有很多其他非常优秀的开源框架来帮助我们进行异步处理,比如今天学习的RxAndroid。 简…

rxandroid 基础知识

概述 在Android 中, 使用 rxandroid , rxandroid和rxJava的关系是,rxandroid包 依赖rxJava包,在其功能上增加了一些Android特有功能,项目中如果不需要指定rxJava包的版本,只需引入rxandroid包即可,如果需要更改 rxandroid包中默认的rxJava包版本 , 在项目中引入指定的rxJava包即…

RxAndroid使用初探;简洁、优雅、高效

引言 RxAndroid是一个开发库、是一种代码风格、也是一种思维方式。 正如标题所言,RxAndroid的特点是简洁、优雅、高效,它的优点是多线程切换简单、数据变换容易、代码简洁可读性好、第三方支持丰富易于开发;缺点是学习成本较高、出错难以排查。 用途与优势 起源 RxAndroid…

RxAndroid的学习和研究

1.什么是RxAndroid RxAndroid的含义为响应式编程,Rx含义是响应式编程,其本质就是观察者模式,以观察者(Observer)和订阅者(Subscriber)为基础的异步响应方式。    Observables发出一系列事件&a…

linux基本功系列之dd命令实战

文章目录 前言🚀🚀🚀一. dd 命令介绍二. 语法格式及常用选项三. 参考案例3.1 创建指定大小的文件3.2 清空磁盘数据3.3 给磁盘做备份还原3.4 把光盘拷贝到root下3.5 内存不足的处理方法 四. 文中出现的概念解释swapon命令介绍4.2 /dev/zero 介…

Linux系统中dd命令用法详解

命令介绍: Linux dd 命令用于读取、转换并输出数据。dd 可从标准输入或文件中读取数据,根据指定的格式来转换数据,再输出到文件、设备或标准输出。 参数介绍 if 代表输入文件。如果不指定 if,默认就会从 stdin 中读取输入。of …

dd 命令详解

dd命令是Linux/Unix下的一个很常见的文件拷贝工具。 我们先列下dd命名的常用的参数,再详细分析: bsBYTES read and write up to BYTES bytes at a time cbsBYTES convert BYTES bytes at a time convCONVS convert the file as pe…

dd命令使用总结

dd命令介绍 dd是Linux下一个非常有用的命令,该命令用于读取、转换并输出数据;dd命令在Android shell下也支持使用。 语法格式: dd [option]dd指令选项详解 iffile:输入文件名,缺省为标准输入 offile:输…

dd命令相关整理

对于一个软件测试人员而言,工作开展前就是准备自己的测试环境,那么重装系统就是首当其冲的一个必备技能。最近因为手边工作环境没有windows的系统,所以没有条件利用软碟通这类刻录软件直接刻录启动盘。被逼无奈之下用命令来刻录,整…

Linux:shell 脚本 自动解压压缩文件tar.gz到指定目录

具体情境 Ubuntu16.04系统,将.tar.gz格式的文件从/home/myftp/upload/nuodongiot目录自动解压到/home/myftp/upload/backupcopy目录中,并将源目录/home/myftp/upload/nuodongiot中的文件移动至/home/myftp/upload/extarct目录中 该过程进行单个文件进行…

tar解压文件至指定目录,不包含原目录

1、tar解压文件至指定目录,不包含原目录 要解压的压缩包原目录结构如下 tar -zxf log.tar.gz --strip-components 1 -C /opt/new_test注: --strip-components 1 解压至下一级目录,若为2则解压至下下级目录 2、压缩只指定的目录&#xff0c…

linux gz解压 指定目,linux解压tar.gz到指定文件夹或目录

1. 前言 本文主要讲解如何解压tar.gz到指定文件夹或目录,tar是Linux系统上的一种打包与压缩工具。 2. linux解压tar文件使用案例 Linux下使用tar命令把当前目录下的zcwyou.tar.gz解压到指定的目录/123/abc/ ,前提要保证存在/123/abc/这个目录。 [root@zcwyou ~]# tar -zxvf zc…

Linux tar 命令 将归档内指定文件解压到指定目录

首先介绍一下 tar 命令: 用途:打包文件(制作归档文件)、释放归档文件 格式: tar [选项]... 归档文件名 源文件或目录 tar [选项]... 归档文件名 [-C 目标目录] 常用命令选项: -c 创建 .tar 格式…

20191004在LINUX下如何将tar压缩文件解压到指定的目录下

百度搜索:tar 解压缩到指定目录 https://zhidao.baidu.com/question/9844116.html 在LINUX下如何将tar压缩文件解压到指定的目录下 各位,请教一下在LINUX下如何将tar压缩文件解压到指定的目录下,直接用tar xvf 解压出来的是放在当前目录的&am…