Nature:Deep Learning 深度学习综述

article/2025/9/29 13:07:39

翻译:https://artificial-intelligence.net.cn/2019/06/05/1559711811/?from=singlemessage&isappinstalled=0

作者:Yann LeCun,  Yoshua Bengio ,Geoffrey Hinton

发表及时间:Nature,2015

概念:深度学习允许由多个处理层的计算模型来学习具有多个抽象级别的数据表示。这些方法极大的改善了语音识别、视觉对象识别、物体检测以及药物发现和基因组学等许多其他领域的最新技术。

原理:深度学习通过反向传播算法来指示机器应如何更改其内部参数(用于从前一层中的表示计算每个层中的表示)来发现大数据集中的复杂结构。

应用:深度卷积网络CNN在处理图像、视频、语音和音频方面带来了突破。而循环审计网络在处理序列数据,比如文本和语音方面表现出了闪亮的一面。

目录

一、引言

二、监督学习

三、反向传播算法

四、卷积神经网络

五、基于深度卷积神经网络的图片理解

六、分布表示和语言模型

七、循环神经网络(RNN)

八、深度学习的未来



一、引言

深度学习就是一种特征学习方法,把原始数据通过一些简单的但是非线性的模型转变成为更高层次的、更加抽象的表达。通过足够多的转换的组合,学可以习非常复杂的功能。(用深度学习的方法、多层的神经网络来找到一个函数,这个函数可以被学习,这个函数最后可以表示非常复杂的功能,比如说语音识别、图像识别。我们的过程就是要找到这个复杂的函数,然后通过学习更精确)

多层神经网络:

特点:多层神经元的组成,每个神经元的输入是前一层权重的输入

深度学习正在取得重大进展,它擅长发现高维数据中的复杂结构,被应用于科学、商业和政府等领域。除了在图像识别、语音识别等领域打破了纪录,它还在另外的领域击败了其他机器学习技术,包括预测潜在的药物分子的活性、分析粒子加速器数据、重建大脑回路、预测在非编码DNA突变对基因表达和疾病的影响。也许更令人惊讶的是,深度学习在自然语言理解的各项任务中产生了非常可喜的成果,特别是主题分类、情感分析、自动问答和语言翻译。我们认为,在不久的将来,深度学习将会取得更多的成功,因为它需要很少的手工工程,它受益于可用计算能力和数据量的增加。

深度学习的应用领域:

1.计算机视觉

   图像识别,人脸识别,自动驾驶

2.自然语言处理 

  智能搜索、机器翻译,文本摘要,人机对话

...

医学图像分析,制药,游戏助理....

二、监督学习

通过计算一个目标函数来测量出输出分数和期望模式分数之间的误差(或距离)。然后机器会修改其内部可调参数,以减少这种误差(就是反反向传播的过程)。这些可调节的参数,通常被称为权值,它们是一些实数,可以被看作是一些“旋钮”,定义了机器的输入输出功能。在典型的深学习系统中,可能有数以百万计的样本和权值和带有标签的样本,用来训练机器。

为了正确地调整权值向量,该学习算法计算每个权值的梯度向量,表示了如果权值增加了一个很小的量,那么误差会增加或减少的量。权值向量然后在梯度矢量的相反方向上进行调整。我们的目标函数,所有训练样本的平均,可以被看作是一种在权值的高维空间上的多变地形。负的梯度矢量表示在该地形中下降方向最快,使其更接近于最小值,也就是平均输出误差低最低的地方。

梯度下降:不断用梯度对参数进行微调,直到找到相应的位置。

                                                                        多层神经网络和BP算法

a.多层神经网络的示例,(用连接点表示)可以对输入空间进行整合,使得数据(红色和蓝色线表示的样本)线性可分

b.链式法则告诉我们如何组织两个小的影响,即x对y的变化和y对z的变化之间的联系

c.用于计算两个隐藏层的神经网络中正向传播的公式

d.计算反向传播的公式,在每个隐藏层我们计算每个单元的输出的误差导数

三、反向传播算法

1、链式法则

x的微小变化影响了y的微小变化,y的微小变化影响了z的微小变化。

2、反向传递

从前到后是一个计算的过程,从后到前是一个误差传递的过程,误差传递的过程就是学习的过程。

四、卷积神经网络(CNN)

CNN的过程:

1)预处理的数据用于卷积的计算,加上偏置得到feature map

2)将前面卷积的结果进行非线性激活函数的处理,目前常用的Relu

3)池化(取区域的最大值或者是平均值),保留其显著的特征

4)全链接层,对结果的输出和确认

CNN能够减少参数,提高效率,降低计算复杂度。

五、基于深度卷积神经网络的图片理解

CNN提取图像的特征,然后输入到RNN中生成一句话。

六、分布表示和语言模型

1、Word Embedding 词向量

      现有的机器学习方法往往无法直接处理文本数据,因此需要找到一个合适的方法将文本数据转换成数值数据。 Word Embedding 的过程是将文本空间的某个word通过一定的方法映射或嵌入到另一个数值的向量空间。

       传统的词的表示是one-hot Embedding,在词典中词的位置表示一个词的含义,仅仅表示词的一个特殊的位置,并不表示词的含义。Word Embedding可以进行词的向量空间的映射,在向量空间中离的比较近的词意思是比较接近的。

             

         机器能够通过大量的阅读文档获取文字的意思,这就是Word Embedding的过程。

  2、Word2Vec算法

给定input word来预测上下文。

七、循环神经网络(RNN)

RNN的特点:

  • RNN在每个时间点链接参数值,参数只有一份
  • 神经网络除了输入以外,还会建立在以前的“记忆”的基础上
  • 内存的要求与输入的规模有关

时间序列,输入根据不同的时间点变换。

RNN是带有存储功能的神经网络。

 

LSTM(长短记忆网络)

 

八、深度学习的未来

1、非监督学习

2、监督学习

3、强化学习

4、GAN 对抗生成网络

       博弈论

5、自监督学习

   现在预测未来,部分预测整体,未来预测现在

     

 


http://chatgpt.dhexx.cn/article/gXW3jjLI.shtml

相关文章

深度学习论文学习

1、Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation 原文 代码 Swin Unet的总体架构如图所示。 编辑 Swin Unet由编码器、瓶颈、解码器和跳跃连接组成。Swin Unet的基本单元是Swin Transformer模块。对于编码器,为了将输入转换为序列嵌入&am…

深度学习论文代码复现——CycleGAN和pix2pix

一:前期代码准备 从GitCode(服务器在国内,访问比较快)中将开源代码copy下来 地址:mirrors / junyanz / pytorch-cyclegan-and-pix2pix GitCode 也可从github源项目地址中获取:GitHub - junyanz/pytorch…

深度学习论文复习

文章目录 一. 卷积神经网络二. 感受野三. 激活函数四. BN层1. BN层问题2. BN层思想3. BN层训练阶段4. BN层测试阶段 五. AlexNet六. VGG七. ResNet1. 网络加深的问题2. ResNet三个优点: 八. YOLO系列1. YOLO (Darknet)2. YOLOv2(D…

深度学习领域引用量最多的前20篇论文简介

本文来源:全球人工智能 作者:Pedro Lopez,数据科学家,从事金融与商业智能 深度学习是机器学习和统计学交叉领域的一个子集,在过去的几年里得到快速的发展。强大的开源工具以及大数据爆发使其取得令人惊讶的突破进展。本…

2019年最新十篇「深度学习领域综述」论文

1、A guide to deep learning in healthcare(医疗深度学习技术指南) Google 斯坦福 Nature Medicine 作者:Andre Esteva, Alexandre Robicquet, Bharath Ramsundar, Volodymyr Kuleshov, Mark DePristo, Katherine Chou, Claire Cui, Greg …

【深度学习】2022年最值得关注的十篇论文,你都看了吗?来卷来学习

选自Ahead of AI 作者:Sebastian Raschka 机器之心编译 编辑:王强、蛋酱 年关将至,威斯康星大学助理教授 Sebastian Raschka 盘点了 2022 年他最看好的十大论文。 2022 年 1 月,扩散模型第一次吸引了我的眼球。当时我判断到将会有…

10篇论文带你入门深度学习图像分类(附下载)

来源:计算机视觉联盟 本文约7600字,建议阅读10分钟。 本文将介绍10篇最佳论文供初学者阅读。 前言 计算机视觉是将图像和视频转换成机器可理解的信号的主题。利用这些信号,程序员可以基于这种高级理解来进一步控制机器的行为。在许多计算机视…

机器学习和深度学习引用量最高的20篇论文(2014-2017)

机器学习和深度学习的研究进展正深刻变革着人类的技术,本文列出了自 2014 年以来这两个领域发表的最重要(被引用次数最多)的 20 篇科学论文,以飨读者。 机器学习,尤其是其子领域深度学习,在近些年来取得了许…

综述 | 近年来深度学习的重要研究成果(附PDF)

来源:机器之心 本文约1万字,建议阅读15分钟。 本文列举出了近年来深度学习的重要研究成果,从方法、架构,以及正则化、优化技术方面进行概述。 这篇综述论文列举出了近年来深度学习的重要研究成果,从方法、架构&#xf…

2023年2月的十篇深度学习论文推荐

本月的论文包括语言模型、扩散模型、音乐生成、多模态等主题。 1、MusicLM: Generating Music From TextPage https://arxiv.org/abs/2301.11325 By Andrea Agostinelli, Timeo I. Denk, et al. 扩散模型和自回归离散模型都在生成音乐/音频显示出令人印象深刻的性能。 与最…

深度学习研究综述

本文分为四章。 第一章 神经网络的发展 深度学习(deep learning)作为机器学习算法中的一个新兴技术,其动机在于建立,模拟人脑进行分析学习的神经网络。 深度学习的本质是对观察数据进行分层特征表示,实现将低级特征进…

如何快速入门深度学习写论文?

原文作者:月来客栈 https://www.zhihu.com/people/the_lastest 最快的方式: 第一,选择一篇有代码的论文,记住一定要有代码; 第二,大致弄清楚论文里所提出算法的思想原理; 第三&#xff…

2021年3月四篇深度学习论文推荐

这是Machine-Learning-Collage系列,每隔一周作者都会编写一个本周论文的幻灯片摘要。每月底所有的幻灯片画都会被集中到一个总结文章中。作者希望给读者一个直观和直观的一些最酷的趋势。以下是作者在2021年3月读到的四篇最喜欢的论文,以及为什么我相信它…

深度学习论文《Deep Learning》

论文《Deep Learning》 (深度学习) 作者:Yann Lecun, Yoshua Bengio, Geoffery Hinton 单位: FAIR, NYU, UMontreal, Utoronto, Google 发表会议及时间:《Nature》杂志 1、论文作者简介 2019…

2022 年 1 月推荐阅读的四篇深度学习论文

自举元学习到深度学习的时间序列预测,外推与泛化之间的关系与 Ridge Rider 探索多样化最优 ‘Bootstrapped Meta-Learning’ Flennerhag et al. (2021) | 📝 https://arxiv.org/pdf/2109.04504.pdf 元学习算法旨在自动发现归纳偏差,这允许…

深度学习9篇论文

Introduction 卷积神经网络CNN,虽然它听起来就像是生物学、数学和计算机的奇怪混杂产物,但在近些年的机器视觉领域,它是最具影响力的创新结果。随着Alex Krizhevsky开始使用神经网络,将分类错误率由26%降到15%并赢得2012年度Image…

2020年最新Spark企业级面试题【上】

前言 现在距离2021年还有不到一个月的时间了,是不是有的小伙明年不知该怎么复习spark,以及不知道该备战企业中会问到那些问题。好今天他来了总结了20个企业中经常被问到的面题以及会附带一些笔试题哦,编写不易建议收藏。 一、 Spark 有几种…

spark相关面试题总结

(根据博客总结并不断增加自己的内容) 1.spark中的RDD是什么,有哪些特性? 答:RDD(Resilient Distributed Dataset)叫做分布式数据集,是spark中最基本的数据抽象,它代表一…

spark面试题

1.spark中的RDD是什么,有哪些特性? 答:RDD(Resilient Distributed Dataset)叫做分布式数据集,是spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可以并行计…

Spark面试

场景描述:这是一个Spark的面试题合集。是我自己作为面试者和作为面试官都会被问到或者问到别人的问题,这个总结里面有大量参考了网上和书上各位老师、大佬的一些原文答案,只是希望可以给出更好的回答,一般上我都会把原文链接贴上&…