2022吴恩达机器学习课程学习笔记(第一课第一周)

article/2025/9/19 14:25:20

2022吴恩达机器学习课程学习笔记(第一课第一周)

  • 欢迎参加《机器学习》课程
  • 机器学习应用
  • 机器学习定义
    • 定义(非正式)
    • 主要类型
  • 监督学习
    • 定义
    • 特征
    • 类型
  • 无监督学习
    • 定义
    • 特征
    • 类型
  • Jupyter Notebook
  • 线性回归模型
    • 定义
    • 举例--房屋价格预测
    • 一些常见的机器学习专业术语
    • 监督学习过程
    • 模型表示
  • 代价函数
    • 代价函数公式
      • 相关概念
      • 平方误差代价函数
    • 理解代价函数
    • 可视化代价函数
    • 可视化举例
  • 梯度下降
    • 梯度下降简介
    • 梯度下降的实现
    • 理解梯度下降
    • 学习率
    • 用于线性回归的梯度下降
    • 运行梯度下降

欢迎参加《机器学习》课程

在本课程中,你将了解机器学习并自己实现机器学习和编码。

机器学习应用

我们可以对机器进行编程来完成一些基本的事情,例如如何找到从a到b的最短路径,就像在你的GPS中一样。但在大多数情况下,我们不知道如何编写显式程序来做许多更有趣的事情,例如网络搜索、识别人类语言、识别图像或实现自动驾驶汽车。我们知道做这些事的唯一方法就是让机器学会自己做。

机器学习定义

定义(非正式)

使计算机无需明确编程即可学习的研究领域。 亚瑟 塞缪尔(1959)

主要类型

监督学习(在现实世界中使用最多的机器学习类型)
无监督学习
强化学习

监督学习

定义

监督学习是指学习从输入x到输出y的映射的算法。

特征

关键特征是你给模型学习的数据中包括了正确的答案,即对于给定的输入x,有正确的输出y,模型通过学习正确的(x,y),对于其他没有给定输出结果的输入(它以前从未见过的)给出合理的预测。

类型

回归:从无限多个可能的数字中预测一个数字。
分类:从有限的可能的输出类别中预测一个类别(不一定是数字)。

无监督学习

定义

无监督学习是指在没有标签的数据中,找到某种结构或模式的算法。

特征

关键特征是你给模型学习的数据中不带有任何标签,我们的工作是找到某种结构或某种模式,或者只是找到一些有趣的东西,而不是试图监督算法对于每个输入给出正确的答案。

类型

聚类算法:将未标记的数据放置在不同的集群中。
异常检测:检测异常事件。
降维:压缩一个大的数据集,丢失尽可能少的信息。

Jupyter Notebook

线性回归模型

定义

线性回归意味着将一条直线拟合到你的数据中。

举例–房屋价格预测

在这里插入图片描述
这是监督学习的一个实例,因为我们是首先给出具有正确答案的数据,然后去预测新房屋的价格。
这是回归模型的一个实例,因为它以价格(具有无限种可能的输出)作为预测输出。

一些常见的机器学习专业术语

训练集:用于训练模型的数据集,用 Training Set 表示。
输入变量/特征/输入特征:给定的作为模型输入的变量,用 x 表示。
输出变量/目标变量:作为模型预测输出的变量,用 y 表示。
训练样本总数:用 m 表示。
单个训练样例:用 (x,y) 表示。
第i个训练样例:用 (x(i),y(i)) 表示。

监督学习过程

在这里插入图片描述
其中,对于给定的x,y表示真实值,y-hat表示估计值。

模型表示

fw,b(x) = wx+b
一个变量的线性回归也叫单变量线性回归。

代价函数

代价函数公式

相关概念

代价函数会告诉我们模型拟合数据拟合的有多好以便于我们可以尝试将它做的更好。
对于模型:fw,b(x) = wx + b
wb 被称为模型的参数,是你在训练过程中可以调整的变量以改进模型,又被称为系数或权重。
在这里插入图片描述
我们在视觉上觉得这条线适合数据时,意味着这条线大致经过或接近所有训练样例。
对于给定的 x(i),图像上的十字所对应的y轴坐标为 y(i),即真实值;直线上对应的y轴坐标为 y(i)-hat,即估计值,我们现在要做的事情就是找到 wb ,以便对于所有样例,估计值都能接近真实值,这就是代价函数的作用。

平方误差代价函数

在这里插入图片描述
即所有样例的估计值减去真实值的平方再求平均。
除以2是为了后面求导的过程中会把2约掉,使公式看起来更简洁,但无论除不除以2,都不会产生任何影响。

理解代价函数

为了简化计算,将参数 b 设为 0
在这里插入图片描述
左侧图像是固定参数 w,绘制 x-y 图像,右侧图像是绘制 w-J 图像,因此左侧一条直线对应于右侧一个点。
因此如何选择参数 w 的值决定了直线拟合图像拟合的有多好。
J 是衡量平方误差有多大的代价函数,所以选择最小化平方误差的 w,会给我们一个很好的模型。
因此,线性回归的目标是选择合适的参数以最小化代价函数。

可视化代价函数

3D表面图
在这里插入图片描述
为了更仔细的观察特定的点,使用等高线图来绘制函数 J
在这里插入图片描述

左上是函数 f 的二维图像;右上是函数 J 的等高线图;下面是函数 J 的3D表面图。
等高线图上的每个椭圆对应的是3D表面图上处于完全相同高度的点,也就是具有相同的J的点。4
要获得等高线图,首先获取3D表面图,然后将其水平切片,每个切片上的所有点对应于一个椭圆。
这些同心椭圆的圆心对应代价函数最小的点

可视化举例

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
越靠近同心圆圆心,直线拟合的越好

梯度下降

梯度下降简介

梯度下降所做的事情是:选择参数 wb 的初始值;每次更改 wb 的值以减小代价函数的值;直至代价函数达到或接近最小值。
注意:使用梯度下降只能得到局部最小值,对于某些非凸函数(简单理解:不是碗形或吊床形的函数),不能得到全局最小值。
在这里插入图片描述
站在初始点,自转一周,找到最陡的下降方向,迈出一小步,重复这个过程,直至到达山谷。
当改变初始点位置时,重复上述过程,到达另一山谷。

梯度下降的实现

在这里插入图片描述
α 被称为学习率,通常是介于 0 和 1 之间一个小的正数,控制下坡迈出多大一步,即如果 α 很大,对应着一个快速的梯度下降过程,反之,对应一个缓慢的梯度下降过程。
导数项代表下坡的方向。
重复上述两个公式直至算法收敛收敛代表达到局部最小值。
注意的细节:同时更新 wb
在这里插入图片描述
更新 b 的时候公式里面的 w 要使用更新前的 w

理解梯度下降

为了简化计算,便于理解,将参数 b 的值置为 0。
在这里插入图片描述
则梯度下降要做的事情就是改变参数 w 的值,以最小化代价函数 J
在这里插入图片描述
图像上一点处的导数值即为该点切线的斜率,切线是朝向右上方时,斜率大于0,朝向右下方时,斜率小于0。
当在最小值右侧选值时,更新后的 w 值会减小;当在最小值左侧选值时,更新后的 w 会增大。由此看来,梯度下降在做正确的事。

学习率

在这里插入图片描述
如果学习率太小,梯度下降仍然会起作用,但会很慢。
如果学习率太大,可能永远不会达到最小值,不收敛甚至发散。
在这里插入图片描述
为什么采用固定的学习率会达到局部最小值
当接近最小值时,导数值会越来越小趋近于0,更新的步长也会越来越小趋近于0,所以会到达最小值点。

用于线性回归的梯度下降

在这里插入图片描述
在这里插入图片描述
平方误差代价函数是凸函数,只有一个局部最小值即全局最小值,所以只要选择适当的学习率,算法就会收敛

运行梯度下降

在这里插入图片描述
随着使用梯度下降法进行参数更新,代价函数逐渐减小,直线也拟合得越来越好。
这种梯度下降也被称为批量梯度下降,指的是梯度下降的每一步中我们都使用了所有的训练数据,还有其他种类的梯度下降,每一步更新只使用训练数据的一个子集。


http://chatgpt.dhexx.cn/article/Q3DsY7vl.shtml

相关文章

2022吴恩达机器学习课程学习笔记(第二课第一周)

2022吴恩达机器学习课程学习笔记(第二课第一周) 欢迎神经元和大脑神经网络发展大脑中的神经元神经网络高速发展的原因 需求预测举例-图像识别神经网络中的层更复杂的神经网络神经网络前向传播如何用代码实现推理TensorFlow 中的数据形式搭建一个神经网络…

吴恩达机器学习详细总结(三)

文章目录 9. 第九章 神经网络:学习(Neural Network:learning)9.1 代价函数9.2 反向传播算法(Backpropagation algorithm,BP)9.3 反向传播直觉9.4 实现注意:展开参数9.5 梯度检测&…

3.吴恩达机器学习--神经网络

本文旨在完成吴恩达机器学习的课后作业,搭建一个简单的神经网络来实现多分类问题,以手写数字识别为例。 1. 导入所需第三方库 from sklearn.datasets import load_digits import numpy as np import matplotlib.pyplot as plt2. 加载手写数字的数据集 …

【机器学习】python实现吴恩达机器学习作业合集(含数据集)

学习感言: 从3.7第一天开始,到今天4.4,一个多月的时间,陆续完成了听课,代码实现和总结博客,过程些许艰难,作为一个刚入门的学习者,收获了很多。总结一下这一段时间的学习过程吧。后…

机器学习(吴恩达)简要总结

机器学习知识简要总结 这里写目录标题 机器学习知识简要总结梯度下降法矩阵和向量多元线性回归:正规方程Normal equationlogistic回归过拟合问题正则化卷积神经网络模型选择和训练、验证、测试集评价指标无监督学习主成分分析 监督学习:给算法一个数据集…

吴恩达机器学习--线性回归

文章目录 前言一、单变量线性回归1.导入必要的库2.读取数据3.绘制散点图4.划分数据5.定义模型函数6.定义损失函数7.求权重向量w7.1 梯度下降函数7.2 最小二乘法 8.训练模型9.绘制预测曲线10.试试正则化11.绘制预测曲线12.试试sklearn库 二、多变量线性回归1.导入库2.读取数据3.…

吴恩达《机器学习》笔记

引言:个人当前研究倾向是智慧医疗,旨在通过信息科技的数据处理手段,解决当前医学界的问题。 学习初步思路:在师兄的指导下,初步的学习计划为理论与竞赛并行,即一方面补充基础知识,另一方面竞赛实…

吴恩达机器学习课程笔记一

吴恩达机器学习课程笔记 前言监督学习---Supervised learning无监督学习---Unsupervised learning聚类异常检测降维 增强学习---Reinforcement learning Linear regression一些机器学习的名词参考博客损失函数参考博客梯度下降的实现学习率alpha的选择学习率过小学习率过大 线性…

吴恩达机器学习--学习笔记

1. Introduction 1.1 Welcome 如今机器学习被大规模应用于: 数据挖掘(网站点击,医学记录,生物学,工程)一些无法通过编程实现的功能(自动驾驶,手写识别,NLP&#xff0c…

【吴恩达机器学习2022学习笔记】课程1 -- 机器学习基础

吴恩达大佬又重新录了机器学习视频,借此机会重温并做笔记简单记录一下。课程共分成三门,首先是机器学习基础。 课程链接:https://www.bilibili.com/video/BV19B4y1W76i/?spm_id_from333.788.recommend_more_video.1&vd_source337295bc6e…

机器学习(吴恩达)

定义:计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高,以跳棋游戏为例,经验E就是程序与自己下几万次跳棋,任务T就是玩跳棋,性能度量P就…

【机器学习】吴恩达机器学习Deeplearning.ai

机器学习已经强大到可以独立成为人工智能的一个子领域。 可以通过对机器编程实现比如执行网络搜索、理解人类语言、通过x光诊断疾病,或制造自动驾驶汽车。 机器学习定义 一般来说,给一个算法学习的机会越多,它的表现就越好。 机器学习的两种…

吴恩达机器学习(一)—— 简介

机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的…

吴恩达机器学习课后作业

目录 01-linear regression线性回归预备知识单变量线性回归( 一个特征值)单变量线性回归( 多个特征值)单变量线性回归( 正规方程) 01-linear regression 线性回归预备知识 假设函数与损失函数&#xff1a…

【吴恩达机器学习笔记】七、神经网络

✍个人博客:https://blog.csdn.net/Newin2020?spm1011.2415.3001.5343 📣专栏定位:为学习吴恩达机器学习视频的同学提供的随堂笔记。 📚专栏简介:在这个专栏,我将整理吴恩达机器学习视频的所有内容的笔记&…

吴恩达机器学习 2022新版

2022吴恩达机器学习 第一周 一. 机器学习的定义二. 机器学习的分类2.1. 监督学习【回归算法】【分类算法】 三. loss function3.1.损失函数公式 四. 梯度下降4.1.梯度下降算法4.2.理解梯度下降4.3.学习率的选择4.5.如何计算导数项? 一. 机器学习的定义 Arthur Samu…

【经典】吴恩达《机器学习》课程

如果要推荐《机器学习》的学习课程,那必然首选吴恩达的《机器学习》课程,无论是国内还是国外,这是最火的机器学习入门课程,没有之一。吴恩达老师用易于理解、逻辑清晰的语言对机器学习算法进行介绍,无数新手正是通过这…

吴恩达机器学习系列课程笔记——第一章:什么是机器学习(Machine Learning)

1.1 欢迎 https://www.bilibili.com/video/BV164411b7dx?p1 第一节主要讲了什么是机器学习,机器学习能做些什么事情。 机器学习是目前信息技术中最激动人心的方向之一。在这门课中,你将学习到这门技术的前沿,并可以自己实现学习机器学习的…

机器学习——吴恩达

机器学习——吴恩达 inductionSupervised learningUnsupervised learning modelexamplehow to workdefine cost functiongradient descent for minimizing the cost functionGradient descent for linear regression Matrix and Vector定义运算multiple feature linear regress…

吴恩达—机器学习的六个核心算法

吴恩达,华裔美国人,是斯坦福大学计算机科学系和电子工程系副教授,人工智能实验室主任。吴恩达是人工智能和机器学习领域国际上最权威的学者之一。他是百度的前副总裁兼首席科学家,最受欢迎的机器学习在线课程之一的创建者&#xf…