【机器学习】机器学习基石-林轩田-1-机器学习介绍

article/2025/11/7 0:21:42

机器学习基石-1-机器学习介绍

  • 本节内容
  • What is Machine Learning?
  • What is skill?
  • Why use machine learning?
  • When use machine learning?
  • Key Essence of Machine Learning
  • Fun Time
  • Applications of Machine Learning
  • Components of Machine Learning
    • 相关术语
    • Leaning Flow (for Credit Approval)
  • Fun Time
  • Machine Learning and Other Fields
    • 数据挖掘(Data Mining)
    • 人工智能(Artificial Intelligence)
    • 统计(Statistics)

本节内容

本节课主要介绍了什么是机器学习,什么样的场合下可以使用机器学习解决问题,然后用流程图的形式展示了机器学习的整个过程,最后把机器学习和数据挖掘、人工智能、统计这三个领域做个比较。

What is Machine Learning?

学习就是人类通过观察、积累经验,掌握某项技能或能力。就好像我们从小学习识别字母、认识汉字,就是学习的过程。

机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规律,获得某种分析问题、解决问题的能力。

机器学习可以被定义为:Improving some performance measure with experence computed from data. 也就是机器从数据中总结经验,从数据中找出某种规律或者模型,并用它来解决实际问题。
在这里插入图片描述

What is skill?

在这里插入图片描述

Why use machine learning?

考虑编写一个应用:树木种类识别,如果实现编写一套判断树的代码,因为世界上树的种类太过繁多,可能需要很多工作量,并且在之后发现新树时,需要更新维护该代码,工作量很大且效果不好。

如果使用机器学习来实现树木种类识别,让机器先学习大量的数据(观察)得到经验后,树的识别效果可能更好。

When use machine learning?

什么情况下会使用机器学习来解决问题呢?其实,目前机器学习的应用非常广泛,基本上任何场合都能够看到它的身影。比如:

1 当人类没办法做一个复杂的系统,将所有的规律都写清楚。——比如机器人探测火星,没办法预测机器人在火星上会遇到什么情况,例如遇到坑,要怎么办,这就需要机器自己去学习怎么处理
2 没办法定义一个规则的时候——语音/可视化识别
3 人类无法快速进行决策的时候——股市交易
4 在大规模的数据下一个用户取向的问题——用户个性化的市场
在这里插入图片描述

Key Essence of Machine Learning

大致可归纳为三个条件:

1 事物本身存在某种潜在规律
2 某些问题难以使用普通编程解决
3 有大量的数据样本可供使用
在这里插入图片描述

Fun Time

在这里插入图片描述

Applications of Machine Learning

机器学习在我们的衣、食、住、行、教育、娱乐等各个方面都有着广泛的应用,我们的生活处处都离不开机器学习。比如,打开购物网站,网站就会给我们自动推荐我们可能会喜欢的商品;电影频道会根据用户的浏览记录和观影记录,向不同用户推荐他们可能喜欢的电影等等,到处都有机器学习的影子。
在这里插入图片描述

Components of Machine Learning

Metaphor Using Credit Approval
在这里插入图片描述

相关术语

输入 x
输出 y
目标函数 f
即最接近实际样本分布的规律
训练样本 data
假设 hypothesis
一个机器学习模型对应了很多不同的hypothesis,通过演算法A,选择一个最佳的hypothesis对应的函数称为g,g能最好地表示事物的内在规律,也是最终想要得到的模型表达式。
在这里插入图片描述

Leaning Flow (for Credit Approval)

对于理想的目标函数f,我们是不知道的,我们手上拿到的是一些训练样本D,假设是监督式学习,其中有输入x,也有输出y。机器学习的过程,就是根据先验知识选择模型,该模型对应的hypothesis set(用H表示),H中包含了许多不同的hypothesis,通过演算法A,在训练样本D上进行训练,选择出一个最好的hypothes,对应的函数表达式g就是我们最终要求的。一般情况下,g能最接近目标函数f,这样,机器学习的整个流程就完成了。
在这里插入图片描述
在这里插入图片描述

Fun Time

在这里插入图片描述

Machine Learning and Other Fields

与机器学习相关的领域有:

数据挖掘(Data Mining)

在这里插入图片描述

人工智能(Artificial Intelligence)

机器学习是实现人工智能的一种方式。
在这里插入图片描述

统计(Statistics)

在这里插入图片描述

其实,机器学习与这三个领域是相通的,基本类似,但也不完全一样。机器学习是这三个领域中的有力工具,而同时,这三个领域也是机器学习可以广泛应用的领域,总得来说,他们之间没有十分明确的界线。


http://chatgpt.dhexx.cn/article/aKGn0m0x.shtml

相关文章

机器学习基石 作业0

机器学习基石 作业0 1 Probability and Statistics2 Linear Algebra3 Caculus网上没找到作业0的答案,这是自己做的版本,有一些可能会有错误,欢迎讨论。 1 Probability and Statistics 用数学归纳法。N=1时满足,假定N=n满足,当N=n+1同样满足。得证。 10个挑4个正面 C 10 4…

机器学习基石 作业三

机器学习基石 作业三 代入计算 线性回归得到的映射函数 H H H的性质问题。显然映射多次与映射一次效果一样。其它的可以根据 H H H的性质,秩为d+1,显然不可逆。特征值的部分不是非常清楚,大概是根据 I − H I-H I−H的迹等于 N − ( d + 1 ) N-(d+1) N−(d+1)得到的。3. PLA…

机器学习基石笔记

文章目录 一. 机器学习什么时候用二. 机器学习的基本流程三. 什么是机器学习四. 机器学习的可行性NFL定理从统计学中找到可行的方法统计学与机器学习产生联系 一. 机器学习什么时候用 事物本身存在某种潜在规律某些问题难以使用普通编程解决有大量的数据样本可供使用 二. 机器…

机器学习基石 作业二

机器学习基石 作业二 1 计算一下本来预测对与预测错时加上噪音导致的错误率然后相加即可。 2 选择一个 λ \lambda λ的值让 μ \mu μ的系数为0。 3 根据VC bound 公式带入计算即可,N=46000的时候error最接近0.05。下面的代码可以计算不同的N与目标error之间的差距。 def …

机器学习基石2-Learning to Answer Yes-No

注: 文章中所有的图片均来自台湾大学林轩田《机器学习基石》课程。 笔记原作者:红色石头 微信公众号:AI有道 上节课,简述了机器学习的定义及其重要性,并用流程图的形式介绍了机器学习的整个过程:根据模型\(…

机器学习基石-林轩田-第一周笔记

Lecture 01 - The Learning Problem When Can Machine Learn ?Why Can Machine Learn ?How Can Machine Learn ?How Can Machine Learn Better ? What is Machine Learning 什么是“学习”?学习就是人类通过观察、积累经验,掌握某项技能或能力。就…

机器学习基石16:三个重要原则(Three Learning Principles)

本节介绍了机器学习中三个重要原则,包括奥卡姆剃刀原理,样本偏差,数据窥探;并对16课程所学知识进行了总结。 系列文章 机器学习基石01:机器学习简介 机器学习基石02:感知器算法(Perceptron Alg…

机器学习基石1(ML基本概念和VC dimension)

文章目录 一、什么是机器学习?二、什么时候可以使用机器学习?三、感知机perceptron四、机器学习的输入形式五、机器真的可以学习吗?六、vc dimension 一、什么是机器学习? 其实第一个问题和第二个问题是穿插到一块儿回答的,首先机器学习要解决的是常规…

Wireshark抓包数据

首先官网下载Wireshark,下载好后,用浏览器打开桂林生活网,无需注册,输入账号密码。 打开Wireshark,用命令提示符查看本机ip 在Wireshark的过滤搜索中输入ip10.34.152.44,找到http类型的数据查看&#xff0…

Wireshark抓包数据分析

文章目录 准备数据链路层实作一 熟悉 Ethernet 帧结构实作二 了解子网内/外通信时的 MAC 地址实作三 掌握 ARP 解析过程 网络层实作一 熟悉 IP 包结构实作二 IP 包的分段与重组实作三 考察 TTL 事件 传输层实作一 熟悉 TCP 和 UDP 段结构实作二 分析 TCP 建立和释放连接 应用层…

网络数据包分析与抓取

多年的网络数据包分析与抓取经验,闲话少说,上干货。先列举数据包的种类:1、Http数据包;2、UDP数据包;3、TCP数据包;4、ARP数据包;其实数据包的概念是很泛的,在软件可逆领域&#xff…

如何进行数据的抓包

抓包 抓包就是对网络传输中发送与接收的数据包进行截获、重发、编辑、转存等操作。 前提:抓取的数据包是从网卡设备中进行抓取的; win wiresharkLinux tcpdump命令 从上图我们就可以了解到tcpdump就是我们使用的一个工具; 我们在使用它时有…

WireShark基本抓包数据分析

WireShark抓包数据分析: 1、TCP报文格式 源端口、目的端口:16位长。标识出远端和本地的端口号。 顺序号:32位长。表明了发送的数据报的顺序。 确认号:32位长。希望收到的下一个数据报的序列号。 TCP协议数据报头DE 头长&#xff…

网络抓包及分析

今天我们主要来讲一下网络抓包的教程,我们用WireShark来说明 我们先说明下抓包工具界面 我们现在本地机子上用上面两个比较多 上面是抓无线网卡,就是你访问外网的包 下面是抓环回地址 ,就是你访问127.0.0.1或localhost的包 我们抓上面WLAN…

Wireshark数据抓包分析之UDP协议

目录 预备知识1.UDP协议概述2.什么是UDP协议3.UDP协议的特点 实验目的实验环境实验步骤一1.配置TCP&UDP测试工具2.配置服务器端3.配置客户端4.获取UDP数据包 实验步骤二1.UDP首部格式2.分析UDP数据包 预备知识 1.UDP协议概述 UDP是User Datagram Protocol(用户…

常见的几种网络抓包及协议分析工具

常见的几种网络抓包及协议分析工具 引言 网络工程师必备技能-抓取网络数据。 在本篇博客中,我们将集中记下几个问题进行探讨: 如何抓取电脑本机发送/接收的网络数据?如何在主机 A 上抓取 主机 B 上的网络数据?如何使用第三方设…

WireShark抓包分析

简述:本文介绍了抓包数据含义,有TCP报文、Http报文、DNS报文。如有错误,欢迎指正。 1、TCP报文 TCP:(TCP是面向连接的通信协议,通过三次握手建立连接,通讯完成时要拆除连接,由于TCP …

抓包分析数据(Charles以及HttpCanary)

在开发小程序时,我们经常需要检查线上的请求,但是小程序并没有提供这方面的入口,本文为大家详细说一下我工作中使用到的关于抓包的经验,包括pc配合手机以及直接用手机抓包 一.pc配合手机实现抓包(Charles)…

wireshark抓包分析TCP数据包

1、直接从TCP的三次握手开始说起 三次握手就是客户与服务器建立连接的过程 客户向服务器发送SYN(SEQx)报文,然后就会进入SYN_SEND状态服务器收到SYN报文之后,回应一个SYN(SEQy)ACK(ACKx1&…

wireshark抓ping数据包以及简单分析

目录 相关知识 1.Ping原理 2.ICMP报文协议 3.wireshark 一、wireshark抓数据包 二、报文分析 三、总结 相关知识 1.Ping原理 Ping是一句DOS 命令,一般用于检测网络通与不通 ,也叫时延,其值越大,速度越慢 PING (Packet Inte…