机器学习基石-林轩田-第一周笔记

article/2025/11/7 2:14:21

Lecture 01 - The Learning Problem

  • When Can Machine Learn ?
  • Why Can Machine Learn ?
  • How Can Machine Learn ?
  • How Can Machine Learn Better ?

What is Machine Learning

什么是“学习”?学习就是人类通过观察、积累经验,掌握某项技能或能力。就好像我们从小学习识别字母、认识汉字,就是学习的过程。而 机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规律,获得某种分析问题、解决问题的能力。

From Learning to Machine Learning

机器学习可以被定义为:Improving some performance measure with experence computed from data. 也就是机器从数据中总结经验,从数据中找出某种规律或者模型,并用它来解决实际问题。

A More Concrete Definition

什么情况下会使用机器学习来解决问题呢?其实,目前机器学习的应用非常广泛,基本上任何场合都能够看到它的身影。其应用场合大致可归纳为三个条件:

Key Essence of Machine Learning

  • 事物本身存在某种潜在规律。
  • 某些问题难以使用普通编程解决。
  • 有大量的数据样本可供使用。

Applications of Machine Learning

机器学习在我们的 教育娱乐 等各个方面都有着广泛的应用,我们的生活处处都离不开机器学习。比如,打开购物网站,网站就会给我们自动推荐我们可能会喜欢的商品;电影频道会根据用户的浏览记录和观影记录,向不同用户推荐他们可能喜欢的电影等等,到处都有机器学习的影子。

Components of Machine Learning

本系列的课程对机器学习问题有一些基本的术语需要注意一下:

  • 输入 x x
  • 输出 y y
  • 目标函数 f f ,即最接近实际样本分布的规律。
  • 训练样本 data d a t a
  • 假设 hypothesis h y p o t h e s i s ,一个机器学习模型对应了很多不同的 hypothesis h y p o t h e s i s ,通过演算法 A A ,选择一个最佳的 hypothesis h y p o t h e s i s 对应的函数称为 g g g g 能最好地表示事物的内在规律,也是我们最终想要得到的模型表达式。

Basic Notations

对于理想的目标函数 f f ,我们是不知道的,我们手上拿到的是一些训练样本 D D ,假设是监督式学习,其中有输入 x x ,也有输出 y y 。机器学习的过程,就是根据先验知识选择模型,该模型对应的 hypothesis set h y p o t h e s i s s e t (用 H H 表示), H H 中包含了许多不同的 hypothesis h y p o t h e s i s ,通过演算法 A A ,在训练样本 D D 上进行训练,选择出一个最好的 hypothes h y p o t h e s ,对应的函数表达式 g g 就是我们最终要求的。一般情况下, g g 能最接近目标函数 f f ,这样,机器学习的整个流程就完成了。

Learning Flow

Machine Learning and Other Fields

与机器学习相关的领域有:

  • 数据挖掘(Data Mining)
  • 人工智能(Artificial Intelligence)
  • 统计(Statistics)

其实,机器学习与这三个领域是相通的,基本类似,但也不完全一样。机器学习是这三个领域中的有力工具,而同时,这三个领域也是机器学习可以广泛应用的领域,总得来说,他们之间没有十分明确的界线。

总结

本节课主要介绍了什么是机器学习,什么样的场合下可以使用机器学习解决问题,然后用流程图的形式展示了机器学习的整个过程,最后把机器学习和数据挖掘、人工智能、统计这三个领域做个比较。

参考

  1. 台湾大学林轩田机器学习基石课程学习笔记1 – The Learning Problem

http://chatgpt.dhexx.cn/article/HQT5Hc93.shtml

相关文章

机器学习基石16:三个重要原则(Three Learning Principles)

本节介绍了机器学习中三个重要原则,包括奥卡姆剃刀原理,样本偏差,数据窥探;并对16课程所学知识进行了总结。 系列文章 机器学习基石01:机器学习简介 机器学习基石02:感知器算法(Perceptron Alg…

机器学习基石1(ML基本概念和VC dimension)

文章目录 一、什么是机器学习?二、什么时候可以使用机器学习?三、感知机perceptron四、机器学习的输入形式五、机器真的可以学习吗?六、vc dimension 一、什么是机器学习? 其实第一个问题和第二个问题是穿插到一块儿回答的,首先机器学习要解决的是常规…

Wireshark抓包数据

首先官网下载Wireshark,下载好后,用浏览器打开桂林生活网,无需注册,输入账号密码。 打开Wireshark,用命令提示符查看本机ip 在Wireshark的过滤搜索中输入ip10.34.152.44,找到http类型的数据查看&#xff0…

Wireshark抓包数据分析

文章目录 准备数据链路层实作一 熟悉 Ethernet 帧结构实作二 了解子网内/外通信时的 MAC 地址实作三 掌握 ARP 解析过程 网络层实作一 熟悉 IP 包结构实作二 IP 包的分段与重组实作三 考察 TTL 事件 传输层实作一 熟悉 TCP 和 UDP 段结构实作二 分析 TCP 建立和释放连接 应用层…

网络数据包分析与抓取

多年的网络数据包分析与抓取经验,闲话少说,上干货。先列举数据包的种类:1、Http数据包;2、UDP数据包;3、TCP数据包;4、ARP数据包;其实数据包的概念是很泛的,在软件可逆领域&#xff…

如何进行数据的抓包

抓包 抓包就是对网络传输中发送与接收的数据包进行截获、重发、编辑、转存等操作。 前提:抓取的数据包是从网卡设备中进行抓取的; win wiresharkLinux tcpdump命令 从上图我们就可以了解到tcpdump就是我们使用的一个工具; 我们在使用它时有…

WireShark基本抓包数据分析

WireShark抓包数据分析: 1、TCP报文格式 源端口、目的端口:16位长。标识出远端和本地的端口号。 顺序号:32位长。表明了发送的数据报的顺序。 确认号:32位长。希望收到的下一个数据报的序列号。 TCP协议数据报头DE 头长&#xff…

网络抓包及分析

今天我们主要来讲一下网络抓包的教程,我们用WireShark来说明 我们先说明下抓包工具界面 我们现在本地机子上用上面两个比较多 上面是抓无线网卡,就是你访问外网的包 下面是抓环回地址 ,就是你访问127.0.0.1或localhost的包 我们抓上面WLAN…

Wireshark数据抓包分析之UDP协议

目录 预备知识1.UDP协议概述2.什么是UDP协议3.UDP协议的特点 实验目的实验环境实验步骤一1.配置TCP&UDP测试工具2.配置服务器端3.配置客户端4.获取UDP数据包 实验步骤二1.UDP首部格式2.分析UDP数据包 预备知识 1.UDP协议概述 UDP是User Datagram Protocol(用户…

常见的几种网络抓包及协议分析工具

常见的几种网络抓包及协议分析工具 引言 网络工程师必备技能-抓取网络数据。 在本篇博客中,我们将集中记下几个问题进行探讨: 如何抓取电脑本机发送/接收的网络数据?如何在主机 A 上抓取 主机 B 上的网络数据?如何使用第三方设…

WireShark抓包分析

简述:本文介绍了抓包数据含义,有TCP报文、Http报文、DNS报文。如有错误,欢迎指正。 1、TCP报文 TCP:(TCP是面向连接的通信协议,通过三次握手建立连接,通讯完成时要拆除连接,由于TCP …

抓包分析数据(Charles以及HttpCanary)

在开发小程序时,我们经常需要检查线上的请求,但是小程序并没有提供这方面的入口,本文为大家详细说一下我工作中使用到的关于抓包的经验,包括pc配合手机以及直接用手机抓包 一.pc配合手机实现抓包(Charles)…

wireshark抓包分析TCP数据包

1、直接从TCP的三次握手开始说起 三次握手就是客户与服务器建立连接的过程 客户向服务器发送SYN(SEQx)报文,然后就会进入SYN_SEND状态服务器收到SYN报文之后,回应一个SYN(SEQy)ACK(ACKx1&…

wireshark抓ping数据包以及简单分析

目录 相关知识 1.Ping原理 2.ICMP报文协议 3.wireshark 一、wireshark抓数据包 二、报文分析 三、总结 相关知识 1.Ping原理 Ping是一句DOS 命令,一般用于检测网络通与不通 ,也叫时延,其值越大,速度越慢 PING (Packet Inte…

wireshark抓包数据:理解与分析

注明:本文为原创文章,转载请注明出处。参考文章见本文末尾。 wireshark是一个非常好用的抓包工具,本文根据平时抓包经验,对之前wireshark抓包的一些常见知识点进行了整理。 有不当之处,欢迎指正 1.SYN,F…

WireShark抓包后数据分析

在分析数据之前,我们先了解一下我们传输数据的结构体系,如下图: 这是两种体系,我们常用的一般都是TCP/IP体系结构。 TCP/IP体系架构分析 不难发现,TCP/IP体系中包含着很多我们熟悉的协议,比如说&#xff1…

Wireshark --> 抓包(网络分析)工具

前言 贴一张wireshark抓包的总图,便于理解分析网络分层 ​ 为了让大家更容易「看得见」 TCP,我搭建不少测试环境,并且数据包抓很多次,花费了不少时间,才抓到比较容易分析的数据包。 接下来丢包、乱序、超时重传、…

Wireshark抓包工具使用以及数据包分析

多年之后,愿你有清风与烈酒,也有人是你的归途。 打开Wireshark抓包工具开始抓包会看到如下展开内容: 这里我是对wlan进行抓包,192.168.2.112是我当前wifi的ip地址。 点击某个包,可以查看具体内容,差不多刚…

使用wireshark抓网络报文(抓包)并分析其中数据

如何使用wireshark抓网络报文(抓包) 1、 物理层数据帧2、 数据链路层以太网帧头部信息3、 互联网层 IP 包头部信息4、 传输层 TCP 数据段头部信息 本文包内容分析转载自下午茶的芬芳,感谢作者的分享。 网络下载好wireshark打开软件按下开始捕…

wireshark抓包分析数据怎么看 wireshark使用教程

大家都知道Wireshark是非常流行且知名的网络抓包数据分析工具,可以截取各种网络数据包,并显示数据包详细信息,常用于开发测试过程各种问题定位、网络故障排查等情况。但是很多网友不清楚如何使用Wireshark抓包看数据,下面IT备忘录…