【ML】 基本概念

article/2025/11/9 19:52:52

ML 基本概念

    • 1. different types of functions
    • 2. how to find the function - training data
    • 3. unseen during training
    • 4. Back to ML Framework
      • 4.1 Step1: function with unknown
      • 4.2 Step2: define loss from training data
      • 4.3 step3: optimization
      • 4.4 其他
        • 4.4.1 Sigmoid → ReLU
        • 4.4.2 more variety of models
    • 5. 神经网络 → 深度学习?!

Machine Learning ~ looking for function

1. different types of functions

  • Regression: output a scalar

  • Classification: classes → correct one

  • 黑暗大陆:structured learning - 创造

2. how to find the function - training data

  1. function with unknown parameters - Model
    y = b + w x 1 y = b+wx_1 y=b+wx1
    based on domain knowledge

    w and b are unknown parameters(learned from data)

    x1 - features

    w - weight

    b - bias

  2. Define Loss from Training data

    Loss is a function of parameters. Loss means how good a set of values is.
    L ( b , w ) = Σ 1 n e n L(b,w)=\Sigma\frac{1}{n}e_n L(b,w)=Σn1en
    e: 预计值与真实值(Label)间的差距,计算方法很多

    • MAE: mean absolute error
      y = ∣ y − y ^ ∣ y = |y-\widehat{y}| y=yy

    • MSE: mean square error

  3. Optimization

    Gradient Descent

    image-20230103161403776
    • hyperparameters

    直到微分为0或你已经失去耐心

    问题非常明显:并未找到真正的global minima而是停留在一个Local minima.

    但事实上,Local minima是个伪命题,后续详谈。

    推广至两个参数:

    image-20230103161906471

    直观来看

    image-20230103162128862

3. unseen during training

观察到7天一循环 于是

image-20230103172614074

这样的模型叫做Linear models. 这样简单的线性关系有Model Bias,我们需要更flexible的模型

All piecewise linear curves =

image-20230104165211017

piecewise linear curve(hard Sigmoid)可以用来逼近continuous curve

image-20230104170421424

x1趋近正无穷,y趋近于c;x趋近于负无穷,y趋近于0.

不同的w c b造出不同的sigmoid function,叠加出复杂的piecewise linear curve,从而逼近各种曲线

image-20230104170810137

于是我们可以通过如下含有不同参数的公式,来逼近

image-20230104171037737

推广至多天(more features)

image-20230104190306798

4. Back to ML Framework

4.1 Step1: function with unknown

每个 i 表示蓝色的function(hyperparameter),j表示features

image-20230104191400806

image-20230104191600846

image-20230104191803146

image-20230104191847102

综上,用线性代数的矩阵表示

image-20230104192025743

把unknown parameters拉直拼成一个长向量

image-20230104192538112

4.2 Step2: define loss from training data

只不过现在Loss的参数多了
L ( θ ) L(\theta) L(θ)
Loss means how good a set of values is.

image-20230104193746002

4.3 step3: optimization

gradient 求梯度,并更新参数

image-20230104194549272

image-20230104194733599

直到不想做了/得到零向量(实际上不太可能)

image-20230104195044320

至于为什么要分成一个一个的batch(多少个也是hyperparameter),后续详谈

4.4 其他

4.4.1 Sigmoid → ReLU

两个ReLU叠加起来成为一个Hard sigmoid

image-20230104200123169

image-20230104200404439

(max效果较好,原因以后详谈)

4.4.2 more variety of models

反复多做几次(几次,又是一个hyperparameter)

image-20230104200914251

5. 神经网络 → 深度学习?!

image-20230105202441532

image-20230105202533671

overfitting: Better on training data, worse on unseen data.

image-20230105203027836


http://chatgpt.dhexx.cn/article/r9YMOAPy.shtml

相关文章

R语言机器学习mlr3:基础使用

获取更多R语言和生信知识,请关注公众号:医学和生信笔记。 公众号后台回复R语言,即可获得海量学习资料! 目录 创建任务创建learner训练、预测和性能评价 本篇主要介绍mlr3包的基本使用。 一个简单的机器学习流程在mlr3中可被分解为…

推荐广告之-MLR学习

算法简介: 该算法是阿里的盖坤大神力作:Learning Piece-wise Linear Models from Large Scale Data for Ad Click Prediction,介绍了阿里广告的一个主要ctr预估模型Large Scale Piece-wise Linear Model (LS-PLM),在2012年就开始使…

推荐系统与深度学习(十五)——LS-PLM(MLR)模型原理

公众号后台回复“图书“,了解更多号主新书内容 作者:livan 来源:数据Python与算法 模型原理 CTR预估的发展过程中,LR模型是比较常用的方法,因为其计算量小容易并行,工业上应用非常广泛,同时也引…

基于R语言中的mlr以及Python中的sklearn的逻辑回归算法实战

逻辑回归算法在Python和R语言中的实现 基于R语言中的mlr、tidyverse进行逻辑回归算法实战逻辑回归是什么? 建立一个逻辑回归模型特征工程与特征选择数据可视化 对缺失值进行处理输出混淆矩阵 准确率、查准率、召回率、f1值、fpr、fnr上述逻辑回归模型总结&#xff1…

多元线性回归MLR多变量预测模型,多变量输入结构,可以拟合出方程,评价指标包括:R2、MAE、MSE、RMSE等,代码质量极高,方便学习和替换数据。

%% 清空环境变量 warning off % 关闭报警信息 close all % 关闭开启的图窗 clear % 清空变量 clc % 清空命令行 %% %% 导入数据 resxlsread(数据集.xlsx); %% 数据分析 num_size 0.7; …

深度学习与推荐系统(十五)——LS-PLM(MLR)模型

CTR预估的发展过程中,LR模型是比较常用的方法,因为其计算量小容易并行,工业上应用非常广泛,同时也引发了各位大佬基于LR模型的优化改进,这一改进通常有两个方向,一个是走融合路,即GBDTLR样式&am…

MLIR (Multi-Level Intermediate Representation)

MLIR 意思为:多级中间表示,是一种新的IR表示。MLIR 是 LLVM 项目的子项目。 MLIR 是一种新型的编译器框架,其设计中参考了已有的编译器优点,规避了一些缺陷。包括了中间表示的定义、转换以及优化等功能,极大地方便了新…

回归算法总结——SLR、MLR、PCR、PLS

PCR参考链接:【建模应用】PCA主成分分析原理详解 - pigcv - 博客园 PLS参考链接:【建模应用】PLS偏最小二乘回归原理与应用 - pigcv - 博客园

PCA-APCA-MLR

全称 principal component analysis-absolute principal component score-multiple linear regression 原理 绝对因子分析/多元线性回归受体模型(APCS—MLR)的基本原理是将因子分析的主因子得分转化为绝对主因子得分(APCS),各指标含量再分别对所有的APCS进行多元线性回…

回归预测 | MATLAB实现MLR多元线性回归预测(多指标评价)

回归预测 | MATLAB实现MLR多元线性回归预测(多指标评价) 目录 回归预测 | MATLAB实现MLR多元线性回归预测(多指标评价)预测效果基本介绍模型描述程序设计参考资料预测效果 基本介绍 回归预测 | MATLAB实现MLR多元线性回归预测(多指标评价) 模型描述 多元线性回归(Multip…

【ML】机器学习模型之PMML--概述

机器学习模型的应用一般会经历两个主要过程: 1、离线开发2、线上部署 离线部分负责模型训练和导出模型,线上部分负责导入模型并且做预测。 以上图片来自:https://zhuanlan.zhihu.com/p/30378213 一、PMML简要介绍 PMML(Predic…

基于 mlr 包的逻辑回归算法介绍与实践

逻辑回归是基于概率分类的有监督学习算法,它依赖于直线方程,产生的模型非常容易解释和交流。在其最简单的形式中,逻辑回归被用来预测二分类问题,但算法的变体也可以处理多个类。 逻辑回归算法通常应用于二分类问题,称为二项逻辑回归 (binomial logistic regression),当处…

利用R语言中的tidyverse和mlr建立分类算法-KNN

基于相似性的k近邻分类 KNN(K-Nearest Neighbors)算法是一种基本的分类和回归算法,它是一种非参数算法,可以用于分类和回归问题。它的基本思想是利用已有的数据集对新的数据进行分类或回归。 在分类问题中,KNN算法通…

MLR原理及deepctr组网实现MLR

文章目录 MLRdeepctr实现MLR MLR https://zhuanlan.zhihu.com/p/100532677 https://blog.csdn.net/fyneru_xiaohui/article/details/106390266 deepctr实现MLR import os, warnings, time, sys import pickle import matplotlib.pyplot as plt import pandas as pd, numpy a…

R手册(Machine Learning)--mlr (Part 2)

文章目录 Configuration (配置)Parallelization (并行)Imputation (插补)Feature Extraction (特征提取)1. Feature filtering(特征筛选)2. Feature selection(特征选择) Benchmarking (基准点)Visualization (可视化)Wrappers (封装器)Nested Resampling (嵌套重采样)Ensemble…

R手册(Machine Learning)--mlr(Part 1)

文章目录 IntroductionPreprocessing data (预处理)Task and Learner1. Create a task2. Making a learner Training & Testing (训练和测试)1. Setting hyperparameters (设置超参数)2. Train a model and predict (训练模型和预测)3. Measuring performance (模型评估质量…

基于EEMD+GRU+MLR的时间序列预测

0、前言 文章《基于 EEMD-GRU-MLR 的短期电力负荷预测》中,通过构建集合经验模态分解(ensemble empirical modedecomposition,EEMD)以及门控循环单元神经网络(gated recurrent unit neural network,GRU)和多元线性回归(multiplelinear regres…

机器学习的R实现(mlr包)

目录 Machine Learning with MLR Package 1. 获取数据 2. 探索数据 3. 缺失值填补 4. 特征工程 5. 机器学习 1. 二次判别分析,Quadratic Discriminant Analysis (QDA). 2.逻辑回归 Logistic Regression 3. 决策树-Decision Tree 4. 随机森林,Ra…

机器学习之MLR

线性回归(Linear regression)是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为一元回归,大于一个自变量情…

MLR(mixed logistic regression)模型

基本形式 MLR模型是阿里巴巴12年提出(17年发表)点击率预估模型,它利用分段方式对数据进行拟合,相比LR模型,能够学习到更高阶的特征组合。其基本表达式如下 p ( y 1 ∣ x ) g ( ∑ j 1 m σ ( u j T x ) η ( w j …