【线性分类器】线性分类器理论知识

article/2025/9/28 6:14:41

文章目录

    • 一、图像分类任务
    • 二、线性分类器:
        • 2.1 图像表示:
        • 2.2 损失函数:
            • 多类支持向量机损失:
        • 2.3 正则项与超参数:
            • K折交叉验证:
        • 2.4 优化算法:
            • 梯度下降法(SGD):
            • 随机梯度下降:
            • 小批量梯度下降法:

在这里插入图片描述

一、图像分类任务

计算机视觉中的核心任务,目的是根据图像信息中所反映的不同特征,把不同类别的图像区分开来。

图像分类:从已知的类别标签集合中为给定的输入图片选定一个类别标签。

image-20210926173911149

图像表示:像素表示(例如:RGB 表示);全局特征表示(例如GIST:从图像上抽取一些频率的特征,适用于风景类,室内场景,大场景);局部特征表示(例如 SIST 特征+词袋模型)

数据预处理:

image-20210927224035586
image-20210927224104329

分类器:近邻分类器、贝叶斯分类器、线性分类器、支持向量机分类器、神经网络分类器、随机森林、Adaboost

损失函数:0-1损失、多类支持向量机损失、交叉熵损失、L1损失、L2损失。损失函数输出通常是一个非负实值。

优化算法 (迭代优化):一阶函数(梯度下降、随机梯度下降、小批量随机梯度下降);二阶函数(牛顿法、BFGS、L-BFGS)

训练过程:数据集划分、数据预处理、数据增强、欠拟合与过拟合(减少算法复杂度、使用权重正则项、使用 droput 正则化)、超参数调整、模型集成

图像分类任务的评价指标:正确率(accuracy)=分对的样本数/ 全部样本数;错误率(error rate)=1-正确率;正确率分俩类:TOP1指标和TOP5指标
【模型评价指标】分析模型评价常用指标


二、线性分类器:

线性分类器是一种线性映射,将输入的图像特征映射为类别分数。

image-20210927173001044
数据集:CIFAR-10 是一个用于识别普适物体的小型数据集。一共包含 10 个类别的 RGB 彩色图 片:飞机、汽车、鸟类、猫、鹿、狗、蛙类、马、船和卡车。图片的尺寸为 32×32 ,数据集中一共有 50000 张训练圄片和 10000 张测试图片。

2.1 图像表示:

CIFAR-10中每一张图像转换为向量是32* 32 *3维列向量。x是图像向量,3072维;W是权值矩阵,维度10 *3072(权值看做一种模板,输入图像与评估模板的匹配程度越高,分类器输出分数越高);b是偏置向量,维度10 *1维;f 为得分向量,维度10 *1维。

image-20210927172434604

举例说明:
image-20210927172831612

2.2 损失函数:

损失函数搭建了模型性能与模型参数之间的桥梁,指导模型参数优化。

image-20210927181454488

多类支持向量机损失:

image-20210927182203780

image-20210927182401993max(0, .)损失常称为折页损失hingeloss

举例说明多类支持向量机损失Loss值的计算:

image-20210927182743861

image-20210927182900773

2.3 正则项与超参数:

image-20210927212657885

出现的问题:存在不同的 W 使得损失函数L = 0W 不唯一。

选择哪一个W ? 引入正则项:

正则项作用:1,使得唯一解;2,使得模型有偏好;3,使得模型不会过拟合

image-20210927213219329

超参:是在开始学习前需设置值的参数,而不是学习得到。超参一般都会对模型性能有着重要的影响。超参使用验证集调整。

L2 正则损失对大数值权值进行惩罚,喜欢分散权值,鼓励分类器将所有维度特征用起来,而不是强烈依赖其中少数几维特征。

举例:
image-20210927214455028
在这里插入图片描述

K折交叉验证:

如果数据很少,可能验证集包含样本就太少,从而无法统计上代表数据。

2.4 优化算法:

参数优化是机器学习的核心步骤之一,它利用损失函数的输出值作为反馈信号来调整分类器参数,以提升分类器对训练样本的预测性能。

损失函数L 是一个与参数W 有关的参数,优化的目标就是找到损失函数L 达到最优的那组参数W,说白了,就是求导数等于0时的W。(通常L 很复杂,很难直接求出W )

梯度下降法(SGD):

往哪走:负梯度方向;走多远:步长来决定(学习率)

随机梯度下降:

每次随机选择一个样本 Xi 计算损失并更新梯度

小批量梯度下降法:

每次随机选择m(批量的大小)个样本,并计算损失并更新梯度(m一般取2的幂次作为批量大小,例如32或64或128个样本)

例:选m为100,即每选一次m就迭代 iteration为1次;batch-size是一次迭代所使用的样本量即为mepoch:一个epoch表示所有样本被使用了一次

image-20210927222934198


http://chatgpt.dhexx.cn/article/hPy6R71g.shtml

相关文章

分类器的相关概念

昨天,人民网 发了一条八卦微博,盘点“雨神”(萧敬腾)是如何炼成的。微博称,网友统计发现,在萧敬腾 近年12次主要行程中,有10次他的“现身”让当地下起了雨,下雨的概率为83.3%。 图1 …

二类分类器构造多类分类器

from: http://tech.ddvip.com/2009-03/1238054080112304.html 从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器,即它只回答属于正类还是负类的问题。而现实中要解决的问题,往往是多类的问题(少部分例外&#xf…

KNN分类器

1.1 KNN的主要研究内容 (1)分类器的基本原理及算法内容 (2)利用现有的公开数据集(鸢尾花)实现分类器分类 (3)利用某种评价标准对分类结果进行分析评判 1.2分类的定义…

机器学习学习笔记(三)之分类器

分类器: 输入数据,识别是什么类,可以拓展为更广泛的用途。 将特征数据化,作为判断的依据。 和regression有相似的地方,但也有很大区别,把最好不把classification当作regression做 对于有多个分组的如cla…

分类器

分类器的作用:常规任务是利用给定的类别、已知的训练数据来学习分类规则和分类器,然后对未知数据进行分类(或预测)。逻辑回归(logistics)、SVM等常用于解决二分类问题,对于多分类问题&#xff0…

机器学习-分类-线性分类器

在一个机器学习任务中,如果每一条数据的目标值是离散的,则该任务是一个分类任务。 解决分类问题基本的方法有:线性分类器、决策树、朴素贝叶斯、人工神经网络、K近邻(KNN)、支持向量机(SVM)&am…

加密芯片大对比

市面上加密芯片,让人看的眼花缭乱,本文对各家加密芯片作了分析及对比 https://files.cnblogs.com/files/walta99/%E5%8A%A0%E5%AF%86%E8%8A%AF%E7%89%87%E5%A4%A7%E5%AF%B9%E6%AF%94.pdf 转载于:https://www.cnblogs.com/walta99/p/8484469.html

硬件加密芯片

TF32A09 芯片简介 产品描述 TF32A09系列芯片是同方股份有 限公司计算机系统本部自主研发的一 款高速度、高性能32位信息安全SoC 芯片。该芯片集成了高速的安全算法 和通讯接口,摒弃了传统的数据加解 密处理方式,使数据流加解密速度大 幅提升&#x…

芯片程序保护-常规芯片加密方式

芯片程序为什么要保护 针对于市场上越来越多的芯片解密方案的成熟和扩大,目前很对客户存在一个对于自己的产品会被同行或者其他竞争者抄袭的情况,对于硬件这块通常情况下是无法防止被抄的。但对于电路板的核心芯片和程序部分,是存在一些方式…

ATSHA204A加密芯片攻略——使用篇

ATSHA204A加密芯片是ATMEL公司研发的一款高安全性的,功能丰富的加密IC,使用SHA-256算法进行加密操作,内置16*32字节的slot(EEPROM)可以存储用户数据和秘钥,唯一的9字节序列号用于区分其他芯片,还有512bits的OTP区用于保…

硬件加密芯片介绍

同方股份有限公司计算机系统本部自主研发的一款高速度、高性能32位信息安全S高速加密芯片TF32A09系列。该系列芯片集成了高速的安全算法和通讯接口,摒弃了传统的数据加解密处理方式,使数据流加解密速度大幅提升,适用于高速数据流加密。 TF32A…

STM32芯片加密的方法

stm32加密方法: flash加密 96位ID号加密 96位id号 id校验 反汇编 Id存到数组,程序执行之前与数组之中的ID比较,如果相同继续执行,不同则终止执行 加密步骤: ①设计一套加密算法,利用MCU内部的unique ID作…

加密芯片十大品牌对比

加密芯片十大品牌对比 各大品牌加密芯片厂商都为各自的加密芯片定了型号,用户在进行加密芯片的选型时,如果没有明确的参考依据,很难效率而准确的选取到合适的加密芯片。作者结合自身经验,为大家提供一些简单实用的加密芯片选型建…

芯片加密与解密技术方法

目录: 一、简介 二、硅芯片安全措施的演变 三、总结 ------------------------------------------------------------------------------------------------------------- 一、简介 IC集成电路在早期,除法律和经济外,几乎没有保护措施…

His系统简介、医院信息系统(Hospital Information System

医院信息系统(Hospital Information System)是利用计算机技术、网络及通讯技术、多媒体技术,快速、准确、有效地整合医院业务信息和管理信息,实现医院信息最大限度的采集、传输、存储,从而使医院内部资源最有效的利用和…

开源项目-his医院信息系统

哈喽,大家好,今天给大家带来的开源系统是-his医院信息系统 系统主要有收费管理,药房管理,医生工作站,基础信息,统计等模块 登录 角色管理 部门管理 药品类别 药品编码 药品库存 需求计划表

医院信息系统(HIS)的“一个都不能少”!

本文由Markdown语法编辑器编辑完成。 1. 《一个都不能少》 《一个都不能少》是1999年上映的一部剧情片,由张艺谋导演拍摄。该片使用一班非专业演员制作一出像纪录片的电影,故事主题是关于农村、贫穷及文盲的问题。本片获得十项国际电影奖项,…

分享 | 医院常见的HIS、CIS、LIS、EMR、PACS、RIS都是指哪些系统?

随着医疗卫生体制改革,卫生系统的信息化建设步伐也进一步加快,医院信息系统已成医院必不可少的基础设施与技术环境。60年代初美国、日本、欧洲各国开始建立医院信息系统。到70年代已建成许多规模较大的医院信息系统。例如,瑞典首都斯德哥尔摩…

大型医院信息系统HIS源码 HIS系统全套源码

源码开发环境:VS2013sql2012 C/S架构 HIS主要模块介绍: 门急诊挂号:提供门诊号表处理,科室排班、退换号处理,门诊病人统计功能,门急诊挂号收费核算功能,支持医保、公费、自费等多种身份的病人…

医院HIS系统哪家好?

HIS系统哪家好?经常会有医院领导这样问,在回答这个问题前,我们需要先明确一个问题:好的标准是什么? 好的标准:好与不好实际上是一种心理感受,这种心理感受会包括很多方面,比如品牌好…