机器学习之特征提取

article/2025/8/30 4:20:03

机器学习之特征提取

1.为什么要特征提取
原始数据常常是高维的,其中包含了许多冗余信息或者十分稀疏或者计算量大,拿原始数据来训练可行,但是往往直接训练是低效的。所以特征提取往往是必要的。

注:特征提取主要是为了解决下面三个问题,(1)原始数据特征中的强相关性造成的冗余信息。(2)原始数据十分稀疏。(3)原始数据维度巨大

2.特征提取的主要方法。

  • 主成分分析(PCA)
    主成分分析是特征提取中的常用方法,用于数据降维,目的是通过线性变换将原始数据变换为一组各维度线性无关的表示,核心思想n维特征映射到k维空间上k<n,这k维特征是全新的正交特征

核心思想: 最大方差理论,在信号处理中认为信号具有较大的方差,噪声有较小的方差,信噪比就是信号与噪声的方差比,越大越好。因此我们认为,最好的k维特征是将n维样本点变换为k维后,每一维上的样本方差都尽可能的大。
具体思想到推理,给出了一个很好的过程。
在这里插入图片描述

PCA算法的优缺点。

  • LDA线性判别

详细推导
LDA是将通过投影的方法,投影到维度更低的空间,使得投影后的点,会形成按类别区分,相同类别的点,将会在投影后更接近,不同类别的点距离越远。
LDA的思想是设法将样本投影到一条直线上,使得:

  • 同类样本的投影点尽可能近

  • 异类样本的投影点尽可能远

  • 3. ICA独立成分分析
    ICA历史:是20世纪90年代发展起来的一种新的信号处理技术,它是从多维统计数据中找出隐含因子或分量的方法。从线性变换和线性空间角度,源信号为相互独立的非高斯信号,可以看作线性空间的基信号,而观测信号则为源信号的线性组合,ICA就是在源信号和线性变换均不可知的情况下,从观测的混合信号中估计出数据空间的基本结构或者说源信号。

ICA独立成分分析是从多元(多维)统计数据中寻找潜在因子或成分的一种方法.ICA与其它的方法重要的区别在于,它寻找满足统计独立和非高斯的成分。
统计技术如主成分分析(principal component analysis,PCA)、因子分析(factor analysis,FA)的出现,它们是进行统计数据处理、特征提取、数据压缩等比较经典的技术。
寻找矩阵W的另一个统计原理是统计独立性:假设成分yi之间是统计独立的.这意味着其中一个成分没有受到另一个成分的任何影响,成分之间没有任何信息传递.在因子分析中,经常声称因子之间是统计独立的,这个说法只是部分正确,因为因子分析假设因子是服从高斯分布的,找到独立的方法相当容易(对于高斯分布的成分来说,不相关与独立是等价的)。

在这里插入图片描述


http://chatgpt.dhexx.cn/article/tSDAtfq1.shtml

相关文章

【机器学习】特征提取

特征提取 目标 应用DictVectorizer实现对类别特征进行数值化、离散化 应用CountVectorizer实现对文本特征进行数值化 应用TfidfVectorizer实现对文本特征进行数值化 说出两种文本特征提取的方式区别 定义 特征提取是将任意数据&#xff08;如文本或图像&#xff09;转换…

特征选择与特征抽取

特征抽取和特征选择是DimensionalityReduction&#xff08;降维&#xff09;两种方法&#xff0c;但是这两个有相同点&#xff0c;也有不同点之处&#xff1a; 1. 概念&#xff1a; 特征抽取&#xff08;Feature Extraction&#xff09;:Creatting a subset of new features by…

【特征提取】基于深度学习的特征提取和匹配方法介绍

点击上方“小白学视觉”&#xff0c;选择加"星标"或“置顶” 重磅干货&#xff0c;第一时间送达本文转自 | AI深度学习视线精彩内容 计算机视觉需要图像预处理&#xff0c;比如特征提取&#xff0c;包括特征点&#xff0c;边缘和轮廓之类。以前做跟踪和3-D重建&#…

特征工程之特征提取

![ 什么是特征提取呢&#xff1f; 1 特征提取 1 将任意数据&#xff08;如文本或图像&#xff09;转换为可用于机器学习的数字特征 注&#xff1a;特征值化是为了计算机更好的去理解数据 字典特征提取(特征离散化) 文本特征提取 图像特征提取&#xff08;深度学习将介绍&…

数据分析 | 特征提取

目录 特征提取 1 方差过滤&#xff08;VarianceThreshold&#xff09; 2 卡方过滤&#xff08;chi2&#xff1b;SelectKBest&#xff09; 3 F检验&#xff08;f_classif&#xff1b;SelectKBest&#xff09; 关注我【生物海洋计算机支线】&#xff0c;获得更多生物海洋学&…

特征提取的方法

机器学习系列&#xff1a;(三)特征提取与处理 特征提取与处理 上一章案例中的解释变量都是数值&#xff0c;比如匹萨的直接。而很多机器学习问题需要研究的对象可能是分类变量、文字甚至图像。本章&#xff0c;我们介绍提取这些变量特征的方法。这些技术是数据处理的前提——序…

图像特征提取(VGG和Resnet特征提取卷积过程详解)

图像特征提取&#xff08;VGG和Resnet算法卷积过程详解&#xff09; 第一章 图像特征提取认知 1.1常见算法原理和性能 众所周知&#xff0c;计算机不认识图像,只认识数字。为了使计算机能够“理解”图像&#xff0c;从而具有真正意义上的“视觉”&#xff0c;本章我们将研究…

特征提取方法

潜在语义索引 潜在语义索引&#xff08;Latent Semantic Indexing,以下简称LSI&#xff09;&#xff0c;也叫Latent Semantic Analysis ,简称LSA。本文中称为LSI。LSI是一种主题模型&#xff0c;他是利用SVD奇异值分解方法来获得文本的主题的。奇异值分解详见点击打开链接。 …

特征提取方法简介

one-hot 表示一个词 bag-of-words 表示一段文本 tf-idf 用频率的手段来表征词语的重要性 text-rank 借鉴page-rank来表征词语的权重 从基于SVD纯数学分解词文档矩阵的LSA&#xff0c;到pLSA中用概率手段来表征文档形成过程并将词文档矩阵的求解结果赋予概率含义&#xff0c;再到…

特征选择和特征提取(一、概述)

特征选择和特征提取属于图像处理领域最基本的操作。 再这之前&#xff0c;我们先来了解一下卷积和滤波&#xff0c;像平时我们听到的CNN&#xff0c;就是使用卷积操进行图像的滤波操作&#xff0c;简单来说&#xff0c;滤波是图像处理的操作&#xff0c;而卷积是实现滤波的方法…

图像特征及提取

本文主要用于记录图像特征及其提取方法 文章目录 1.颜色特征1.1量化颜色直方图1.2聚类颜色直方图 2.几何特征2.1边缘特征2.2基于特征点的特征描述子2.2.1寻找特征点&#xff1a;Harris角点检测2.2.2另一种特征点&#xff1a;斑点2.2.3SFIT&#xff1a;斑点的特征描述子 1.颜色特…

机器学习中的特征提取

特征提取是将任意数据&#xff08;如文本或图像&#xff09;转换为可用于机器学习的数字特征&#xff0c;特征提取是为了计算机更好的去理解数据。 特征提取大体上可以分为三大类&#xff1a; 字典特征提取(特征离散化)文本特征提取图像特征提取&#xff08;深度学习&#xf…

图像特征提取

从本节开始&#xff0c; 我们将逐步从数字图像处理向图像识别过渡。 严格地说&#xff0c; 图像特征提取属于图像分析的范畴&#xff0c; 是数字图像处理的高级阶段&#xff0c; 同时也是图像识别的开始。 本文主要包括以下内容 常用的基本统计特征&#xff0c; 如周长、面积…

机器视觉中的特征提取【0】:什么是特征提取,特征提取有什么作用?

1.什么是特征提取&#xff1f; 特征提取的英文叫做feature extractor&#xff0c;它是将一些原始的输入的数据维度减少或者将原始的特征进行重新组合以便于后续的使用。简单来说有两个作用&#xff1a;减少数据维度&#xff0c;整理已有的数据特征。 这里我给一个例子来解释特…

c语言结构体学习整理(结构体初始化,结构体指针)

渣渣c的c语言学习之路 1.关于c语言的结构体: 首先我们为什么要用到结构体&#xff0c;我们都已经学了很多int char …等类型还学到了同类型元素构成的数组&#xff0c;以及取上述类型的指针&#xff0c;在一些小应用可以灵活使用&#xff0c;然而&#xff0c;在我们实际应用中…

C语言----初始结构体详解

此文是作者初次学习C语言的时候&#xff0c;写的笔记博文&#xff0c;如有错误请及时指正&#xff0c;谢谢&#xff01;&#xff01;&#xff01; 目录 1&#xff0c;什么是结构体 2. 结构体的声明 2&#xff0c;1结构体声明 2&#xff0c;2结构体成员的类型 2&#xff0c;…

openVAS 介绍

含义及作用&#xff1a; OpenVAS是开放式漏洞评估系统&#xff0c;也可以说它是一个包含着相关工具的网络扫描器。其核心部件是一个服务器&#xff0c;包括一套网络漏洞测试程序&#xff0c;可以检测远程系统和应用程序中的安全问题。 OpenVAS 的功能包括非认证测试、认证测…

040 OpenVAS的下载与安装

文章目录 一&#xff1a;OpenVAS的下载二&#xff1a;OpenVAS的安装2.1&#xff1a;中文版本步骤2.2&#xff1a;英文版本步骤 一&#xff1a;OpenVAS的下载 OpenVAS是开源的网络漏洞扫描器&#xff0c;自从Nessus收费了之后&#xff0c;分支出来的免费的 官网&#xff1a;htt…

Linux 漏洞扫描 openvas

什么是OpenVAS OpenVAS是一款开源的漏洞扫描攻击&#xff0c;主要用来检测网络或主机的安全性。其强大的扫描能力来自于集成数万个漏洞测试程序&#xff0c;这些测试程序以插件的形式提供&#xff0c;可以从官方网站免费更新. 一套完整的OpenVAS系统如下图显示 ① 客户层组件 …

关于openvas

目录 一&#xff1a;什么是openvas 二&#xff1a;作者 三&#xff1a;系统简介 四&#xff1a;建立架构 五&#xff1a;openvas功能 六&#xff1a;OpenVAS的核心组件 七&#xff1a;OpenVAS部署 八&#xff1a;openvas的组件构成 一&#xff1a;什么是openvas OpenV…