光谱特征选择

article/2025/11/5 15:39:42

光谱特征选择(谱特征选择)

  • 简介
  • 算法框架
  • 算法推导
  • 总结

Spectral feature selection可翻译为谱特征选择,之前的特征提取学习中陷入了光谱特征选择翻译的误区。

参考论文为"Spectral feature selection for supervised and unsupervised learning " 作者 为 Zheng Zhao ;Huan Liu

简介

这篇文章提出了一种基于"谱图理论"(spectral graph)的特征选取框架(Laplacian score 和 ReliefF 都属于这个框架的一个特殊情况
)。
这个框架的假设,是本着原数据是大爷的道理,假设一个好的特征应该与原来(训练)数据构成的图有着相似的结构。当然一个特征毕竟是有限的(比如用性别来区分人有没有钱),可是这个特征与训练数据的相关性越大,我们就觉得这个特征越好,越可取。

特征的一致性比较。目标概念由图形结构表示(由椭圆表示的集群)。不同的形状表示特征赋予的不同值。
特征的一致性比较。目标概念由图形结构表示(由椭圆表示的集群)。不同的形状表示特征赋予的不同值。

算法框架

  1. 构建数据的相似性矩阵S,以及由此基础推出的图的表示G,和W,D,L;
  2. 计算:在这里插入图片描述在这里插入图片描述
  3. 在这里插入图片描述排序;

算法推导

先用在这里插入图片描述来表示一个训练集,我们用在这里插入图片描述来表示m个特征,每个特征的对应的数据向量为在这里插入图片描述对于监督学习在这里插入图片描述用来表示每个数据所对应的类。

给定以上数据,可以由不同的规则来定义一个代表数据实例之前关系的实对称矩阵S,Sij表示两个实例之间的关系(距离),下面是两种常用的规则
对于无监督学习,可以用RBF核函数:
在这里插入图片描述
对于监督学习(l表示为同一类,nl表示l类中的个数):
在这里插入图片描述

所以我们可以通过X得到其无向图G(V,E),对于图G我们定义它的相邻矩阵(adjacency matrix)W,在这里插入图片描述.定义向量在这里插入图片描述

图G的degree matrix D为在这里插入图片描述
Laplacian matrix:在这里插入图片描述
Normalized Laplacian matrix:在这里插入图片描述
在这里插入图片描述
第一步衡量实例之间的相似性解决了,下一步就是求特征的权重(score)在这里插入图片描述

由性质2可以知道laplacian matrix 可以衡量一个向量各个数值之间的加权平方和,可以用来度量一个组数据之间的离散程度。这正是L矩阵有用的地方。

既然这样,因为有Wij,我们直接用在这里插入图片描述就可以算向量f与原数据之间的离散程度,这个式子越小,与元数据差别就越小。但是还要归一化一下由式子(5),所以有
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
当然这个间断的在这里插入图片描述并不能满足我们日益增长的需求,Smola 和Kondor用傅里叶变换对在这里插入图片描述进行了扩展,在这里插入图片描述
这里在这里插入图片描述是一个单调增函数,是用来惩罚高频分量

比如说,在这里插入图片描述可以有如下形式种特征打分函数
在这里插入图片描述

总结

Spectral feature selection 是一个方法框架。


http://chatgpt.dhexx.cn/article/K1OrOod1.shtml

相关文章

模型特征选择

RF、GBDT、XGboost都可以做特征选择,属于特征选择中的嵌入式方法。比如在sklearn中,可以用属性feature_importances_去查看特征的重要度, 比如: from sklearn import ensemble#grd ensemble.GradientBoostingClassifier(n_estimators30)grd …

sklearn 数据处理与特征工程

1、数据处理的流程 2 数据预处理 Preprocessing & Impute 2.1 数据无量纲化 在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度…

特征选择

一、特征选择基本问题 我们将属性称为“特征”(feature),对当前学习任务有用的属性称为“相关特征”(relevant feature)、没什么用的属性称为“无关特征”(irrelevant feature)。 从给定的特征集…

特征选择(筛选特征)

根据特征选择的形式可以将特征选择方法分为3种: Filter:过滤法,按照发散性或者相关性对各个特征进行评分,设定阈值或者待选择阈值的个数,选择特征。Wrapper:包装法,根据目标函数(通常…

机器学习 基础理论 学习笔记 (8)特征选择(feature selection)(一)

0.说明 本文也许比较乱,请看目录再食用。 后续会 出文 机器学习 基础理论 学习笔记 (8)特征选择(feature selection)(二) 将 分类问题 和 回归问题 分开总结。 以及或将出文 机器学习 基础理…

三种常见的特征选择方法

特征选择 特征选择是特征工程里的一个重要问题,其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。并且常能听到“数据和特征决定…

特征选择方法最全总结!

上个月扫读完《阿里云天池大赛赛题解析》[1]后,看到书中对特征选择的讲述,于是便打算借此机会,系统梳理下各种特征选择方法。如有不足,还望指正。 一、背景介绍 在处理结构型数据时,特征工程中的特征选择是很重要的一个…

运行时错误 '-2147467259 (80004005)'

运行时错误 -2147467259 (80004005)方法 getFooterColor 作用于对象 IFPLayoutRegion 时失败遇到这样的错误主要是因为在 VBA 访问布局表格时,没有启用表尾。解决方法:在布局表格设置中启用表尾。注:同样的错误和解决方法也适用于表首。

win12服务器之常见错误:运行时错误(/应用程序中的服务器错误)

阿里云解答参考&#xff1a;https://www.cnblogs.com/xrtd/p/3704532.html 原因1: 这是由于配置中 Asp.Net 程序 没有显示详细的错误信息. 解决: 您必须修改 web.config 文件 将 <customErrors mode"On"/> 设置为mode "Off", 上传到网站根目录.然后…

问题:当运行exe程序时遇到错误0000007时如何解决

这里我是需要用的一个DDS库安装程序&#xff0c;但是经过一系列安装操作后&#xff0c;最后一步验证是否成功时出现了问题&#xff1a; 点击 该exe应用程序提示&#xff1a;应用程序错误0xc000007b 给出我使用后成功了的解决方法&#xff1a; 首先下载All in One Runtimes 简…

C++编译错误与运行时错误

笔试题里经常会有这样的题目&#xff0c;让你判断运行时错误还是编译错误。在这里将它总结一下。 在调试过程中&#xff0c;运行时错误是最麻烦的问题。因为编译错误可以由编译器检查出来&#xff0c;而大多数编译器对运行时错误却无能为力。查错和纠错的工作完全由用户自己来…

下面的程序运行时哪里会出现错误

1、下面的程序运行时哪里会出现错误&#xff1a;struct S { int i; int * p; }; int main() { S s; int * p &s.i; p[0] 4; p[1] 3; s.p p; s.p[1] 1; s.p[0] 2; return 0; } 【题目解析】 这道题考的是对结构体内存使用情况的理解。在32位的操作系统中&#xff0c;i…

Word粘贴文字时遇到报错:运行时错误‘53’:文件未找到:mathpage.WLL 解决方案

Word粘贴文字时遇到报错&#xff1a; 运行时错误‘53’&#xff1a; 文件未找到&#xff1a;mathpage.WLL 问题&#xff1a; 每次装完MathType后&#xff0c;在word里面进行粘贴操作时&#xff0c;总是出现“运行时错误‘53’&#xff1a;文件未找到&#xff1a;MathPage.WLL…

MathType 运行时错误‘53’:文件未找到:MathPage.WLL

问题描述 环境 MathType7.4Microsoft Office 365Windows 11 问题 情景1. Microsoft Word 启动时显示 Please reload Word to load MathType addin properly 情景2. 安装MathType后在 Microsoft Word 中使用复制粘贴时报错 运行时错误‘53’ 情景3. 在 Microsoft Word 中使…

JAVA的编译时错误和运行时错误

1. 要区分编译时错误和运行时错误&#xff0c;就应该先明白什么是编译&#xff1f;什么是运行&#xff1f; 首先&#xff0c;先看一下这张图&#xff1a; 编译期就是将我们写的java源代码交给编译器执行的过程&#xff0c;起翻译的作用&#xff0c;该过程主要对java源代码的…

【Word】MathType 运行时错误‘53’:文件未找到:MathPage.WLL

问题描述 1. 环境&#xff1a; MathType7.4Microsoft Office 365Windows 11 2. 问题 情景1. Microsoft Word 启动时显示 Please reload Word to load MathType addin properly 情景2. 安装MathType后在 Microsoft Word 中使用复制粘贴时报错 运行时错误‘53’ 情景3. 在 M…

运行程序报错怎么办?

Dev c中常见的报错有几种 一. ld return 1 exit status 这种报错是最常见的&#xff0c;下面是可能的原因 1.库函数拼写错误。如&#xff1a;printf&#xff0c;scanf,等 2.定义的函数名在调用时&#xff0c;函数名拼写错误&#xff08;这个主要自定义函数啊啥的可能比较多…

java clh队列_J.U.C|同步队列(CLH)

一、写在前面 在上篇我们聊到AQS的原理&#xff0c;具体参见《J.U.C|AQS原理》。 这篇我们来给大家聊聊AQS中核心同步队列(CLH)。 二、什么是同步队列(CLH) 同步队列 一个FIFO双向队列&#xff0c;队列中每个节点等待前驱节点释放共享状态(锁)被唤醒就可以了。 AQS如何使用它&a…

Java CLH队列

一、SMP和NUMA简要介绍 1.1 SMP SMP&#xff08;Symmetric MultiProcessing&#xff09;对称多处理是一种包括软硬件的多核计算机架构&#xff0c;会有两个或以上的相同的核心共享一块主存&#xff0c;这些核心在操作系统中地位相同&#xff0c;可以访问所有I/O设备。它的优点…

AQS-CLH同步队列

1:什么是同步队列&#xff08;CLH&#xff09; 同步队列 一个FIFO双向队列&#xff0c;队列中每个节点等待前驱节点释放共享状态&#xff08;锁&#xff09;被唤醒就可以了。 AQS如何使用它&#xff1f; AQS依赖它来完成同步状态的管理&#xff0c;当前线程如果获取同步状态…