php 项目反应理论,科学网—好文 | 纽约石溪大学:机器学习中基于项目反应理论的集成学习 - 陈培颖的博文...

article/2025/9/1 15:12:24

机器学习中,研究者们对分类集成的关注与日俱增,尤其关注分类精度的提升。IJAC近期发表了来自纽约石溪大学研究者的最新成果,该研究基于项目反应理论,提出一种加权投票方法---基于IRT理论的集成学习算法,该方法可正确处理分类难题。研究还构建三个模型用以评估能力参数,并介绍了模型背后的假设。

全文下载:

Item Response Theory Based Ensemble inMachine Learning

机器学习中基于项目反应理论的集成学习

Ziheng Chen, Hongshik Ahn

f00d39b0382c2f569116e3156c5c0c26.png

机器学习领域,研究者们对分类问题的集成学习(Classification ensembles)的关注与日俱增。集成学习(ensemble learning)区别于其他类型学习最重要的特征是它综合了一组分类器的预测结果,而不仅仅依赖于单个分类器。当前,在多种情况下已证实:在集成学习算法中,聚合性能指标(aggregated performance metrics),如Bagging、Boosting和增量学习(incremental learning)的表现均优于其他同类算法。

集成学习算法中最核心的内容,便是组合判定规则(combination rule)。根据组合的方法,可分类为:简单多数投票(simple majority voting)和加权多数投票(weighted majority voting)。简单多数投票是一种综合了分类器决策的决策规则。由于其简单、适用性强,已经在集成学习中得到广泛应用。加权多数投票则是将每个分类器的决策乘以一个权重,而后把加权决策组合起来完成最终决策。这两种方法基于分类器的性能来训练数据,因此,一旦单个分类器完成训练,就不再需要调节任何参数。

借鉴项目反应理论(Item Response Theory, IRT)中的思想, 本文提出了一种新的加权投票分类集成(weighted voting classification ensemble)算法。IRT广泛应用于心理学或教育学中评价试题难度或者学生能力,我们将之迁移到集成学习策略中来评价不同基础分类器的效果。我们把每个数据点(data point)当作一个问题,把不同的分类器当作在课堂上完成考试的学生。众所周知,一个学生解决问题时的表现取决于两个主要因素:问题的难度及学生的能力。训练数据当中,有些特征显著且易于分类,而有些接近类别边界(class boundaries)的数据却很难分类。因此,与课堂考试类似,我们将分类器的性能定义为可正确分类复杂案例的能力,而不是正确完成分类的案例数量。例如,假设一个分类器正确完成了简单案例的分类,却不能处理复杂案例。另一个分类器正确分类了一些复杂案例,而错误地分类了简单案例。那么,第二个分类器所得的权重就比第一个分类器高。

本文提出一种同时评价分类器能力和分类难度的方法。本研究所采用的项目反应理论(item response theory, IRT)框架已广泛应用于心理和教育研究中,用以评估分类器的潜在能力。在UCI分类数据的实验中,这种集成学习方法有效的提升了分类效果。值得一提的是,该方法有效解释了基础分类器的强弱与训练集中数据点难易的关系。

a98b733a66b1698013fce1a01e581f18.png

f263576e2581372790d9979c677f5e08.png

2440350fa568ebc6d29807db5df94b36.png

转载本文请联系原作者获取授权,同时请注明本文来自陈培颖科学网博客。

链接地址:http://blog.sciencenet.cn/blog-749317-1258227.html

上一篇:科研小工具 | 基于LaTex轻松制作PPT

下一篇:最新 | 2020研究前沿及热点解读


http://chatgpt.dhexx.cn/article/tnhUi096.shtml

相关文章

项目反应理论 EM估计

项目反应理论参数的EM估计 写在前面: 本文主要描述了整个IRT使用EM算法参数的估计过程,其中涉及大量公式,如只是需要了解IRT相关基础知识,请转战wiki~~ 预警: 大量公式来袭~&#…

项目反应理论

项目反应理论(item response theory)是属于心理学中认知诊断常用的一种理论,即根据被测试者针对某个问题的答案来对被测者的认知状况进行估计。“项目”实质就是测试题,“反应”就是被测者的答案。也有学者称项目反应理论也是机器学习中的一个类别,即根据被测者对测试题的…

密码校验密码正则校验,密码表单校验总结

一.前言,日常开发中,表单校验是出现率非常高的一个需求,特别是密码校验。本文就针对常见的几种密码校验(含正则)做个总结,做个共享。 二. 密码必须包含数字,字母和特殊符号。 写法:…

正则表达式-几种常见的密码校验

原文:https://jingyan.baidu.com/article/5bbb5a1b634cca53eba179ce.html 首先说一下密码必须是6~18位之间的数字,正则表达式为"^[0-9]{6,18}$",其中[0-9]表示必须是数字,{6,18}表示必须在6到18位之间,代码如…

【算法】程序猿必备算法

文章目录 快速排序算法堆排序算法归并排序二分查找算法BFPRT(线性查找算法)DFS(深度优先搜索)BFS(广度优先搜索)Dijkstra算法动态规划算法朴素贝叶斯分类算法Floyd Warshall算法贝尔曼福特算法贪心算法拓扑排序最小生成树分治算法KMP暴力匹配更多来源 快…

数据结构+算法=程序

(1) 数据结构算法程序。 每个学计算机的人都听过这个公式。 这个公式是尼克劳斯沃斯在1976年出版《算法数据结构:程序》一书中提出。尼克劳斯沃斯还是Pascal编程语言的发明人,而且他还在1973年出版《系统程序设计导论》一书中提出…

程序的调试利器

目录: 一、Printf串口输出 二、半主机的巧妙应用 三、SWO引脚的巧妙应用 四、RTT的应用 五、JScope的应用_MCU ------------------------------------------------------------------------------------------------- 一、Printf串口输出 作为一名嵌入式软件…

应用程序调试技术

课程简介 调试技术实务分为调试基本概念和设置,Windows下常用到调试工具VS和Windbg的使用,自动化调试技术,以及实际调试场景示例等。不仅仅是介绍枯燥的程序调试技术,而是深入的从操作系统实现以及.NET虚拟机实现的本质出发&#…

debug运行程序的原理

0 代码运行的原理是什么? 代码的运行方式可以分为直接执行和解释执行两类。 不知道平时你有没有注意,可执行文件直接 ./xxx 就可以执行,而执行 js 文件需要node ./xxx,执行python文件需要python ./xxx,这就是编译执行(直接执行)…

程序的调试技巧。

什么是调试? 调试又叫Debug,又称除错,是发现和减少计算机程序或电子仪器设备中程序错误的一个过程。 生活中所有发生的事情都一定有迹可循,如果问心无愧,就不需要掩盖也就没有迹象了,如果问心有愧疚&#…

程序入门调试

1.先设置断点 在调试代码之前要先设置一个断点,否则调试无法进行; ps:设置断点的方法 找到自己要测试的那一行代码,按f9或者也可直接用鼠标点击代码前的空白处如下图所示; 2.熟悉常用的命令 常用的命令符合有四个,分…

谱分解实例与理解

这篇博文想从一个实际的矩阵出发,阐述谱分解究竟干了什么。——非数学系的cver

谱分解(SD)

前提:矩阵A必须可相似对角化! 充分条件: A是实对称矩阵A有n个互异特征值A^2 AA^2 Er(A) 1 且 tr(A)!0 谱分解(Spectral Decomposition ),又称特征分解,或相似标准形分解,是将矩阵分解为由…

矩阵分解——谱分解

文章目录 先修知识: 幂等矩阵谱分解定理谱分解的流程 谱分解的推论谱分解的应用 先修知识: 幂等矩阵 谱分解定理 谱分解的流程 谱分解的推论 谱分解的应用

【信号与系统|吴大正】4:信号分解、傅里叶变换与信号谱(上)

信号分解、傅里叶变换与信号谱 信号的分解 在学习【信号分解】这一部分时,脑海里要有两个概念: 其一,我们整本书学习的思路就是围绕着将信号分解成基本信号,将系统的响应转变成基本响应这一思路来开展的;其二&#xf…

机器学习笔记——14 矩阵谱分解与奇异值分解及其背后的线性算子理论 (实战项目:利用SVD进行图像压缩)

机器学习笔记——14 矩阵谱分解与奇异值分解及其背后的线性算子理论 (实战项目:利用SVD进行图像压缩) 本篇文章介绍矩阵的谱分解与奇异值分解 (Singular Values Decomposition,SVD),为了对其有一个更为本质性地认识,本文从线性算子的理论讲起…

从矩阵谱分解到矩形的最少正方形剖分

上次听AK讲到谱分解的时候,若有所思,下面将对思考稍作记录。 矩阵谱分解 关于谱分解有很多定义,主要区别在于条件的强弱,有的要求一个 n n n阶矩阵不仅要求可对角化,而且加强条件至其 n n n个特征值 λ 1 , λ 2 , .…

谱本征正交分解 (SPOD)附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

通信基础 7 —— 遍历保密速率、谱分解物理意义

目录 遍历保密速率(ergodic secrecy rate)闭式解(解析解)和数值解闭式解数值解 拉普拉斯变换谱分解/正交分解 遍历保密速率(ergodic secrecy rate) 说遍历容量不十分准确,应该叫各态历经性容量…