IRT模型学习小结

article/2025/9/28 5:52:12

文章目录

  • IRT模型学习小结
    • 关于IRT模型
  • IRT模型原理
    • 模型介绍
    • 参数估计
  • 应用场景

IRT模型学习小结

关于IRT模型

与IRT模型相对应的经典测量理论CCT。经典测量理论与项目反应理论在测量领域均占有重要地位。经典测量理论形成较早,但是经典测量理论却有一些难以克服的缺点:

  1. 能力与观测分数之间的线性关系假设不合理。
    在经典测量理论中认为被试的能力与测试得到的分数是线性关系的,但是在实际情况中往往不程线性关系。比如我们在进行考试时,想要从50分考到60分很容易,但是想要从90分考到100分却很难。
  2. 被试的测验结果依赖于所施测项目的难度。
    被试由于做难易不同的题目而得到不同的分数,在经典测量理论中不同的分数表示不同的能力,这与常理不符。被试的能力不应由于所测题目的难度不同而不同,即,被试的能力应于所测题目的难度无关。
  3. 无法提供能力不同的被试如何对项目做出反应。
    对于已知能力的被试以及已知相关参数的题目,经典测量理论无法给出被试做该道题目的正确或错误概率

项目反应理论起源于 20 世纪三十年代,它是针对 CCT 所具有的不足而提出的,其基本思想是建立被试的潜在能力及其在项目上的作答反应之间的关系模型,即项目反应模型。它与经典测量理论相比,具有如下优点:

  1. 参数具有不变性。
    在项目反应理论下,项目的难度参数、区分度参数及被试的能力参数具有不变性。
  2. 被试的能力水平与项目参数之间关联化、模型化。
    在 IRT 中引入了项目特征曲线,这将项目难度、项目区分度以及被试的能力进行了有机的统一。
  3. IRT 定义了信息函数。
    IRT 中的信息函数反映了在不同的能力水平处,每个项目所提供的信息量的大小,信息量最大处的能力水平估计误差最小。
  4. 被试的能力参数与项目的难度参数具有配套性。
    被试的能力参数与项目的难度参数是定义在同一个量表上的,当一个被试的能力参数已知时,配一个项目参数已知的测验,即可预测被试的正确反应概率。

IRT模型原理

模型介绍

IRT模型是用于评估被试对某一项目或某一类项目的潜在特质。
IRT模型是建立在一定的假设之下:

  • 单维性假设,即假设某个测验只测量被试的某一种能力。
  • 立性假设,即假设被试在每一个项目上的作答反应是相互独立,互不影响的,作答反应只与被试自身的能力水平有关,与其他元素无关。
  • 模型假设,即被试在项目上的正确反应概率与被试的能力水平有一定的函数关系。

被选择用来表示这种关系的函数比较多,用的比较多的是logistic模型,根据参数参数个数不同,可以分为单参数、双参数和三参数logistic模型。
IRT三参数logistic模型为:
p i ( θ ) = c i + 1 − c i 1 + e x p ( − d a i ( θ − b i ) ) p_i(\theta)=c_i+\frac{1-c_i}{1+exp(-da_i(\theta-b_i))} pi(θ)=ci+1+exp(dai(θbi))1ci
该模型的曲线如下:
在这里插入图片描述
其中相关参数的定义如下

参数定义简单解释
d常数 1.702
a_i项目的区分度系数表示项目或题目的区分度,在曲线中影响曲线中部的斜率,当斜率越小,那么就很难将被试的测试分数结果区分开
b_i项目的难度系数表示项目或题目的难度,在曲线中代表曲线横轴方向的位移,难度系数越大,则被试想要获得比较高的分数就需要比较高的能力
c_i项目的猜测系数表示即使被试对测试的项目一点先验知识都没有,靠蒙也能蒙对的概率,比如选择题有0.25的概率才对
θ \theta θ被试的能力值表示被试在项目或题目所要考核的知识点或能力方面的掌握程度
p i ( θ ) p_i(\theta) pi(θ)被试做对该项目的概率

在使用IRT模型对被试进行能力评估的过程中,关键在于对参数的估计,包括对项目参数 a i a_i ai b i b_i bi c i c_i ci,以及被试能力参数 θ \theta θ的估计。

参数估计

IRT模型的参数估计方法有很多,包括极大似然估计,EM算法,贝叶斯算法等,本文将简单介绍使用极大似然估计方法进行参数估计过程。
在使用极大似然对IRT模型的项目参数和能力参数进行估计时,一般是当项目参数已知时,对能力参数进行极大似然估计,或当能力参数已知时,对项目参数进行极大似然估计。当项目参数和能力参数均未知时,则使用交替估计的方法来估计IRT模型的参数。大致步骤如下:

  • 获取得分矩阵

获取被试的得分矩阵,如下:

User i t e m 1 item_1 item1 i t e m 2 item_2 item2 i t e m 3 item_3 item3 i t e m M item_M itemM
u 1 u_1 u11011
u 2 u_2 u20010
u 3 u_3 u31110
u N u_N uN0111

其中 u n u_n un表示第n个被试, i t e m m item_m itemm表示第m个项目,表格中的0表示被试n做错了项目m,1表示被试n做对了项目m。

  • 参数估计
    假设当项目的区分度系数,难度系数,猜测系数均已知时,将上面得分矩阵中的做题结果数据和已知的区分度系数,难度系数,猜测系数代入IRT模型中,建立能力参数的极大似然函数
    L = ∏ i = 1 m p i y i ( 1 − p i ) 1 − y i L=\prod_{i=1}^{m}p_{i}^{y_i}(1-p_i)^{1-y_i} L=i=1mpiyi(1pi)1yi
    式中, p i p_i pi即为IRT模型函数得到的答对概率, y i y_i yi即为上述得分矩阵中被试真实是否答对的标签。将该函数取对数,得到
    l n ( L ) = ∑ i = 1 m y i l n ( p i ) + ( 1 − y i ) l n ( 1 − p i ) ln(L)=\sum_{i=1}^{m}y_iln(p_{i})+(1-y_i)ln(1-p_i) ln(L)=i=1myiln(pi)+(1yi)ln(1pi)
    对上述对数极大似然函数进行求导,便可计算得到能力参数 θ \theta θ
    如果区分度系数,难度系数,猜测系数和能力系数均未知,则可为其中一方设置初始值,然后不断迭代计算出各个参数,或者建立联合极大似然函数进行估计。

应用场景

  • 学习效果评估
    在教育机构中,可以根据学生以往的做题情况,比如学生对某一知识点的相关题目的做题正确和错误情况数据,用IRT模型来估计出学生在该知识点上的能力值 θ \theta θ,从而了解学生的学习效果。
  • 试卷的设计与修改
    项目信息函数能够描述给处于某一能力值 θ \theta θ的被试提供一个测试或者一个项目的测量有效性。
    项目信息函数
    I ( θ , μ i ) = p i ′ ( θ ) 2 p i ( θ ) ( 1 − p i ( θ ) ) I(\theta,\mu_i)=\frac{p_{i}'(\theta)^2}{p_i(\theta)(1-p_i(\theta))} I(θ,μi)=pi(θ)(1pi(θ))pi(θ)2
    测试信息函数
    I ( θ ) = ∑ i − 1 n I ( θ , μ i ) I(\theta)=\sum_{i-1}^{n}I(\theta, \mu_i) I(θ)=i1nI(θ,μi)
    测试信息函数是项目信息函数的累加。项目信息函数或测试信息函数值越大,表示该项目或测试对与该能力的学生能够反应越多的信息。据此来设计和修改得到更加有效的试卷或选择试题。
  • 计算机自适应测试
    在学生进行在线测试时,收集用户在线测试的实时信息来更新学生的能力 θ \theta θ,然后使用项目信息函数来选择更加有效的题目来提供给学生,从而达到更好的测试和学习效果

http://chatgpt.dhexx.cn/article/GDJvsqh7.shtml

相关文章

自适应学习系列(一)IRT简介

2019独角兽企业重金招聘Python工程师标准>>> 自适应学习之IRT简介 一、近端发展区(ZPD) Zone of Proximal Development(ZPD)是由心理学家Vygotsky提出来的一种学习理论,是目前自适应学习常用的思考模型。他认为,能力高…

IRT模型的参数估计方法(EM算法和MCMC算法)

1、IRT模型概述   IRT(item response theory 项目反映理论)模型。IRT模型用来描述被试者能力和项目特性之间的关系。在现实生活中,由于被试者的能力不能通过可观测的数据进行描述,所以IRT模型用一个潜变量 θθ 来表示&#xff…

知识追踪常见建模方法之IRT项目反应理论

目录 A.项目反应理论(IRT item response theory) 概述 历史发展 特点 模型 A.项目反应理论(IRT item response theory) 概述 IRT理论即项目反应理论(Item Response Theory, IRT),又称题目反应理论、潜在特质理论…

知识追踪系列之IRT

IRT简介 IRT理论即项目反应理论(Item Response Theory, IRT)。F. Lord在1951年从普林斯顿大学毕业时的博士论文《A Theory of Test Scores》被认为是IRT理论的开端之作。IRT最早使用在心理学领域,目的是做能力评估。现在已广泛应用于教育行业,用于校准评…

贝叶斯分类器(上)

目录 一、有关贝叶斯的简介 二、相关数学知识 1.先验概率与后验概率 2.贝叶斯公式 3、最大后验概率 4、最大似然估计法 一、有关贝叶斯的简介 贝叶斯老爷子的名字,很多同学都耳熟能详。估计不少的同学都在数学上被贝叶斯折磨过。贝叶斯在数学方面主要研究概率论…

机器学习常用的分类器比较-实例

这篇学习文章是在上一篇博客(http://blog.csdn.net/july_sun/article/details/53088673)的基础上,从机器学习的四要素(数据,算法和模型,计算机硬件,机器学习平台)角度出发用实例将各…

模式识别之分类器

常见分类器介绍 1、SVM分类器(监督学习分类器) 答:训练样本必须先标识不同类别,然后进行训练。SVM算法就是找一个超平面,对于已经被标记的训练样本,SVM训练得到一个超平面,使得两个类别训练集中…

常用分类器的效果对比

如果把机器学习归为两大类,那么主要的工作可以分为:分类和聚类。而分类任务基本上占整个机器学习或者是数据挖掘领域的70%,可见我们遇到的很多问题,都可以用分类的算法进行解决。机器学习发展到现在,许多被证实有效的分类算法被提…

监督学习之分类学习:线性分类器

监督学习之分类学习:线性分类器 如果想了解更多的知识,可以去我的机器学习之路 The Road To Machine Learning通道 Introduction 分类学习是最为常见的监督学习问题,并且其中的经典模型也最为广泛地被应用。其中,最基础的便是二分类(Binary Classification) 问题…

【线性分类器】线性分类器理论知识

文章目录 一、图像分类任务二、线性分类器:2.1 图像表示:2.2 损失函数:多类支持向量机损失: 2.3 正则项与超参数:K折交叉验证: 2.4 优化算法:梯度下降法(SGD)&#xff1a…

分类器的相关概念

昨天,人民网 发了一条八卦微博,盘点“雨神”(萧敬腾)是如何炼成的。微博称,网友统计发现,在萧敬腾 近年12次主要行程中,有10次他的“现身”让当地下起了雨,下雨的概率为83.3%。 图1 …

二类分类器构造多类分类器

from: http://tech.ddvip.com/2009-03/1238054080112304.html 从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器,即它只回答属于正类还是负类的问题。而现实中要解决的问题,往往是多类的问题(少部分例外&#xf…

KNN分类器

1.1 KNN的主要研究内容 (1)分类器的基本原理及算法内容 (2)利用现有的公开数据集(鸢尾花)实现分类器分类 (3)利用某种评价标准对分类结果进行分析评判 1.2分类的定义…

机器学习学习笔记(三)之分类器

分类器: 输入数据,识别是什么类,可以拓展为更广泛的用途。 将特征数据化,作为判断的依据。 和regression有相似的地方,但也有很大区别,把最好不把classification当作regression做 对于有多个分组的如cla…

分类器

分类器的作用:常规任务是利用给定的类别、已知的训练数据来学习分类规则和分类器,然后对未知数据进行分类(或预测)。逻辑回归(logistics)、SVM等常用于解决二分类问题,对于多分类问题&#xff0…

机器学习-分类-线性分类器

在一个机器学习任务中,如果每一条数据的目标值是离散的,则该任务是一个分类任务。 解决分类问题基本的方法有:线性分类器、决策树、朴素贝叶斯、人工神经网络、K近邻(KNN)、支持向量机(SVM)&am…

加密芯片大对比

市面上加密芯片,让人看的眼花缭乱,本文对各家加密芯片作了分析及对比 https://files.cnblogs.com/files/walta99/%E5%8A%A0%E5%AF%86%E8%8A%AF%E7%89%87%E5%A4%A7%E5%AF%B9%E6%AF%94.pdf 转载于:https://www.cnblogs.com/walta99/p/8484469.html

硬件加密芯片

TF32A09 芯片简介 产品描述 TF32A09系列芯片是同方股份有 限公司计算机系统本部自主研发的一 款高速度、高性能32位信息安全SoC 芯片。该芯片集成了高速的安全算法 和通讯接口,摒弃了传统的数据加解 密处理方式,使数据流加解密速度大 幅提升&#x…

芯片程序保护-常规芯片加密方式

芯片程序为什么要保护 针对于市场上越来越多的芯片解密方案的成熟和扩大,目前很对客户存在一个对于自己的产品会被同行或者其他竞争者抄袭的情况,对于硬件这块通常情况下是无法防止被抄的。但对于电路板的核心芯片和程序部分,是存在一些方式…

ATSHA204A加密芯片攻略——使用篇

ATSHA204A加密芯片是ATMEL公司研发的一款高安全性的,功能丰富的加密IC,使用SHA-256算法进行加密操作,内置16*32字节的slot(EEPROM)可以存储用户数据和秘钥,唯一的9字节序列号用于区分其他芯片,还有512bits的OTP区用于保…