自适应学习系列(一)IRT简介

article/2025/9/28 5:48:49

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

自适应学习之IRT简介

一、近端发展区(ZPD)

Zone of Proximal Development(ZPD)是由心理学家Vygotsky提出来的一种学习理论,是目前自适应学习常用的思考模型。他认为,能力高的学习者在学习难度低的知识时会感觉无聊,而能力低的人在学习难度高的知识时会感觉焦虑,他们只有在学习难度适中的知识时才会实现有效学习。这个难度适中的区域称为近端发展区(Zone of Proximal Development,简称ZPD)。

自适应系统持续测量学习者的能力高低,用算法来推导下一步任务,尽可能让学习者保持在ZPD区域內,让学习者在学习系统辅助下得到最好的学习效果。

那么,如何才能测量学习者的能力和任务难度的关系呢?这里介绍一种常见的理论 -- Item Response Theory,简称 IRT。

二、项目反应理论(IRT)

Item Response Theory (IRT)最早使用在心理学领域,目的是做能力评估。现在已广泛应用于教育行业,用于校准评估测试、潜在特征的评分等。下面介绍一下与之相关的Rasch模型和2P模型。

1. Rasch 模型

Rashch模型是IRT应用中使用最广泛的模型。假如我们有J个题目,分别是X1,X2,... , XJ。1表示学生回答正确,0表示学生回答错误。在Rashch模型里,学生i做对第j道题目的概率为:

ηi表示学生i的学习能力

αj表示第j道题目的难度

实际上,IRT理论是个广泛的概念,不仅仅指学生和题目的关系。本文为了方便大家理解,仅用学生和题目举例。

题目答对的概率取决于学生的能力和题目的难度。这个概率可以用下图来表示,这个图称为项目特征曲线(item characteristic curve ,简称ICC)。这个概率是一个单调递增的函数,这意味着,随着学生能力的增长,题目答对的概率也随之增长。当学生的能力与题目的难度相等时,带入公式可以得出P=1/(1+1)=0.5,即答对的概率是50%。当学生的能力高于题目的难度时,答对的概率就高于50%,反之则低于50%。这跟我们的认知是一致的。

125f84f9eba5ee87324df036dafd89c320f.jpg

 

假如我们有3个题目,他们分别为简单题(难度为-2,蓝色曲线)、普通题(难度为0,红色曲线)和高难度题(难度为2,绿色曲线)。我们可以看到,曲线的位置是由题目的难度决定的。

 

6d4237faf09ffc01537e6acac4230f94bf7.jpg

假如有3类学生,分别为学渣(能力为-2)、普通学生(能力为0)和学霸(能力为2)。对于不同题目和不同学生的组合,根据Rasch模型的公式,可以计算他们答对的概率情况,结果如下表所示:

 简单题普通题高难度题
学渣50%11.9%1.8%
普通学生88%50%11.9%
学霸98%88%50%

从表中可以看出来,对于学渣,最好是给他们做简单题。因为他们答对普通题和高难度题的概率很低,很难从中学到知识。而对于学霸,则高难度题更适合他们。

适合他们的题目,即对应他们各自的ZPD区域。

 

2. 2P模型

在Rasch模型中,所有的曲线,其形状都是一样的。实际上,这是不合理的。比如,有两道难度相同(比如难度等于2)的题目,一道是判断题,一道是选择题(4个选项)。对于判断题,即使学渣完全不知道怎么做,也有大约有50%概率能答对,而学霸也是50%左右的概率能答对。对于选择题,学渣大约有25%概率能答对,而学霸仍然是50%左右。因此,选择题比判断题能够更好的区分学霸和学渣,我们称它的区分度(discrimination)更高。2P模型(two-parameter model)就是在Rasch模型中引入了区分度的概念。

在2P模型中,学生i答对题目j的概率为:

5cf5fdac8968b42913dc517f6b133e6a915.jpg

λj表示题目j的区分度

ηi表示学生i的学习能力

αj表示第j道题目的难度

下表是在不同难度题目、不同区分度(0.3,1,2)和不同类型学生组合情况下,学生答对题目概率统计表。

11540f7e5eb1b244fb35332a32773ed66e0.jpg

绿色部分是低区分度题目的结果,同样的题目,学渣、普通学生和学霸答对的概率区别不大。

橙色部分是高区分度题目的结果,同样的题目,学渣、普通学生和学霸答对的概率区别很大。

因此,我们更偏爱区分度高的题目,它能够更有效的识别学生能力。

下面是三个难度均为0的题目。他们的区分度分别是0.3,1和2。可以看到,不同的区分度分别对应不同的形状的曲线。区分度越高的题目,曲线在0点附近位置就越陡峭,斜率(slope)越大。

746cd9776d6a0934a9e32751c472db8d559.jpg

 

转载于:https://my.oschina.net/stanleysun/blog/3036443


http://chatgpt.dhexx.cn/article/kHkMFeoS.shtml

相关文章

IRT模型的参数估计方法(EM算法和MCMC算法)

1、IRT模型概述   IRT(item response theory 项目反映理论)模型。IRT模型用来描述被试者能力和项目特性之间的关系。在现实生活中,由于被试者的能力不能通过可观测的数据进行描述,所以IRT模型用一个潜变量 θθ 来表示&#xff…

知识追踪常见建模方法之IRT项目反应理论

目录 A.项目反应理论(IRT item response theory) 概述 历史发展 特点 模型 A.项目反应理论(IRT item response theory) 概述 IRT理论即项目反应理论(Item Response Theory, IRT),又称题目反应理论、潜在特质理论…

知识追踪系列之IRT

IRT简介 IRT理论即项目反应理论(Item Response Theory, IRT)。F. Lord在1951年从普林斯顿大学毕业时的博士论文《A Theory of Test Scores》被认为是IRT理论的开端之作。IRT最早使用在心理学领域,目的是做能力评估。现在已广泛应用于教育行业,用于校准评…

贝叶斯分类器(上)

目录 一、有关贝叶斯的简介 二、相关数学知识 1.先验概率与后验概率 2.贝叶斯公式 3、最大后验概率 4、最大似然估计法 一、有关贝叶斯的简介 贝叶斯老爷子的名字,很多同学都耳熟能详。估计不少的同学都在数学上被贝叶斯折磨过。贝叶斯在数学方面主要研究概率论…

机器学习常用的分类器比较-实例

这篇学习文章是在上一篇博客(http://blog.csdn.net/july_sun/article/details/53088673)的基础上,从机器学习的四要素(数据,算法和模型,计算机硬件,机器学习平台)角度出发用实例将各…

模式识别之分类器

常见分类器介绍 1、SVM分类器(监督学习分类器) 答:训练样本必须先标识不同类别,然后进行训练。SVM算法就是找一个超平面,对于已经被标记的训练样本,SVM训练得到一个超平面,使得两个类别训练集中…

常用分类器的效果对比

如果把机器学习归为两大类,那么主要的工作可以分为:分类和聚类。而分类任务基本上占整个机器学习或者是数据挖掘领域的70%,可见我们遇到的很多问题,都可以用分类的算法进行解决。机器学习发展到现在,许多被证实有效的分类算法被提…

监督学习之分类学习:线性分类器

监督学习之分类学习:线性分类器 如果想了解更多的知识,可以去我的机器学习之路 The Road To Machine Learning通道 Introduction 分类学习是最为常见的监督学习问题,并且其中的经典模型也最为广泛地被应用。其中,最基础的便是二分类(Binary Classification) 问题…

【线性分类器】线性分类器理论知识

文章目录 一、图像分类任务二、线性分类器:2.1 图像表示:2.2 损失函数:多类支持向量机损失: 2.3 正则项与超参数:K折交叉验证: 2.4 优化算法:梯度下降法(SGD)&#xff1a…

分类器的相关概念

昨天,人民网 发了一条八卦微博,盘点“雨神”(萧敬腾)是如何炼成的。微博称,网友统计发现,在萧敬腾 近年12次主要行程中,有10次他的“现身”让当地下起了雨,下雨的概率为83.3%。 图1 …

二类分类器构造多类分类器

from: http://tech.ddvip.com/2009-03/1238054080112304.html 从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器,即它只回答属于正类还是负类的问题。而现实中要解决的问题,往往是多类的问题(少部分例外&#xf…

KNN分类器

1.1 KNN的主要研究内容 (1)分类器的基本原理及算法内容 (2)利用现有的公开数据集(鸢尾花)实现分类器分类 (3)利用某种评价标准对分类结果进行分析评判 1.2分类的定义…

机器学习学习笔记(三)之分类器

分类器: 输入数据,识别是什么类,可以拓展为更广泛的用途。 将特征数据化,作为判断的依据。 和regression有相似的地方,但也有很大区别,把最好不把classification当作regression做 对于有多个分组的如cla…

分类器

分类器的作用:常规任务是利用给定的类别、已知的训练数据来学习分类规则和分类器,然后对未知数据进行分类(或预测)。逻辑回归(logistics)、SVM等常用于解决二分类问题,对于多分类问题&#xff0…

机器学习-分类-线性分类器

在一个机器学习任务中,如果每一条数据的目标值是离散的,则该任务是一个分类任务。 解决分类问题基本的方法有:线性分类器、决策树、朴素贝叶斯、人工神经网络、K近邻(KNN)、支持向量机(SVM)&am…

加密芯片大对比

市面上加密芯片,让人看的眼花缭乱,本文对各家加密芯片作了分析及对比 https://files.cnblogs.com/files/walta99/%E5%8A%A0%E5%AF%86%E8%8A%AF%E7%89%87%E5%A4%A7%E5%AF%B9%E6%AF%94.pdf 转载于:https://www.cnblogs.com/walta99/p/8484469.html

硬件加密芯片

TF32A09 芯片简介 产品描述 TF32A09系列芯片是同方股份有 限公司计算机系统本部自主研发的一 款高速度、高性能32位信息安全SoC 芯片。该芯片集成了高速的安全算法 和通讯接口,摒弃了传统的数据加解 密处理方式,使数据流加解密速度大 幅提升&#x…

芯片程序保护-常规芯片加密方式

芯片程序为什么要保护 针对于市场上越来越多的芯片解密方案的成熟和扩大,目前很对客户存在一个对于自己的产品会被同行或者其他竞争者抄袭的情况,对于硬件这块通常情况下是无法防止被抄的。但对于电路板的核心芯片和程序部分,是存在一些方式…

ATSHA204A加密芯片攻略——使用篇

ATSHA204A加密芯片是ATMEL公司研发的一款高安全性的,功能丰富的加密IC,使用SHA-256算法进行加密操作,内置16*32字节的slot(EEPROM)可以存储用户数据和秘钥,唯一的9字节序列号用于区分其他芯片,还有512bits的OTP区用于保…

硬件加密芯片介绍

同方股份有限公司计算机系统本部自主研发的一款高速度、高性能32位信息安全S高速加密芯片TF32A09系列。该系列芯片集成了高速的安全算法和通讯接口,摒弃了传统的数据加解密处理方式,使数据流加解密速度大幅提升,适用于高速数据流加密。 TF32A…