admin管理员组

文章数量:1564183

《 Interpretable Cognitive Diagnosis with Neural Network for Intelligent Educational Systems》(NCD论文阅读随心写)

原文链接

背景

在智能教育系统中,认知诊断旨在发现学生在学习过程中的状态,例如他们对特定知识概念的熟练程度。文章指出,现有的方法通常通过手工设计的函数来挖掘学生的练习过程,但这些函数通常是线性的,无法捕捉学生和练习之间的复杂关系。因此,文章提出了一种基于神经网络的认知诊断框架,以自动学习学生和练习之间的复杂交互关系。

文章解决的问题和创新点

  1. 之前的一些模型都是用手工设计的交互函数,这些函数仅仅将学生和习题特征的乘积线性地结合起来,这可能不足以捕获学生和习题之间的复杂关系;
  2. 特定的交互功能是指传统的认知诊断模型中手工设计的函数,用于将学生和练习的特征进行线性组合。这些函数的设计需要专业的专业知识和经验,并且需要大量的劳动力来完成。因此十分需要一种自动可以学习的方法来进行学习认知;
  3. 作者在本文中用一种原则性方式来解决了以上的问题,提出了一个神经认知诊断框架,通过结合复杂的神经网络来建模实现非线性的交互;

模型框架

NCDM

student factors:

学生熟练度向量,在这模型中Fs使用hs,表示其中,Hs的公式为:A为可训练参数,xs是学生的one_hot表示特征;

Exercise Factors:

这里的Fkn知识关联向量是值得是Qe,Qe的公式之际来自于下面公式,xe是习题的one_hot表示向量;

为了更加精准的诊断用户,这里使用了两个exercise factor分别是exercise discrimination–hdisc和knowledge difficulty–hdiff,分别表示练习能够区分知识掌握程度高的学生和知识掌握程度低的学生,以及表示练习考察的每个知识概念的难度。这两个向量是通过以下的方式获得的:B、D都是可训练的参数

交互函数:

总体的交互函数如下公式所示:使用学生的数量都向量减去学生知识点难度向量乘以学生区分度向量,最后element-wise以Exercise Factors;

损失函数:


疑问

  1. 在NCDM中为什么训练的参数要设置在呢几个位置?

  2. 为什么交互函数的第一层要这样设计?

  3. 在文中提及到的单调线性假设是怎么在模型中约束出来的?

    在文中作者使用了一个简单的策略:将W1,W2,W3的每个元素限制为正,在矩阵相乘的时候每一个阅读会叠加在一块,不会出现相减的情况。

特殊点

  1. Q矩阵的设计,大小为M*K其中M为学生练习的个数,K为知识点的个数,如果练习Mi和知识点Kj相关,呢么Qij为1,否则为0
  2. 对于一个认知诊断系统,需要有三点要去考虑,分别是学生的能力、习题的难度以及他们之间的交互;
  3. 单调假设:学生能够正确回答,其优化算法应增加学生关于知识点k 的熟练度值。
  4. 认知诊断的问题定义:给定学生的反应日志R和Q矩阵,我们的认知诊断任务的目标是通过学生成绩预测过程挖掘学生对知识概念的熟练程度。
  5. Student Factors:F s学生因素表征学生的特质,会影响学生对练习的反应。
  6. 知识关联向量:反应了练习和知识点之间的关系,这就意味需要每一个熟练度向量的每个条目对应一个特定的知识概念

数据集样式

本文标签: DiagnosisneuralInterpretableCognitiveEducational