题库类产品如何计算题目的难度值

一、引言

题库类产品(如猿题库、易题库等)的一个标配功能是预测用户未来要进行的某项考试得分,我们称之为目标考试预测分。以猿题库高考为例,即将参加高考的学生通过在题库上做大量练习,练习的效果会以学生的高考预测分呈现出来,这是学生最关注的指标,也是整个题库产品中最关键的数据。
为了让“预测分”数据更加准确,我们引入了能力评估模型,通过测算用户在所有知识点上的能力水平,并将其量化成为一个数值。能力评估模型中有两个重要参数:题目难度值、用户答题的正确率。简化为:
A=f(an,d)
其中A表示能力值,an表示所做n道题目的难度值,d表示用户做这n道题目的正确率。参数d的值是可轻易计算得出,而an的值决定于这n道题每一道题的难度值。
于是,单题难度值的计算成为准确预测用户预测分的关键因素。

二、什么样的题目才算“难题”

我们这样定义“难题”:解题的逻辑、思路迂回复杂,所关联的知识点综合性强。
有一些情形,表面上似乎能证明这是一道“难题”,但并不属于我们考虑的范围:

  • 基础易错题:考察概念性、定义类的基础知识题目,但题目会设置若干干扰性强的易错项。
  • 多知识点平行考查:考查多个知识点,但知识点之间的关联性小,在题目内的综合度低。
  • “超纲题”:答题者觉得“难”并不是因为这是一道逻辑复杂的题,而是解答此题需要用到的知识并不在答题者的所学范围以内;如二元一次方程的题目出现在一元一次方程的课后习题里。

这些因素会在后续计算难度系数时剔除掉。

三、如何给一道“难题”确定难度系数

难度系数反映题目的难易程度,描述考生在答题时的失分情况。一般地,难度系数的计算公式为:
L=1-X/W
其中,L为难度系数,X为样本平均得分,W为试卷总分(对于单题而言,W为该题的分值)。
这是在有足够答题数据的前提下建立的难度计算公式,而题库类的产品中题目被作答的次数是有一个累积的过程,对于新入库的题目,这个计算公式并不适用。针对题库产品的特性以及题目难度系数计算公式的适用问题,我们按以下步骤来确定并校准题目的难度系数:

  1. 人工标记题目初始难度
    新题目在录入、解析的环节中,由教研人员根据一定的标准(如上述第二部分中“难题”的标准),给题目录入一个初始难度值,难度值的范围为1~10共10个等级,这个值越大代表这道题的难度越大。
  2. 题目被大量作答后,提取正确率并计算难度系数
    根据公式L=1-X/W计算该题难度系数。
  3. 比对步骤1和步骤2中产生的难度值,确定题目的最终难度系数
    如果难度值为1~3,而难度系数为0.7~0.9,则用人工初始难度值转化为该题的难度系数,并把这道题交由教研人员重新评估题目的难度值,并检查此题是否出现在了超纲的位置。此外的其他情形,都用新计算出来的难度系数来取代初始难度值。
  4. 步骤3中教研人员重新评估题目难度值的环节中如果发现严重的偏差,则在修正后用难度系数来取代初始难度值。

四、小结

引入经典的难度系数计算公式,再通过与人工标记的难度值进行比对修正,使得题目的难度量化更加合理,为能力评估模型提供更准确的参数。

时间: 2024-10-17 09:06:38

题库类产品如何计算题目的难度值的相关文章

我是如何用单机实现亿级规模题库去重的?

背景 最近工作中遇到了一个问题:如何对大规模题库去重?公司经过多年的积累,有着近亿道题目的题库,但是由于题目来源不一导致题库中有很多重复的题目,这些重复的题目在检索时,除了增加搜索引擎的计算量外,并不会提高准确率.此外由于题目过多,搜索引擎往往采取了截断策略,只对一部分题目进行计算,这导致了某些正确的题目反而得不到计算,拍搜准确率甚至不增反降.所以对于一个搜索引擎来说,虽然初期增加题目数量往往可以大幅提高拍搜准确率,但是当题目量大到一定程度时,反而会由于计算量跟不上导致准确率下降.如何尽可能的去

《PHP面试笔试真题库》——PHP面试的好帮手

你好,是我琉忆. 一个文艺的PHP开发工程师. 很荣幸能够在这里带来我的第一本新书——<PHP程序员面试笔试真题库>. 一.创作过程 <PHP 程序员面试笔试真题库>是我的第三本书,继<PHP 程序员面试笔试宝典>和<PHP 程序员面试笔试真题解析>后的第三本.它的出现完全是为了弥补宝典和真题解析的欠缺.宝典重点讲的是PHP相关的知识点,而真题解析针对的重点则是面试题的讲解,而真题库的重点在于罗列往年的PHP套题,让应聘者自行去测试PHP真题,更好的应对PH

课堂派题库格式转换程序

一.背景 这个学期开设的Java程序设计课程,需要用课堂派来签到和平常练习,老师苦于课堂派后台的课堂测试需要人工填入题目,好在课堂派运行符合格式的题目直接从word文档中导入,于是让我们来写一个小程序来实现这个格式转换.老师用的源题库是有特殊格式的,这样我们就可以通过一些特殊的标记来实现对源题库的读取,我最开始使用C++来实现的,后来补充的Java的版本.该程序主要是对string的操作,二者之中有许多相同的函数方法,但具体的写法却有所不同,同时Java的限制数组越界.不能更改String的一些

jzyz 题库 题目选做

题库中也有很多我想不出来的模拟赛的题目.做还是必要的. LINK:水题一道 LINK :ww 原文地址:https://www.cnblogs.com/chdy/p/11488468.html

猿题库宣布获得C轮1500万美元融资,将上线初中题库获取更多中学生用户,K12是未来重心

今天猿题库宣布近期获得了C轮1500万美元融资.此轮投资方为经纬中国和IDG资本,该轮融资后猿题库估值为1.25亿美元.而经纬中国和IDG资本也是猿题库前两轮的投资者,2012年猿题库获得IDG 220万美元A轮融资,2013年获得经纬领投.IDG跟投的700万美元B轮融资. 我们多次报道过猿题库,它是一款在线智能题库,最大的特点就是它能根据用户做题的情况智能调整出题范围和难度.原先猿题库更多提供职业考试的题库,后来推出高考题库,便将主要精力放在了K12的题库产品研发上,去年还曾为了拓展更多中学

重开吐槽有感及OI书籍题库推荐 -自己选的路 跪着也要走完

凉爽的清风伴随着烈日洒向这片土地,山区的夏天似乎早已来到.回想过去的高一上学期与寒假,不禁叹息,荒废了多少时光.虽然自称为OIer,但却是个半吊子,在过去的NOIP2015中,从零开始的我,刚上完三四节课的我就裸考了笔试,差0.5分与复赛失之交臂.再见了2015的比赛,考试过后,感觉OI没什么用处,有荒废了许多,竞赛班由次居然连续3个星期都没开过课,也就是1月1课.可能是不重视吧,在2015noip中,我校复赛才入几个人,学长得了奖,最高的也还是省二.应该算是弱校了吧.不由地怀疑自己. OI课上

RE写作Issue问题题库分析与提纲

RE写作Issue问题题库分析与提纲 GRE写作Issue问题题库分析与提纲 第一类 社会 2. "Competition is ultimately more beneficial than detrimental to society." 归根结底,竞争对于社会是利多弊少. Generally speaking, competition contributes to progress in society. 1.        Generally speaking, competi

猿题库 iOS 客户端架构设计(原文地址:http://gracelancy.com/blog/2016/01/06/ape-ios-arch-design/)

猿题库 iOS 客户端架构设计 序 猿题库是一个拥有数千万用户的创业公司,从2013年题库项目起步到2015年,团队保持了极高的生产效率,使我们的产品完成了五个大版本和数十个小版本的高速迭代.在如此快速的开发过程中,如何保证代码的质量,降低后期维护的成本,以及为项目越来越快的版本迭代速度提供支持,成为了我们关注的重要问题.这篇文章将阐明我们在猿题库 iOS 客户端的架构设计. MVC MVC,Model-View-Controller,我们从这个古老而经典的设计模式入手.采用 MVC 这个架构的

北大ACM题库习题分类与简介(转载)

在百度文库上找到的,不知是哪位大牛整理的,真的很不错! zz题 目分类 Posted by fishhead at 2007-01-13 12:44:58.0 -------------------------------------------------------------------------------- acm.pku.edu.cn 1. 排序 1423, 1694, 1723, 1727, 1763, 1788, 1828, 1838, 1840, 2201, 2376, 23