[发明专利]一种基于IRT的信息处理方法及装置有效
申请号: | 201611198325.0 | 申请日: | 2016-12-22 |
公开(公告)号: | CN108229688B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 刘源;李历;高钰舒;张凯磊 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G09B7/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 irt 信息处理 方法 装置 | ||
1.一种基于项目反映理论IRT的信息处理方法,其特征在于,包括:
获取预设数量的答题者关于目标题库的答题信息样本;
基于每个答题者所做题目的答题情况为独立事件的假设,确定所述目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重;
将所述频率权重代入预设估计模型中,得到目标估计模型,其中,所述预设估计模型为基于IRT模型及边际极大似然MML估计方法的最大后验概率估计模型;
根据所述答题信息样本利用MML估计方法对所述目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计,其中,所述题目信息包括区分度和难度。
2.根据权利要求1所述的方法,其特征在于,基于每个答题者所做题目的答题情况为独立事件的假设,确定所述目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重,包括:
基于每个答题者所做题目的答题情况为独立事件的假设,确定所述目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重,所述频率权重的计算方法如下:
其中,表示题目j被所有学习能力为θi的答题者做对的频率,表示题目Itemj做对的统计频率,P(Itemj=1|θi)表示题目j被做对的情况中学习能力为θi的学生出现的后验概率,P(θi)代表所有答题者学习能力的先验假设。
3.根据权利要求2所述的方法,其特征在于,所述预设估计模型为:
其中,i表示答题者,j表示题目,Xi,j表示答题者i关于题目j的做题对错情况,αj表示题目j的区分度,βj表示题目j的难度系数,θi表示答题者i的学习能力,P(Xi,j|αj,βj,θi)表示做题人员i做对/错题目j的概率,表示θi满足均值为方差为的预设先验正态分布,表示βj满足均值为方差为的正态分布,表示lnαj满足均值为方差为的正态分布。
4.根据权利要求3所述的方法,其特征在于,将所述频率权重代入预设估计模型中,得到目标估计模型,包括:
将预设估计模型转化为:
其中,θi满足均值为0方差为1的先验正态分布,且θi是基于高斯-厄米特积分公式的采样点;
将频率表达式代入上述模型中,得到目标估计模型。
5.根据权利要求4所述的方法,其特征在于,根据所述答题信息样本利用MML估计方法对所述目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计,包括:
将所述答题信息样本输入所述目标估计模型中;
利用MML估计方法通过最大化所述目标估计模型的方式对所述目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计。
6.根据权利要求5所述的方法,其特征在于,利用MML估计方法通过最大化所述目标估计模型的方式对所述目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计之后,还包括:
根据训练完成的目标估计模型建立预测模型;
获取当前答题者的当前学习能力;
对于所述目标题库中的候选题目,根据所述当前学习能力、所述候选题目的题目信息及所述预测模型确定所述当前答题者答对所述候选题目的概率;
当所确定的概率满足预设条件时,向所述当前答题者推送所述候选题目。
7.根据权利要求6所述的方法,其特征在于,所述获取当前答题者的当前学习能力,包括:
假设答题者的学习能力的演进满足维纳过程,并更新所述预测模型;
获取当前答题者的历史答题数据;
根据所述历史答题数据及更新后的预测模型确定所述当前答题者的当前学习能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611198325.0/1.html,转载请声明来源钻瓜专利网。