心理学报 ›› 2013, Vol. 45 ›› Issue (8): 921-934.doi: 10.3724/SP.J.1041.2013.00921
• 论文 • 上一篇
张勋;李凌艳;刘红云;孙研
ZHANG Xun;LI Lingyan;LIU Hongyun;SUN Yan
摘要: 矩阵取样测验包含多个题册, 单个题册的总分不能直接作为匹配变量用于DIF检测。本研究首先基于模拟数据, 同时采用IRT_Δb法, 以及用IRT模型估计的考生能力作为匹配变量修订后的LR法对矩阵取样测验进行DIF检测, 分析二者进行DIF检测的有效性及其相关影响因素; 并根据已有的LR法DIF判断标准划定出IRT_Δb法分类标准; 最后使用实证数据加以验证。结果显示:矩阵取样测验中, IRT_Δb法和修正LR法均能较好地区分DIF量不同的题目; 样本量、题册中DIF题目的比例和考生群体间真实能力的差异对两种方法的检验力、犯I类错误的概率和分类结果都有较大影响。