心理科学进展 ›› 2025, Vol. 33 ›› Issue (1): 176-190.doi: 10.3724/SP.J.1042.2025.0176
• 研究方法 • 上一篇
收稿日期:
2023-08-01
出版日期:
2025-01-15
发布日期:
2024-10-28
通讯作者:
温聪聪, E-mail: wencong001@xmu.edu.cnReceived:
2023-08-01
Online:
2025-01-15
Published:
2024-10-28
摘要:
Asparouhov和Muthén在2023年提出了一种全新的惩罚结构方程模型框架。惩罚对齐法是该模型框架在测量不变性检验领域的应用范例。惩罚对齐法继承了多组探索性因子分析在探索性因子分析框架内进行测量不变性检验和可以估计交叉载荷等优点, 继承了对齐法使用成分损失函数、允许模型中存在一定量不等参数等优点, 同时继承了贝叶斯结构方程模型对模型参数设置先验分布、通过检验模型参数的近似测量不变性达到潜因子均值比较的目的等优点。此外, 惩罚对齐法还克服了传统测量不变性检验方法的一些不足。本文以大学生职业价值观研究为例, 比较了多组验证性因子分析、基于验证性因子分析的惩罚对齐法分析、基于探索性结构方程模型的惩罚对齐法分析拟合样本数据的效果, 演示了如何使用惩罚对齐法进行测量不变性检验和多组比较。
中图分类号:
温聪聪. (2025). 惩罚对齐法:测量不变性检验的新方法. 心理科学进展 , 33(1), 176-190.
WEN Congcong. (2025). A new measurement invariance test method: Penalized alignment. Advances in Psychological Science, 33(1), 176-190.
维度设计 | 题号 | 题项内容 | |
---|---|---|---|
Q1 | 有助于社会的可持续发展和环境保护 | ||
利他因子 | Q2 | 帮助他人 | |
职业价值观量表 | Q3 | 做对社会发展有重要意义的事情 | |
Q4 | 自我发展 | ||
自我实现因子 | Q5 | 做我感兴趣的事情 | |
Q6 | 发挥我的天赋和能力 |
表1 问卷中职业价值观量表的维度和题项设计
维度设计 | 题号 | 题项内容 | |
---|---|---|---|
Q1 | 有助于社会的可持续发展和环境保护 | ||
利他因子 | Q2 | 帮助他人 | |
职业价值观量表 | Q3 | 做对社会发展有重要意义的事情 | |
Q4 | 自我发展 | ||
自我实现因子 | Q5 | 做我感兴趣的事情 | |
Q6 | 发挥我的天赋和能力 |
题项 | F1 | F2 |
---|---|---|
Q1有助于社会的可持续发展和环境保护 | 0.61 | 0.17 |
Q2帮助他人 | 0.86 | -0.01 |
Q3做对社会发展有重要意义的事情 | 0.65 | 0.21 |
Q4自我发展 | 0.03 | 0.84 |
Q5做我感兴趣的事情 | -0.09 | 0.93 |
Q6发挥我的天赋和能力 | 0.16 | 0.70 |
表2 旋转后的因子载荷矩阵(N = 29162)
题项 | F1 | F2 |
---|---|---|
Q1有助于社会的可持续发展和环境保护 | 0.61 | 0.17 |
Q2帮助他人 | 0.86 | -0.01 |
Q3做对社会发展有重要意义的事情 | 0.65 | 0.21 |
Q4自我发展 | 0.03 | 0.84 |
Q5做我感兴趣的事情 | -0.09 | 0.93 |
Q6发挥我的天赋和能力 | 0.16 | 0.70 |
模型 | CFI | TLI | RMSEA/[90%CI] | SRMR | 自由估计参数数目 | 卡方值 | 自由度 | p值 |
---|---|---|---|---|---|---|---|---|
形态不变 | 0.993 | 0.988 | 0.077[0.073, 0.080] | 0.021 | 76 | 1407.25 | 32 | <0.001 |
阈值不变 | 0.993 | 0.988 | 0.077[0.073, 0.080] | 0.021 | 76 | 1407.10 | 32 | <0.001 |
阈值和载荷不变 | 0.994 | 0.992 | 0.062[0.059,0.064] | 0.022 | 64 | 1257.38 | 44 | <0.001 |
阈值不变对形态不变(变化值) | — | — | — | — | — | — | — | — |
阈值和载荷不变对形态不变(变化值) | 0.001 | 0.004 | 0.015 | 0.001 | 12 | 33.30 | 12 | <0.001 |
阈值和载荷不变对阈值不变(变化值) | 0.001 | 0.004 | 0.015 | 0.001 | 12 | 33.30 | 12 | <0.001 |
表3 使用多组验证性因子分析进行测量不变性检验得到的模型拟合结果(N = 29162)
模型 | CFI | TLI | RMSEA/[90%CI] | SRMR | 自由估计参数数目 | 卡方值 | 自由度 | p值 |
---|---|---|---|---|---|---|---|---|
形态不变 | 0.993 | 0.988 | 0.077[0.073, 0.080] | 0.021 | 76 | 1407.25 | 32 | <0.001 |
阈值不变 | 0.993 | 0.988 | 0.077[0.073, 0.080] | 0.021 | 76 | 1407.10 | 32 | <0.001 |
阈值和载荷不变 | 0.994 | 0.992 | 0.062[0.059,0.064] | 0.022 | 64 | 1257.38 | 44 | <0.001 |
阈值不变对形态不变(变化值) | — | — | — | — | — | — | — | — |
阈值和载荷不变对形态不变(变化值) | 0.001 | 0.004 | 0.015 | 0.001 | 12 | 33.30 | 12 | <0.001 |
阈值和载荷不变对阈值不变(变化值) | 0.001 | 0.004 | 0.015 | 0.001 | 12 | 33.30 | 12 | <0.001 |
参数 类型 | 满足与不满足近似测量不变性的组 | 参数 类型 | 满足与不满足近似测量不变性的组 |
---|---|---|---|
阈值 | 因子载荷 | ||
τ1,1 | 1 2 3 4 | λ1,1 | 1 2 3 4 |
τ1,2 | 1 2 (3) (4) | λ1,2 | 1 2 3 4 |
τ1,3 | 1 2 3 4 | λ1,3 | 1 2 3 4 |
τ1,4 | 1 2 3 4 | λ2,4 | 1 2 3 4 |
τ1,5 | (1) 2 (3) 4 | λ2,5 | 1 2 3 4 |
τ1,6 | (1) 2 (3) 4 | λ2,6 | 1 2 3 4 |
τ2,1 | 1 2 3 4 | ||
τ2,2 | 1 2 3 4 | ||
τ2,3 | (1) (2) (3) (4) | ||
τ2,4 | 1 2 3 4 | ||
τ2,5 | (1) 2 (3) 4 | ||
τ2,6 | 1 2 3 4 |
表4 模型参数的近似测量不变性分析结果(N = 29162)
参数 类型 | 满足与不满足近似测量不变性的组 | 参数 类型 | 满足与不满足近似测量不变性的组 |
---|---|---|---|
阈值 | 因子载荷 | ||
τ1,1 | 1 2 3 4 | λ1,1 | 1 2 3 4 |
τ1,2 | 1 2 (3) (4) | λ1,2 | 1 2 3 4 |
τ1,3 | 1 2 3 4 | λ1,3 | 1 2 3 4 |
τ1,4 | 1 2 3 4 | λ2,4 | 1 2 3 4 |
τ1,5 | (1) 2 (3) 4 | λ2,5 | 1 2 3 4 |
τ1,6 | (1) 2 (3) 4 | λ2,6 | 1 2 3 4 |
τ2,1 | 1 2 3 4 | ||
τ2,2 | 1 2 3 4 | ||
τ2,3 | (1) (2) (3) (4) | ||
τ2,4 | 1 2 3 4 | ||
τ2,5 | (1) 2 (3) 4 | ||
τ2,6 | 1 2 3 4 |
所属因子 | 排名 | 组名称 | 因子 均值 | 因子均值显著小于该组的组名称 |
---|---|---|---|---|
利他因子 | 1 | 普通高校 | 0.05 | 211 C9 |
2 | 985 | 0 | 211 C9 | |
3 | 211 | -0.08 | ||
4 | C9 | -0.18 | ||
自我实现因子 | 1 | C9 | 0.04 | 普通高校 211 |
2 | 985 | 0 | 普通高校 211 | |
3 | 普通高校 | -0.13 | ||
4 | 211 | -0.19 |
表5 不同院校类型学生职业价值观潜因子均值的比较结果(N = 29162)
所属因子 | 排名 | 组名称 | 因子 均值 | 因子均值显著小于该组的组名称 |
---|---|---|---|---|
利他因子 | 1 | 普通高校 | 0.05 | 211 C9 |
2 | 985 | 0 | 211 C9 | |
3 | 211 | -0.08 | ||
4 | C9 | -0.18 | ||
自我实现因子 | 1 | C9 | 0.04 | 普通高校 211 |
2 | 985 | 0 | 普通高校 211 | |
3 | 普通高校 | -0.13 | ||
4 | 211 | -0.19 |
参数 类型 | 满足与不满足近似测量不变性的组 | 参数 类型 | 满足与不满足近似测量不变性的组 |
---|---|---|---|
阈值 | 因子载荷 | ||
τ1,1 | 1 2 3 4 | λ1,1 | (1) 2 3 4 |
τ1,2 | (1) 2 3 4 | λ1,2 | 1 2 3 4 |
τ1,3 | (1) 2 (3) 4 | λ1,3 | (1) 2 3 4 |
τ1,4 | 1 2 3 4 | λ1,4 | 1 (2) 3 4 |
τ1,5 | 1 (2) 3 4 | λ1,5 | 1 2 3 4 |
τ1,6 | 1 (2) 3 (4) | λ1,6 | 1 2 3 4 |
τ2,1 | 1 2 3 4 | λ2,1 | 1 (2) 3 4 |
τ2,2 | 1 2 3 4 | λ2,2 | 1 (2) 3 4 |
τ2,3 | (1) 2 (3) 4 | λ2,3 | 1 2 3 4 |
τ2,4 | 1 2 3 4 | λ2,4 | 1 2 3 4 |
τ2,5 | 1 2 3 4 | λ2,5 | 1 (2) 3 4 |
τ2,6 | 1 2 3 4 | λ2,6 | (1) 2 3 4 |
表6 模型参数的近似测量不变性分析结果(N = 29162)
参数 类型 | 满足与不满足近似测量不变性的组 | 参数 类型 | 满足与不满足近似测量不变性的组 |
---|---|---|---|
阈值 | 因子载荷 | ||
τ1,1 | 1 2 3 4 | λ1,1 | (1) 2 3 4 |
τ1,2 | (1) 2 3 4 | λ1,2 | 1 2 3 4 |
τ1,3 | (1) 2 (3) 4 | λ1,3 | (1) 2 3 4 |
τ1,4 | 1 2 3 4 | λ1,4 | 1 (2) 3 4 |
τ1,5 | 1 (2) 3 4 | λ1,5 | 1 2 3 4 |
τ1,6 | 1 (2) 3 (4) | λ1,6 | 1 2 3 4 |
τ2,1 | 1 2 3 4 | λ2,1 | 1 (2) 3 4 |
τ2,2 | 1 2 3 4 | λ2,2 | 1 (2) 3 4 |
τ2,3 | (1) 2 (3) 4 | λ2,3 | 1 2 3 4 |
τ2,4 | 1 2 3 4 | λ2,4 | 1 2 3 4 |
τ2,5 | 1 2 3 4 | λ2,5 | 1 (2) 3 4 |
τ2,6 | 1 2 3 4 | λ2,6 | (1) 2 3 4 |
所属因子 | 排名 | 组名称 | 因子 均值 | 因子均值显著小于该组的组名称 |
---|---|---|---|---|
利他因子 | 1 | 普通高校 | 0.08 | 985 211 C9 |
2 | 985 | 0 | C9 | |
3 | 211 | -0.07 | C9 | |
4 | C9 | -0.27 | ||
自我实现因子 | 1 | C9 | 0.15 | 985 普通高校 211 |
2 | 985 | 0 | 普通高校 211 | |
3 | 普通高校 | -0.18 | ||
4 | 211 | -0.21 |
表7 不同院校类型学生职业价值观潜因子均值的比较结果(N = 29162)
所属因子 | 排名 | 组名称 | 因子 均值 | 因子均值显著小于该组的组名称 |
---|---|---|---|---|
利他因子 | 1 | 普通高校 | 0.08 | 985 211 C9 |
2 | 985 | 0 | C9 | |
3 | 211 | -0.07 | C9 | |
4 | C9 | -0.27 | ||
自我实现因子 | 1 | C9 | 0.15 | 985 普通高校 211 |
2 | 985 | 0 | 普通高校 211 | |
3 | 普通高校 | -0.18 | ||
4 | 211 | -0.21 |
[1] | 白新文, 陈毅文. (2004). 测量等价性的概念及其判定条件. 心理科学进展, 12(2), 231-239. |
[2] | 刘军, 吴维库. (2005). 心理测量平衡性研究与实例. 心理科学, 28(1), 170-174. |
[3] | 宋琼雅, 张沥今, 潘俊豪. (2021). 贝叶斯多组比较——渐近测量不变性. 心理学探新, 41(1), 69-75. |
[4] | 王孟成. (2014). 潜变量建模与Mplus应用. 重庆大学出版社. |
[5] |
王孟成, 邓俏文, 毕向阳. (2017). 潜变量建模的贝叶斯方法. 心理科学进展, 25(10), 1682-1695.
doi: 10.3724/SP.J.1042.2017.01682 |
[6] |
王阳, 温忠麟, 付媛姝. (2020). 等效性检验——结构方程模型评价和测量不变性分析的新视角. 心理科学进展, 28(11), 1961-1969.
doi: 10.3724/SP.J.1042.2020.01961 |
[7] |
王阳, 温忠麟, 李伟, 方杰. (2022). 新世纪20年国内结构方程模型方法研究与模型发展. 心理科学进展, 30(8), 1715-1733.
doi: 10.3724/SP.J.1042.2022.01715 |
[8] | 温聪聪, 史秋衡. (2022). 对齐法在单因子和三因子多组比较中允许的不等参数率. 心理科学, 45(5), 1230-1242. |
[9] |
温聪聪, 伍伟平, 林光杰. (2019). 对齐(Alignment)——一种新的多群组分析法. 心理科学进展, 27(1), 181-189.
doi: 10.3724/SP.J.1042.2019.00181 |
[10] |
张沥今, 陆嘉琦, 魏夏琰, 潘俊豪. (2019). 贝叶斯结构方程模型及其研究现状. 心理科学进展, 27(11), 1812-1825.
doi: 10.3724/SP.J.1042.2019.01812 |
[11] | Asparouhov, T., & Muthén, B. (2009). Exploratory structural equation modeling. Structural Equation Modeling: A Multidisciplinary Journal, 16(3), 397-438. |
[12] | Asparouhov, T., & Muthén, B. (2014). Multiple-group factor analysis alignment. Structural Equation Modeling: A Multidisciplinary Journal, 21(4), 495-508. |
[13] | Asparouhov, T., & Muthén, B. (2023a). Multiple group alignment for exploratory and structural equation models. Structural Equation Modeling: A Multidisciplinary Journal, 30(2), 169-191. |
[14] | Asparouhov, T., & Muthén, B. (2023b). Penalized structural equation models. Technical Report. 2023. Retrieved Jan 2, 2024, from http://www.statmodel.com/download/PML.pdf |
[15] | Byrne, B. M., & Van de Vijver, F. J. (2010). Testing for measurement and structural equivalence in large-scale cross-cultural studies: Addressing the issue of nonequivalence. International Journal of Testing, 10(2), 107-132. |
[16] | Caycho-Rodríguez, T., Vilca, L. W., Valencia, P. D., Carbajal-Leon, C., Vivanco-Vidal, A., Saroli-Aranibar, D., … Gallegos, W. L. A.. (2021). Cross-cultural validation of a new version in Spanish of four items of the preventive COVID-19 infection behaviors scale (PCIBS) in twelve Latin American countries. Frontiers in Psychology, 12, 763993, 1-20. |
[17] |
Deng, L., & Yuan, K.-H. (2016). Comparing latent means without mean structure models: A projection-based approach. Psychometrika, 81, 802-829.
doi: 10.1007/s11336-015-9491-8 pmid: 26661857 |
[18] | Jak, S., Oort, F. J., & Dolan, C. V. (2013). A test for cluster bias: Detecting violations of measurement invariance across clusters in multilevel data. Structural Equation Modeling: A Multidisciplinary Journal, 20(2), 265-282. |
[19] | Jang, S., Kim, E. S., Cao, C., Allen, T. D., Cooper, C. L., Lapierre, L. M., … Woo, J. -M. (2017). Measurement invariance of the satisfaction with life scale across 26 countries. Journal of Cross-Cultural Psychology, 48(4), 560-576. |
[20] | Kim, E. S., Cao, C., Wang, Y., & Nguyen, D. T. (2017). Measurement invariance testing with many groups: A comparison of five approaches. Structural Equation Modeling: A Multidisciplinary Journal, 24(4), 524-544. |
[21] | Lomazzi, V. (2018). Using alignment optimization to test the measurement invariance of gender role attitudes in 59 countries. Methods, Data, Analyses, 12(1), 77-103. |
[22] |
Marsh, H. W., Guo, J., Parker, P. D., Nagengast, B., Asparouhov, T., Muthén, B., & Dicke, T. (2018). What to do when scalar invariance fails: The extended alignment method for multi-group factor analysis comparison of latent means across many groups. Psychological Methods, 23(3), 524-545.
doi: 10.1037/met0000113 pmid: 28080078 |
[23] | Marsh, H. W., Lüdtke, O., Nagengast, B., Morin, A. J., & Von Davier, M. (2013). Why item parcels are (almost) never appropriate: Two wrongs do not make a right—Camouflaging misspecification with item parcels in CFA models. Psychological Methods, 18(3), 257-284. |
[24] | Millsap, R. E. (2012). Statistical approaches to measurement invariance. Routledge. |
[25] | Munck, I., Barber, C., & Torney-Purta, J. (2018). Measurement invariance in comparing attitudes toward immigrants among youth across Europe in 1999 and 2009: The alignment method applied to IEA CIVED and ICCS. Sociological Methods & Research, 47(4), 687-728. |
[26] |
Muthén, B., & Asparouhov, T. (2012). Bayesian structural equation modeling: A more flexible representation of substantive theory. Psychological Methods, 17(3), 313-335.
doi: 10.1037/a0026802 pmid: 22962886 |
[27] | Muthén, B., & Asparouhov, T. (2013). BSEM measurement invariance analysis. Retrieved Jan 2, 2024, from https://www.statmodel.com/examples/webnotes/webnote17.pdf |
[28] | Muthén, B., & Asparouhov, T. (2018). Recent methods for the study of measurement invariance with many groups: Alignment and random effects. Sociological Methods & Research, 47(4), 637-664. |
[29] | Muthén, L. K., & Muthén, B. O. (2023). Version 8.9 and 8.10 Mplus language addendum. Los Angeles, CA: Author. Retrieved Jan 2, 2024, from https://www.statmodel.com/download/Version%208.9%20and%208.10%20Addendum |
[30] |
Shi, D., Song, H., DiStefano, C., Maydeu-Olivares, A., McDaniel, H. L., & Jiang, Z. (2019). Evaluating factorial invariance: An interval estimation approach using Bayesian structural equation modeling. Multivariate Behavioral Research, 54(2), 224-245.
doi: 10.1080/00273171.2018.1514484 pmid: 30569738 |
[31] | Svetina, D., & Rutkowski, L. (2017). Multidimensional measurement invariance in an international context: Fit measure performance with many groups. Journal of Cross-Cultural Psychology, 48(7), 991-1008. |
[32] | Wen, C., & Hu, F. (2022). Investigating the Applicability of Alignment—A Monte Carlo Simulation Study. Frontiers in Psychology, 13, 845721, 1-13. |
[33] |
Wu, H., & Estabrook, R. (2016). Identification of confirmatory factor analysis models of different levels of invariance for ordered categorical outcomes. Psychometrika, 81(4), 1014-1045.
pmid: 27402166 |
[34] | Yuan, K.-H., Chan, W., Marcoulides, G. A., & Bentler, P. M. (2016). Assessing structural equation models by equivalence testing with adjusted fit indexes. Structural Equation Modeling: A Multidisciplinary Journal, 23(3), 319-330. |
[1] | 尚俊杰, 石祝, 沈科杰. 基于视频游戏的空间能力测评[J]. 心理科学进展, 2025, 33(1): 11-24. |
[2] | 水心宇, 肖雅珩, 陈菁菁, 胡鑫, 张丹. 档案视角的日常多情境个体差异测量[J]. 心理科学进展, 2024, 32(12): 2050-2066. |
[3] | 高旭亮, 李宁. 机器学习方法在测验安全领域的应用[J]. 心理科学进展, 2024, 32(11): 1814-1828. |
[4] | 韩明, 蒯曙光. 面向心理学的虚拟现实实验开发工具[J]. 心理科学进展, 2024, 32(11): 1800-1813. |
[5] | 郭鸣谦, 潘晚坷, 胡传鹏. 认知建模中模型比较的方法[J]. 心理科学进展, 2024, 32(10): 1736-1756. |
[6] | 肖悦, 刘红云, 徐永泽. 密集追踪成对数据分析的模型建构探索[J]. 心理科学进展, 2024, 32(9): 1450-1462. |
[7] | 宋丽红, 汪文义, 丁树良. 认知诊断评估中Q矩阵理论及应用[J]. 心理科学进展, 2024, 32(6): 1010-1033. |
[8] | 赵加伟, 夏涛, 胡传鹏. 心理学研究中预注册的现状、挑战与建议[J]. 心理科学进展, 2024, 32(5): 715-727. |
[9] | 罗晓慧, 刘红云. 密集追踪研究中测验信度的估计:多层结构和动态特性的视角[J]. 心理科学进展, 2024, 32(4): 700-714. |
[10] | 王甦菁, 王俨, 李婧婷, 东子朝, 张建行, 刘烨. 微表情面部肌电跨模态分析及标注算法[J]. 心理科学进展, 2024, 32(1): 1-13. |
[11] | 陈平, 代艺, 黄颖诗. 测验模式效应:来源、检测与应用[J]. 心理科学进展, 2023, 31(10): 1966-1980. |
[12] | 包寒吴霜, 王梓西, 程曦, 苏展, 杨盈, 张光耀, 王博, 蔡华俭. 基于词嵌入技术的心理学研究:方法及应用[J]. 心理科学进展, 2023, 31(6): 887-904. |
[13] | 刘玥, 方梵, 刘红云, 雷怡. 混合效应均值−方差模型的建构和样本量规划探索[J]. 心理科学进展, 2023, 31(6): 958-969. |
[14] | 方俊燕, 温忠麟. 追踪研究中的内生性问题:来源与应对[J]. 心理科学进展, 2023, 31(4): 507-518. |
[15] | 黄顺森, 陈豪杰, 来枭雄, 代欣然, 王耘. 多元宇宙样分析:简介及应用[J]. 心理科学进展, 2023, 31(2): 196-208. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||