元回归中效应量的最小个数需求：基于统计功效和估计精度

表2 参数估计精度在不同情境下对最小效应量个数的需求(τ² = 0.32)

检验方法	τ²=0.32
	β为0		β(均)较小		β(均)较大		β一个较大, 一个较小
	β = 0	β = (0,0)	β = 0.2	β = (0.2,0.2)	β = 0.5	β = (0.5,0.5)	β = (0.2,0.5)
Knha-test	38	38	38	38	38	38	38
z-test	43	43	43	43	43	43	43

4.3 统计功效

本研究中的预期统计功效为0.8。不同模拟情境下的统计功效如附图3、附图4所示(附图见网络版)。

结果表明：①不同情境下, 统计功效均随着效应量个数的增加而不断增加直至稳定, 可以认为在一定范围内效应量个数的增加有利于提升元回归的统计功效。统计功效受到总体效应大小、I类错误率和样本量的影响, 当其他两个条件控制不变时, 提高其中一个因素的水平能够促进统计功效的提升(Valentine et al., 2010), 在元分析中, 效应量个数相当于样本量, 因此提高效应量个数的水平能够促进统计功效的提升; ②同等条件下, 使用Knapp and Hartung检验方法时, 模型达到预期统计功效所需的最小效应量个数一般少于Wald- type z检验方法; ③在不同情境下模型要达到预期统计功效所需的最小效应量个数不同, 详见表3。

表3 统计功效在不同情境下对最小效应量个数的需求

检验方法	τ² = 0.08					τ² = 0.32
	β(均)较小		β(均)较大		β一个较大一个较小	β(均)较小		β(均)较大		β一个较大一个较小
	β = 0.2	β = (0.2, 0.2)	β = 0.5	β = (0.5, 0.5)	β = (0.2, 0.5)	β = 0.2	β = (0.2, 0.2)	β = 0.5	β = (0.5, 0.5)	β = (0.2, 0.5)
Knha-test	30	30	√	√	20	70	70	20	20	50
z-test	38	38	√	√	30	80	80	20	20	52

注：√表示该情况下总能满足预期参数估计要求, 如当τ² = 0.08, β = 0.5时总能达到0.8的预期统计功效。

4.4 I类错误率

本研究中统计检验假设的显著性水平是0.05, I类错误率越接近设定值0.05越好。不同模拟情境下的I类错误率如附图5、附图6所示(附图见网络版)。

结果表明, 纳入更多的效应量一定程度上可以改善Wald-type z检验方法对I类错误率的控制, 但仍明显低于设定值(0.05), 尤其是在剩余异质性较小的情况下; 而Knapp and Hartung检验方法在不同条件下的I类错误率均非常接近设定值, 即相比于Wald-type z检验方法, Knapp and Hartung检验方法对I类错误率的控制能力更好, 这与López-López等人(2017)的研究结果一致。

综上, 元回归模型需要足够数量的效应量以达到参数估计要求, 置信区间宽度会随着效应量个数的增加而不断变窄, 且效应量个数的增加有利于提升元回归的统计功效。将表1至表3进行汇总, 可以得到元回归模型对最小效应量个数的总体需求(见表4、表5)。

表4 不同情境下模型对最小效应量个数的总体需求(Knapp and Hartung检验方法)

回归系数取值	剩余异质性较小		剩余异质性较大
回归系数取值	包含一个调节变量	包含两个调节变量	包含一个调节变量	包含两个调节变量
β(均)为0	20	20	38	38
β(均)较小	30	30	70	70
β(均)较大	20	20	38	38
β₁较小β₂较大	——	20	——	50

表5 不同情境下模型对最小效应量个数的总体需求(Wald-type z检验方法)

回归系数取值	剩余异质性较小		剩余异质性较大
回归系数取值	包含一个调节变量	包含两个调节变量	包含一个调节变量	包含两个调节变量
β(均)为0	23	25	43	43
β(均)较小	38	38	80	80
β(均)较大	23	25	43	43
β₁较小β₂较大	——	30	——	52

从表4、表5可以看出, 为达到参数估计要求, 至少需要纳入20个效应量, 且应当根据实际情况进一步增加效应量个数。例如, 在采用Knapp and Hartung检验方法时, 若研究间剩余异质性较小且回归系数真值(均)较小时效应量需要增加到至少30个。

总的来看, 回归系数的真值较小时, 所需的效应量较多。因此, 在开展元回归研究之前, 研究者可以根据已有的实证或理论研究对回归系数的大小范围进行预估, 进而判断效应量个数的最低要求; 此外, 同等条件下, 剩余异质性越大, 所需的效应量越多。这反映了在元回归研究过程中探索调节变量的重要性, 因为当纳入了合适的调节变量时, 研究间异质性就可以得到有效的解释, 剩余异质性就会降低, 此时效应量个数需求也会降低。

5 讨论

本研究基于心理学常用的效应量Fisher的Z_r对元回归模型行探索, 一方面验证了元回归模型对该效应量的适应性, 另一方面建立了元回归模型中效应量最小个数需求的规范, 进而比较了最小效应量个数需求在包含一个、两个调节变量的模型中的差别, 以及不同检验方法对最小效应量个数需求和模型参数估计的影响。研究结果弥补了现有研究的不足, 同时为元回归在心理学领域的推广应用提供了理论支撑和实质性的参考。

5.1 元回归模型对Fisher的Z_r的适应性

在本研究中, 元回归模型总能得到对参数的无偏估计, 也没有观测到其他变量对参数估计偏差大小或方向的明显影响趋势。结果表明元回归模型能够较好地适应心理学元分析实证研究中常用的Fisher的Z_r这一效应量, 这为元回归分析在心理学领域的推广应用提供了理论支撑。

5.2 元回归模型的效应量最小个数需求

研究结果表明, 元回归模型需要足够数量的效应量以达到参数估计要求。有学者指出, 过少的效应量可能会遗漏重要的信息, 降低研究结果的可信度, 得出的综述性结论也很难得到认可(Cheung & Vijayakumar 2016), 这与本研究的研究结果是一致的。为达到参数估计要求, 研究者至少需要纳入20个效应量, 且应当根据实际情况进一步增加效应量个数。

同等条件下, 剩余异质性较大、回归系数真值较小时所需的效应量较多。因此, 研究者在研究开始前应当对回归系数的大小范围进行预估, 进而对效应量的个数需求有基本的判断, 在研究过程中则需要积极探索合适的调节变量以降低剩余异质性。

5.3 调节变量个数对效应量最小个数需求的影响

在本研究中, 最小效应量个数需求在包含一个、两个调节变量的模型中差别不大。采用Knapp and Hartung检验方法时, 包含一个、两个调节变量的元回归模型在不同情境下的效应量最小个数需求相同; 采用Wald-type z检验方法时, 两种元回归模型在不同情境下的效应量最小个数需求也基本一致。未来研究可进一步增加调节变量个数, 深入探索调节变量个数对效应量最小个数需求的影响。

5.4 参数检验方法的比较

研究结果表明, 同等条件下, 相比于Knapp and Hartung检验方法, 使用Wald-type z检验方法时, 元回归模型对I类错误率的控制较差, 且达到预期统计功效和参数估计精度时所需的最小效应量个数一般较多。

López-López等人(2017)对仅包含一个调节变量的简单元回归模型进行研究, 结果表明了Wald- type z检验方法对I类错误率的控制能力较差, 本研究通过拓展调节变量的个数, 得到基于复杂元回归模型的研究结果, 进一步证实了Wald-type z检验方法在控制I类错误率方面的不足。目前国内心理学元分析研究者多使用CMA软件, 而该软件仅支持Wald-type z检验方法, 考虑到Wald- type z检验方法犯I类错误的概率往往偏大, 已发表的元分析研究中许多显著结果是有待进一步商榷的。未来的元分析研究者也应慎重使用CMA软件。

5.5 不足与展望

本研究仍存在一些有待改进的地方。由于目前缺少对效应量相依性(Dependence)程度的划分标准以及公认的处理方法, 本研究中暂未讨论相依性问题, 仍依据基本模型假设每个原始研究仅提取一个效应量。相依性是指, 当同一个研究中采用多种量表对同一批被试施测或者对同一批被试重复施测时, 同一个研究就能够提取多个效应量, 此时效应量之间就会存在相关(López‐López et al., 2017)。未来研究可对效应量的相依性程度划分进行探究, 进而探讨当存在不同程度的相依性时效应量的最小个数需求。

6 结论与建议

6.1 结论

(1)元回归模型能够较好地适应Fisher的Z_r这一效应量;

(2)为达到参数估计要求, 元回归分析至少需要20个效应量, 且应当根据实际情况进一步增加。纳入合适的调节变量能降低对效应量的个数需求;

(3)效应量的最小个数需求在包含一个、两个调节变量的模型中差别不大;

(4) Wald-type z检验方法在元回归分析中易犯I类错误。

6.2 建议

基于研究结果, 下面总结了几点建议。

(1)元回归模型可以成为整合和比较心理学领域研究结果的有效工具;

(2)实证研究者应慎重采用内嵌Wald-type z检验方法的CMA软件, 推荐使用R软件的metafor包及其中的Knapp and Hartung检验方法;

(3)实证研究至少需要20个效应量, 且应当根据实际情况进一步增加效应量个数。在研究开始前, 研究者应对回归系数的大小范围进行预估, 在研究过程中则需要探索合适的调节变量以降低剩余异质性。采用Knapp and Hartung检验方法的情况下, 当剩余异质性较小且回归系数(均)较小时需增至30个效应量; 当剩余异质性较大时, 效应量增至38个可满足要求, 此时若回归系数一个较大一个较小需增至50个效应量, 若回归系数(均)较小需增至70个;

(4)这几点建议可以对未来审稿人在评估一个元回归研究的质量时提供参考, 有助于考察该研究是否纳入了足够的效应量个数以获得稳定可信的结果。

附录1

参数估计偏差：

附表1 包含一个调节变量时不同效应量个数下的参数估计偏差(knha-test)

k	τ² = 0.08			τ² = 0.32
k	β = 0	β = 0.2	β = 0.5	β = 0	β = 0.2	β = 0.5
20	-0.0004	-0.0001	0.0003	-0.0012	0.0008	0.0056
40	0.0009	0.0004	-0.0001	-0.0031	-0.0011	-0.0009
60	0.0006	0.0000	-0.0009	0.0010	-0.0014	-0.0009
80	0.0004	-0.0003	-0.0003	0.0000	0.0003	-0.0005
100	-0.0007	0.0000	0.0002	-0.0006	0.0004	0.0000
120	0.0000	0.0000	-0.0004	0.0003	-0.0001	0.0002

附表2 包含一个调节变量时不同效应量个数下的参数估计偏差(z-test)

k	τ² = 0.08			τ² = 0.32
k	β = 0	β = 0.2	β = 0.5	β = 0	β = 0.2	β = 0.5
20	0.0000	0.0000	0.0003	0.0026	0.0005	-0.0009
40	0.0007	0.0004	-0.0009	0.0000	-0.0004	0.0003
60	-0.0003	0.0007	-0.0001	-0.0005	0.0000	0.0003
80	0.0000	0.0001	0.0008	0.0001	0.0013	0.0017
100	-0.0002	0.0001	-0.0001	0.0005	-0.0009	-0.0014
120	0.0001	0.0003	-0.0006	0.0007	0.0000	0.0002

附表3 包含两个调节变量时不同效应量个数下的参数估计偏差(knha-test)

k	τ² = 0.08				τ² = 0.32
k	β = (0, 0)	β = (0.2, 0.2)	β = (0.5, 0.5)	β = (0.2, 0.5)	β = (0, 0)	β = (0.2, 0.2)	β = (0.5, 0.5)	β = (0.2, 0.5)
20	-0.0008	0.0006	-0.0007	0.0003	0.0001	-0.0007	0.0003	-0.0005
40	0.0003	0.0006	-0.0001	0.0008	-0.0008	0.0001	-0.0017	-0.0005
60	0.0000	-0.0006	-0.0003	0.0000	0.0004	0.0001	0.0003	-0.0002
80	0.0001	0.0002	-0.0004	0.0001	0.0005	0.0005	0.0006	0.0001
100	-0.0002	0.0002	-0.0003	0.0001	0.0004	0.0006	-0.0003	0.0002
120	0.0000	0.0001	0.0001	-0.0001	-0.0003	0.0000	0.0002	0.0004

附表4 包含两个调节变量时不同效应量个数下的参数估计偏差(z-test)

k	τ² = 0.08				τ² = 0.32
k	β = (0, 0)	β = (0.2, 0.2)	β = (0.5, 0.5)	β = (0.2, 0.5)	β = (0, 0)	β = (0.2, 0.2)	β = (0.5, 0.5)	β = (0.2, 0.5)
20	-0.0003	-0.0002	0.0009	0.0006	0.0005	-0.0002	0.0000	0.0000
40	-0.0008	-0.0001	0.0000	-0.0002	0.0002	-0.0002	0.0002	0.0010
60	0.0001	-0.0002	-0.0004	-0.0001	0.0010	0.0002	0.0005	0.0001
80	0.0000	-0.0003	-0.0001	0.0002	0.0005	-0.0002	-0.0001	0.0001
100	0.0001	0.0000	0.0000	0.0000	0.0006	-0.0003	0.0000	0.0002
120	0.0001	0.0002	0.0005	-0.0001	0.0005	0.0005	0.0000	0.0004

附录2

附图1

附图1 包含一个调节变量时不同效应量个数下的置信区间宽度

附图2

附图2 包含两个调节变量时不同效应量个数下的置信区间宽度

附图3

附图3 包含一个调节变量时不同效应量个数下的统计功效

附图4

附图4 包含两个调节变量时不同效应量个数下的统计功效

附图5

附图5 包含一个调节变量时不同效应量个数下的I类错误率

附图6

附图6 包含两个调节变量时不同效应量个数下的I类错误率

附录3

R语句

#以模型一(仅包含一个调节变量)为例#

install.packages ("metafor")

library (metafor)

K<-20 #设定效应量个数K, 有6种取值20, 40, 60, 80, 100, 120

β<-0.0 #设定回归系数真值, 有3种取值0, 0.2, 0.5

#需要生成两个回归系数时, 添加下标即可, 如β_m<-0, β_n<-0

tau2<-0.08 #设定剩余异质性, 有两种取值0.08, 0.32

output<-list(id = NULL, beta1 = NULL, beta2 = NULL, ci.lb2 = NULL, ci.ub2 = NULL)

for (i in 1:10000){

output$\$ $id<-append (output$\$ $id, i)

nn<-rlnorm (K, meanlog = 1, sdlog = 0.9)

n<- round (nn*K) #生成被试量n

n[n<25]<-25

n[n>1000]<-1000

vv<-1/(n-3)

vi<-sqrt(vv)

e<-rnorm (K, mean = 0, sd = sqrt(vv + tau2))

xi<-rnorm (K) #生成调节变量x

yi<-0+xi*β+e #通过元回归模型一生成因变量y, 其中截距固定为0

#拟合元回归函数, 获得回归系数估计值

out<-rma.uni (yi, vi, mods = ~xi, tau2 = tau2, test = "knha", method = "DL") #test指定了检验方法

output$\$ $beta1<-append (output$\$ $beta1, out$\$ $b[1])

output$\$ $beta2<-append (output$\$ $beta2, out$\$ $b[2])

output$\$ $ci.lb2<-append (output$\$ $ci.lb2, out$\$ $ci.lb[2])

output$\$ $ci.ub2<-append (output$\$ $ci.ub2, out$\$ $ci.ub[2])

write.table (output, "D:/20-0.0-0.08.txt")

}

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

董圣杰, 曾宪涛, 郭毅 . ( 2012).

R软件Metafor程序包在Meta分析中的应用

中国循证医学杂志, 12( 9), 1141-1147.

[2]

方杰, 张敏强 . ( 2012).

中介效应的点估计和区间估计:乘积分布法、非参数Bootstrap和MCMC法

心理学报, 44( 10), 1408-1420.

[3]

刘俊, 秦传燕 . ( 2018).

企业社会责任与员工绩效的关系:一项元分析

心理科学进展, 26( 7), 1152-1164.

[4]

王超, 袁蒙蒙, 姜媛, 方平 . ( 2019).

宜人性对企业家成就的影响:来自元分析的证据

心理与行为研究, 17( 1), 126-133.

[5]

张天嵩, 刘江波, 钟文昭 . ( 2009).

Stata在探索异质性来源—Meta回归分析中的应用

循证医学, 9( 1), 48-50.

[6]

张云权, 马露, 冯仁杰, 朱耀辉, 李存禄 . ( 2015).

模型回归系数的合并分析在R软件metafor包中的实现

中国循证医学杂志, 15( 3), 367-372.

[7]

Borenstein

., Hedges

L. V

., Higgins

J. P. T

., & Rothstein

H. R

. ( 2009).

Introduction to meta-analysis

UK: John Wiley & Sons, Ltd., Publication.

[本文引用: 3]

[8]

Borenstein

., Hedges

L. V

., Higgins

J. P.T

., & Rothstein

H. R

. ( 2010).

A basic introduction to fixed-effect and random-effects models for meta-analysis

Research Synthesis Methods, 1( 2), 97-111.

[9]

Cafri

., Kromrey

J. D

., & Brannick

M. T

. ( 2010).

A meta-analysis: Empirical review of statistical power, type I error rates, effect sizes, and model selection of meta-analyses published in psychology

Multivariate Behavioral Research, 45( 2), 239-270.

[10]

Card

N. A

. (2012). Applied meta-analysis for social science research. New York: The Guilford Press.

[11]

Cheung, M. W. L., & Vijayakumar, R . ( 2016).

A guide to conducting a meta-analysis

Neuropsychology Review, 26( 2), 121-128.

[本文引用: 5]

[12]

Çoğaltay

., & Karadağ

. . ( 2015). Introduction to meta-analysis. In E. Karadağ (Eds.), Leadership and Organizational Outcomes (2nd ed, pp. 19-28). Switzerland: Springer International Publishing.

[13]

Cohn, L. D., & Becker, B. J . ( 2003).

How meta-analysis increases statistical power

Psychological Methods, 8( 3), 243-253.

[14]

Field, A. P . ( 2001).

Meta-analysis of correlation coefficients: A Monte Carlo comparison of fixed- and random-effects methods

Psychological Methods, 6( 2), 161-180.

[本文引用: 2]

[15]

Glass, G. V . ( 1976).

Primary, secondary, and meta-analysis of research

Educational Researcher, 5( 10), 3-8.

[16]

Huizenga

H. M

., Visser

., & Dolan

C. V

. ( 2010).

Testing overall and moderator effects in random effects meta-regression

British Journal of Mathematical and Statistical Psychology, 64, 1-19.

[17]

Knapp, G., & Hartung, G . ( 2003).

Improved tests for a random effects meta-regression with a single covariate

Statistics in Medicine, 22, 2693-2710.

[18]

López-López

J. A

., Noortgate

W. V. D

., Tanner-Smith

E. E

., Wilson

S. J

., & Lipsey

M. W

. ( 2017).

Assessing meta- regression methods for examining moderator relationships with dependent effect sizes: A Monte Carlo simulation

Research Synthesis Methods, 8( 4), 435-450.

[本文引用: 13]

[19]

Murphy, K. R . ( 2017).

What inferences can and cannot be made on the basis of meta-analysis?

Human Resource Management Review, 27( 1), 193-200.

[20]

Schmidt, F. L . ( 2017).

Statistical and measurement pitfalls in the use of meta-regression in meta-analysis

Career Development International, 22( 5), 469-476.

[21]

Steel, P. D., & Kammeyer-Mueller, J. D . ( 2002).

Comparing meta-analytic moderator estimation techniques under realistic conditions

Journal of Applied Psychology, 87( 1), 96-111.

[本文引用: 6]

[22]

Suchotzki

., Verschuere

., Bockstaele

B. V

., Ben-Shakhar

., & Crombez

. ( 2017).

Lying takes time: A meta-analysis on reaction time measures of deception

Psychological Bulletin, 143( 4), 428-453.