ISSN 1671-3710
CN 11-4766/R
主办:中国科学院心理研究所
出版:科学出版社

心理科学进展, 2020, 28(1): 178-190 doi: 10.3724/SP.J.1042.2020.00178

研究方法

变量间的网络分析模型及其应用

蔡玉清,1, 董书阳2, 袁帅3, 胡传鹏,4,5

1 清华大学人文学院, 北京 100084

2 Department of Developmental Psychology, Utrecht University, Utrecht,3584CS, Netherland

3 Department of Methodology and Statistics, Tilburg University, Tilburg, 5037AB, Netherland

4 German Resilience Center, Mainz, 55131, Germany

5 Neuroimaging Center (NIC), University Medical Centre of the Johannes Gutenberg University, Mainz, 55131, Germany

Network analysis and its applications in psychology

CAI Yuqing,1, DONG Shuyang2, YUAN Shuai3, HU Chuan-Peng,4,5

1 Department of Humanity, Tsinghua University, Beijing 100084, China

2 Department of Developmental Psychology, Utrecht University, Utrecht,3584CS, Netherland

3 Department of Methodology and Statistics, Tilburg University, Tilburg, 5037AB, Netherland

4 German Resilience Center, Mainz, 55131, Germany

5 Neuroimaging Center (NIC), University Medical Centre of the Johannes Gutenberg University, Mainz, 55131, Germany

通讯作者: 蔡玉清, E-mail:cyq_2016@outlook.com胡传鹏, E-mail:hcp4715@hotmail.com

收稿日期: 2019-05-27   网络出版日期: 2020-01-15

基金资助: 清华大学学术推进计划资助.  

Received: 2019-05-27   Online: 2020-01-15

摘要

变量间的网络分析模型近年来被广泛应用于心理学研究。不同于将潜变量作为观测变量的共同先导因素的潜变量模型, 网络分析模型将观测变量作为初级指标, 采用图论的方法建立观测变量之间的关系网络, 其中变量为网络的节点, 而变量间的关系是节点之间的连线。因此网络分析可以突显观测变量之间的联系以及观测变量相互影响而形成的系统。通过变量网络中基于各个节点特征的指标(如中心性)以及基于整体结构特征的指标(如小世界性), 网络分析为研究各种心理现象提供了新的可视化的描述方式和理解视角。近10年来, 网络分析的方法已在人格心理学、社会心理学和临床心理学等领域得到一定的应用。未来研究应继续发展和完善网络分析模型的理论和方法, 使之运用到更多的数据类型和更广的研究领域中。

关键词: 网络分析 ; 潜变量模型 ; 心理测量 ; 临床心理学 ; 人格特质

Abstract

Network analysis models (or Network Psychometrics) have been widely used in psychology research in recent years. Unlike latent variable models which conceive observable variables as outcomes of unobservable latent factors, network analysis models apply the graph theory to construct a network to depict the associations among observable variables. The observable variables are treated as nodes and the associations between them are treated as edges. As such, network analysis models reveal the relationships among observable variables and the dynamic system resulted from the interactions between these observable variables. With indices reflecting individual nodes’ characteristics (such as centrality) and network structural characteristics (such as small-worldness), network analysis models provide a new perspective for visualization and for studying various psychological phenomena. In the past decade, network analysis models have been applied in the fields of personality, social, and clinical psychology as well as psychiatry. Future research should continue to develop and improve the methods of network analysis models, making them applicable to more types of data and broader research fields.

Keywords: network analysis ; latent variable ; psychometrics ; psychopathology ; personality traits

PDF (967KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

蔡玉清, 董书阳, 袁帅, 胡传鹏. 变量间的网络分析模型及其应用. 心理科学进展[J], 2020, 28(1): 178-190 doi:10.3724/SP.J.1042.2020.00178

CAI Yuqing, DONG Shuyang, YUAN Shuai, HU Chuan-Peng. Network analysis and its applications in psychology. Advances in Psychological Science[J], 2020, 28(1): 178-190 doi:10.3724/SP.J.1042.2020.00178

1 引言

准确地描述和解释人类心理与行为是科学心理学的主要目标之一。在过去几十年中, 研究者采用潜变量模型(latent variables model) (1本文使用潜变量模型作为latent variable models的统称。关于潜变量模型下的不同理论, 见Millar (2011)。)来描述和测量人类心理与行为并取得了丰硕的成果。例如, 人格心理学中的大五人格模型(“Big Five” personality model)以个体不同的行为倾向作为观测变量, 采用五个潜在的特质(如外向性)来描述不同个体在这些行为倾向上的差异, 进而表征为个体间不同的人格特点(McCrae & Costa, 2008)。又如, 临床心理学中的精神疾病诊断与统计手册第五版(Diagnostic and Statistical Manual of Mental Disorders, DSM-V; American Psychiatric Association (APA), 2013)将不同的症状作为观测变量, 再将个体经诊断分类的精神障碍作为导致症状出现的潜变量。近年来, 一种新的对个体心理特质进行描述的方法——网络分析模型(network analysis model)——迅速兴起; 此方法作为对潜变量模型的补充, 为理解人类心理现象提供了新的思路, 并逐渐被应用到人格与社会心理学、临床心理学、精神病学等领域的研究中。

网络分析的方法是将某一系统的特征和信息以网络的形式呈现, 系统由“节点(nodes)”和“连线(edge)”组成。在传统网络分析研究中, 节点一般代表实体(神经元、车站、人), 而连线代表实体之间的联系(突触、路线、人际关系)。在数据驱动下, 节点与连线的变化特点显示出网络的特征。相较于这一类传统网络分析模型, 基于观测变量的网络分析模型(以下简称为网络分析)的节点是态度、感受、行为等观测变量, 而连线则是这些观测变量之间的联系(Borsboom, 2008), 这一方法也被称为心理测量网络(psychometric network)、症状网络(symptom network)或者是特质网络(trait network)。图1左侧网络展示的是将高斯图论模型(Gaussian graphical model)或称偏相关网络模型(partial correlation model)运用于人格问卷中三个维度数据所形成的网络。在网络分析方法中, 高斯图论模型的应用最广泛, 故本文随后将以高斯图论模型为主, 介绍网络分析的基本原理、主要分析指标、特点及其在多个心理学领域的应用, 并在此基础上具体讨论其他种类的网络模型及网络分析未来发展的方向。

1 网络分析的基本原理

网络分析最早可追溯到1735年Leonard Euler解决的哥尼斯堡桥梁建设问题(the Seven Bridges of Königsberg; Newman, 2001)。随着数学中图论(graph theory)的出现, 网络分析及其数据拟合方法在20世纪得到了极大的发展, 在自然科学与社会科学领域的研究中获得广泛应用。例如, 信息科学中的网页网络(web network)和引文网络(citation-based network)、生物科学中的基因调节网络(gene regulatory network) (Levine & Davidson, 2005; Teichmann & Babu, 2004)、大脑功能联结网络(Park & Friston, 2013; Sporns & Honey, 2006; Xia & He, 2017)、社会科学领域中的社交网络(social network) (Borgatti, Mehra, Brass, & Labianca, 2009)。其中, Stanley Milgram关于社交网络的“六度隔离”效应(Milgram, 1967; Travers & Milgram, 1969)为心理学研究者所熟知。

仅考虑节点与节点间是否存在联系的网络被称为无加权相关网络(unweighted association network)。如在社交网络分析中, 根据提名法测量是否互为好友而建立的网络为无加权网络, 每条连线仅代表节点(这里表示个体)之间联系的有无。无加权网络仅通过有或者无的二元分类描述节点之间的联系, 因此往往无法完整描述系统特点, 如对于心理学中采用连续型指标的研究, 不仅需要描述观测变量间联系的有无, 还需要考虑这些联系的强弱程度。此时, 观测变量之间的联系更适合使用加权相关网络(weighted association network)进行描述, 连线在这一类型的网络模型中表征的是节点间联系的强弱(Borsboom, 2008)。由于模型拟合方法的差异, 研究者在无加权相关网络的指标的基础上增加对连线加权值影响的考虑, 从而获得加权相关网络中描述各节点以及网络整体结构的指标。Cramer等研究者于2010年首次将加权相关网络应用于心理学实证研究中——他们构建了精神障碍的网络来探讨重度抑郁障碍(major depression disorder)和广泛性焦虑障碍(generalized anxiety disorder)的共病, 揭示了二者在症状上的广泛重叠(Cramer, Waldorp, van der Maas, & Borsboom, 2010)。

图1

图1   简短大五人格问卷中宜人性(agreeableness)、神经质(neuroticism)和外向性(extroversion)三个维度的偏相关网络模型。测量相同特质的问卷条目由相同颜色的节点表示(数据、代码及问卷条目见在线补充材料或osf.io/g74dz/)。条目与条目之间的联系由连线表示, 绿色连线代表正相关, 红色连线代表负相关, 连线越粗代表相关性越强。左:偏相关网络模型;右:GLASSO网络模型。数据来源:Liu等(2019)。


Cramer等(2010)的研究运用高斯图论模型来分析症状的关系网络, 随后此模型成为采用网络分析处理横断数据的基础方法。不过, 将网络分析应用于心理测量的数据时, 由于节点数目众多, 网络中可能存在许多“虚假”相关, 即如果两个节点均与第三个节点相关, 即使这两个节点本身无直接联系, 但二者仍然可能在统计上呈显著相关。为避免这种情况带来的误导性, Lauritzen (1996)Pourahmadi (2011)提出了一个解决方法:在网络分析中使用偏相关系数以更准确地表征节点之间的真实联系。偏相关网络模型是以加权相关网络为基础的一种模型(McNally et al., 2015), 其考虑了两节点间相关被另一节点影响的可能性, 为进一步准确探究节点间的关系提供了途径(Borsboom & Cramer, 2013)。偏相关系数的绝对值取值范围为0到1, 某两个节点之间的偏相关系数指的是在保障网络中的其他信息恒定后这两点之间的相关, 因此也被称作“条件独立性相关(conditional independence association)”。

在实际建模过程中, 当网络中所有节点间联系均以连线的形式展现时, 网络图像会显得过于繁复而难以对结果进行有效解释。故研究者在偏相关网络模型的基础上, 引入惩罚因子(penalization factor), 如图像最小绝对值收敛和选择算法(Graphic Least Absolute Shrinkage and Selection Operator, GLASSO; Friedman, Hastie, & Tibshirani, 2008), 以删除网络中联系程度相对较弱的连线。通过减少连线数目, 模型可以拟合出更容易被研究者解释也更加具备预测准确性的网络结构。图1右侧网络为使用图像最小绝对值收敛和选择算法这一惩罚因子后的网络分析结果, 和左侧网络相比, 右侧网络更加简洁, 也更能清晰地显示出网络中的重要连线, 使得该模型更易解读。

基于偏相关分析的高斯图论模型仅适用于所有变量都是连续型变量的横断数据, 研究者随后也提出了针对其他数据类型的网络分析方法。例如, 对于二分变量数据, van Borkulo等(2014)提出一种基于易辛模型(Ising model)的网络分析方法, 使用逻辑回归(logistic regression)计算节点之间联系强弱, 该网络分析方法同样可以使用相似的惩罚因子来简化网络。又如, 对于数据中既有分类变量也有连续变量的情况, Haslbeck和Waldorp (2015)提出了用混合图形模型(mixed graphical model)来建立相应网络的分析方法。而针对纵向数据, 研究者提出了采用变量之间的回归系数来表征节点连线数值的分析方法(Epskamp, Waldorp, Mõttus, & Borsboom, 2018)( 一般而言, 针对纵向数据所进行的网络分析将会形成两种网络:以回归系数作为节点指标的纵向网络, 以及以偏相关系数(在这里是回归残值之间的偏相关系数)为节点指标的横向网络, 具体见Epskamp et al.(2018)。)。在纵向网络模型中, 由于变量测量在时间上有先后顺序, 变量之间的相互预测成为了可能。针对不同种类的纵向数据, 研究者逐步发展出了其他种类的网络模型, 例如针对单一观测变量时间序列数据的向量自回归模型(vector autoregressive model; Bringmann et al., 2013)和主成分自回归模型(principal component vector autoregressive model; Bulteel, Tuerlinckx, Brose, & Ceulemans, 2018), 针对多个观测变量的多层自回归网络模型(multilevel vector autoregressive model; Epskamp et al., 2018)以及针对少数几个测量时间点的交叉滞后网络模型(cross-lagged network model; Rhemtulla, van Bork, & Cramer, 2019)。这些模型都能够计算下一章节所介绍的网络模型指标, 只是在模型假设、模型构建和模型拟合过程中有所差别。限于文章篇幅, 本文不对这些模型展开具体介绍。

2 网络分析的主要指标

网络分析采用高斯图像模型为基础构建变量间网络, 可以得到传统潜变量模型难以捕捉的、对观测变量间关联和结构进行描述的指标。在实际研究中, 这些指标可以给研究者提供关于变量间联系的新视角, 从而帮助解决潜变量模型无法应对的研究问题(尤其是探索性研究问题)。具体而言, 网络分析的指标包括描述节点特征的指标和描述网络整体特征的指标。

2.1 描述节点特征的指标

2.2.1 中心性(centrality)

中心性代表了一个节点与其他节点联系的多少、强度以及紧密程度, 改变中心性高的节点会影响更多其他节点。中心性是显示节点特点的重要指标:一个节点的中心性衡量了其与其他节点的直接相关程度(Costantini, Epskamp, et al., 2015)。中心性包括三个具体指标:点度中心性(degree)、接近中心性(closeness)和中介中心性(betweenness)。对于无加权网络来说, 一个节点的点度中心性是与该节点直接相连的其他节点的数量;但这一指标未考虑网络中不与该节点直接相连的其他部分, 故无法估计该节点在整个网络中的重要性和地位。而接近中心性和中介中心性引入了最短路径距离(shortest path length, SPL)的概念, 将网络中所有节点都纳入衡量特定节点中心性的标准(Bringmann et al., 2013), 因此可以衡量某节点在整个网络中的地位。

在无加权相关网络中, 两节点之间的SPL为连接二者所需最短连线的数目(例如, 如两节点直接连接, 则SPL为1; 如两节点无法通过任何连线相连, 则SPL为无穷大)。接近中心性是网络中所有其他节点到该节点的SPL之和的倒数(因而当网络中存在相互分离的不同部分时, 即存在某些节点无法通过连线相互联系时, 该网络中所有节点的接近中心性均等于0)。中介中心性也和最短路径密切相关, 它表示的是某节点在其他任意两节点最短路径上的频率。从变量互动性的角度来理解, 接近中心性相对较高的节点相对更容易通过直接(SPL = 1)或者间接(SPL≠1)的方式被其他节点的变异所影响(Costantini, Epskamp, et al., 2015); 而中介中心性相对较高的节点往往在变量互动过程中发挥非常重要的作用, 直接或者间接参与网络的变化过程。

对于加权相关网络来说, 在计算SPL时需要在无加权相关网络SPL的基础上考虑连线加权值(weights of edges)和连线数量(numbers of edges)的影响。早期研究仅将连线加权值纳入最短路径指标和中心性的计算中, 而忽略了连线数量(Freeman, 1978)。某节点所有连线的加权值之和作为该节点的点度中心性指标, 称为强度(strength), 此时两节点的最短路径被定义为连结两点所有可能路径中连线加权值的倒数之和最小的路径。在这一定义下, 某节点的最短路径可能并非是两节点间连线数量最少的路径, 如图2中A和B之间的最短路径为A-C-B (即1/0.5 + 1/0.2 = 7), 而非A-B (1/0.1 = 10)。

图2

图2   包含4个节点的加权网络示意图, 各连线间加权值如各连线上数值所示


但最近的学术共识认为加权值和连线数量都是衡量节点重要性的因素, 因此都需要被纳入最短路径、接近中心性和中介中心性的计算之中; 然而, 在不同的网络中, 二者的相对重要程度应该有所不同。因此, Opsahl, Agneessens和Skvoretz (2010)引入调整参数(tuning parameter, α)来调节不同网络中计算中心性时加权值和连线数量的比重:当α为0时, 不考虑加权值; 当α为1时, 不考虑连线数量(对图1右侧网络中心性的计算结果见补充材料表S3以及图S1)。

2.1.2 可预测性(predictability)

尽管中心性反映了特定节点与相连节点之间的联系, 但它无法表明该节点在多大程度上受到与它相连的其他节点的影响, 即该节点的变异(variance)在多大程度上被那些与之相连的节点的变异所解释。为了在加权相关网络中量化这一指标, Haslbeck和Waldrop (2015)提出可预测性指标来表示某一节点的变异在多大程度上可以由与其相连节点的变异所预测(其逻辑类似于回归分析中的解释率)。网络中所有节点的平均可预测性反映了该网络受到网络外因素(如环境和生物因素)的影响程度, 如果平均可预测性较高, 即说明该网络结构内部能较好地相互预测, 外部因素能解释的变异较少。

2.1.3 集群性(clustering)

集群性关注的是与某一特定节点相连的其他节点之间的联系。这里需要引入“三角(triangle)”的定义:对某一节点及与它相连的任意两个其他节点而言, 如果这三个节点形成了一个“三角” (如图2中三个节点A、B、C), 网络中的信息就可以在三点间自由流动。一个节点的集群性通过聚集系数(clustering coefficient)衡量, 具体为该节点与相连节点真实形成的三角个数与可能形成的三角个数的比值。如对于图2中的A节点, 其真实形成的三角只有“ABC”, 共一个, 而其可能形成的三角为“ABC”, “ACD”和“ABD”, 共3个, 因此节点A的聚集系数为1/3。

在实证研究中, 中心性、可预测性和集群性会提示网络中某一节点(即观测变量)的地位、特点和利用价值。例如, 在精神障碍的网络中, 点度中心性越高的症状可能对病人的影响也越大(3 但由于横向数据中的相关性无法推测因果结论, 因此无法验证点度中心性高的症状是否确实对病人有更严重的影响, 基于此作结论需要更加谨慎。), 因为出现这一症状的患者同时出现其他症状的可能性也较高(McNally et al., 2015)。接近中心性和中介中心性则衡量了节点对网络整体信息传递的重要程度(Costantini, Epskamp, et al., 2015; Freeman, 1978), 根据网络分析的假设, 两个节点之间的信息往往通过两者之间的最短路径传递(Costantini, Epskamp, et al., 2015)。接近中心性较高的症状, 由于它与精神障碍网络中其他症状的总体距离较近, 它产生的影响会较快蔓延到其他症状(Borgatti et al., 2009)。而中介中心性较高的节点, 由于它对网络中其他节点的最短路径影响较大, 当它从网络中移除的时候, 信息的传递成本(总体路径)大大增加。在共病相关的研究中, 共病网络的桥接症状往往中介中心性较高, 这些症状同时影响着两个或多个不同精神障碍里其他症状的发生和发展(McNally, 2016)。再如, 可预测性在临床治疗中具有重要意义:就个体症状而言, 当某一症状可预测性很低时, 希望通过改变其相连节点以改善这一症状的做法是难以奏效的; 就疾病网络而言, 当某精神障碍的平均可预测性较高时, 采用外部因素来治疗该精神障碍的难度则可能较高(Haslbeck & Fried, 2017)。

2.2 描述网络整体层面的指标

2.2.1 连接强度(connectivity)

连接强度与网络中所有节点两两之间的最短路径长度的均值(average shortest path length; 习惯上以L来表示)相关(4 需要注意的是, 在这一定义下, 连接强度不适用于存在孤立节点(不与同一网络中其他任何节点相连的节点)的网络, 这是因为孤立节点与其他任何节点的最短路径长度均为无限大。在这种情况下, 一如下文中所演示的, 推荐计算网络中某一组成成分的连接强度。)。L越小, 该网络的连接强度就越大。如前文所述, 加权网络和无加权网络具有不同的最短路径长度的计算方法, 相应地, 连接强度的计算方式也不同。网络连接强度越高, 整个网络的连接就越紧密, 内部稳定性越高, 也就是说, 需要移除更多的节点来使剩下的节点不再相连(Tio, Epskamp, Noordhof, & Borsboom, 2016)。网络连接强度是比较两个网络是否相同的重要指标之一(van Borkulo et al., 2017), 假设图2代表基于女性样本的网络1, 节点ABC两两相连, 仅有A和D相连, B和C与D不相连; 在另一个基于男性样本的网络2中, 节点BCD相连, 仅有B与A相连, C和D与A不相连。通过对比发现, 网络1和网络2的结构不同, 但连接强度相同。

2.2.2 传递性(transitivity)

传递性即全局聚集系数(global clustering coefficient), 和节点的聚集系数具有高度相关性。与计算聚集系数使用的“三角”相对应, 当三节点间仅有两条连线时, 即形成“相连的三节点” (connected triple), 如图2中A、B、D三节点间有两条连线, 形成了一个“相连的三节点”, 而一个三角(如“ABC”)则包含三个“相连的三节点”。Newman (2003)定义无加权相关网络中传递性为三角个数的三倍与“相连的三节点”个数的比值, Opsahl和Panzarasa (2009)将传递性指标拓展至加权相关网络中。传递性越高, 表明网络中可探测到的三个节点形成的聚集体越多, 变量更容易两两聚集而非离散性地相互联系(Costantini, Epskamp, et al., 2015)。虽然网络传递性与连接强度都与网络整体连线密度相关, 但两者也有着重要区别——当网络中存在相互分离的几个部分时, 网络的总体连接强度为0而传递性却可能很强。

2.2.3 小世界指标(small-worldness index, SWI)

小世界指标通过同时考虑平均最短路径长度和全局聚集系数后计算得到, SWI = (C/C’) / (L/L’), 其中L和C为该网络的最短路径长度和全局聚集系数, L’和C’为具有相同节点数和连线数的ER随机网络(Erdős-Rényi model; Erdős & Rényi, 1959)(5 ER随机网络是由匈牙利数学家Erdős和Rényi提出的随机图理论(random graph theory)建立的随机网络, 可以通过确定一定的节点数和连线数建立, 也可以通过确定一定的节点数以及各连线可能存在的概率确定, 这一理论开创了对复杂网络结构的系统性分析。)的相同指标。小世界指标反映的是, 和随机网络相比, 任意两节点通过其他节点产生联系的难易程度(Marcus, Preszler, & Zeigler-Hill, 2018)。当SWI大于1 (或严格条件下大于3)时, 该网络具有小世界特点, 即具有高连接强度、节点间平均路径较短、整体联系紧密等特征(Borsboom & Cramer, 2013)。

描述网络整体特征的三个指标(连接强度、传递性以及小世界指标)对于理解心理现象具有启示性意义。例如, Cao等(2019)对不同性别的青少年创伤后应激反应症状的网络分析发现, 女性网络结构的连接强度较高, 较难取得积极的治疗效果, 因此建议在医疗资源匮乏的情况下, 可能应该优先对女性采取干预措施。又如在本文示例的人格网络分析模型(图1)中, 小世界指标为1.38, 即在不严格的条件下该网络具有小世界的特点, 说明大五人格问卷中某人格“特质”下某一行为条目并非仅单一与该特质所包含的其他行为条目相关, 反而是在各个条目所测量的行为间存在广泛的联系。

需要注意的是, 上述对网络整体描述的指标不仅适用于整个网络, 也适用于网络中不与成分外节点相连而独立存在的各个组成成分(component)。在一些网络中, 存在包含节点数目众多(无明确标准, 一般50%左右)的组成成分, 这时这种组成成分被称作巨大组成成分(giant component) (Newman, 2001), 对于这些具有巨大组成成分的网络, 对巨大组成成分特征的分析往往比对网络整体特征的分析更加重要。例如Tio等(2016)对国际疾病与相关健康问题统计分类第十版(International Classification of Diseases and Related Health Problems, ICD-10; World Health Organization (WTO))与精神疾病诊断与统计手册第四版修订版(DSM-IV-TR)这两个精神障碍诊断标准网络中巨大组成成分的分析发现, 相较于ICD-10, DSM-IV-TR (2000)的传递性更高, 说明其在相互联系的症状组成的网络成分中内部联系更加紧密。

3 网络分析的特点

网络分析关注变量之间的相互联系, 通过统计建模突出其中的重要部分, 因此可以揭示在潜变量模型中难以看出的数据模式。在心理学实证研究中, 网络分析主要具有以下特点:

3.1 关注观测变量之间的联系

网络分析不必依赖潜变量的定义, 可以基于观测变量构建模型, 并认为各个观测变量之间具有相关性, 因而可以直接分析各个观测变量之间的关系。在众多潜变量模型中, 由于假定潜变量为同一维度下观测变量的共同成因, 观测变量之间的相关性完全由潜变量解释, 即观测变量具有“局部独立性” (local independence) (Lazarsfeld & Henry, 1968); 观测变量仅作为测量潜变量的指标, 各观测变量之间的关系不作为模型关注的焦点。但心理构念是否必然涉及潜变量(即共同成因)是个具有争议的话题。例如, 在医学中癌症的各种症状的共同原因可能是肿瘤; 但与癌症不同, 抑郁症可能不存在一个导致各种症状的共同原因——“抑郁因子”, 精神障碍更有可能是由不同显性症状间互相促进和影响所最终导致发生和发展的。因此, 网络分析方法作为对潜变量模型的补充, 能够构建和拟合观测变量之间相互作用的系统(例如估计抑郁症各个症状之间的相互促进和作用), 从而针对同样的研究课题提供与潜变量模型不同视角的注解。不过需要注意的是, 在理解和定义心理构念时, 网络分析和潜变量模型具有相似的局限性, 即无法直接通过各个观测变量来定义心理构念。网络本身并非等同于心理构念, 它也只是描述心理构念的一种方法。

此外, 观测变量与潜变量之间的对应关系也存在理论与实践的冲突, 观测变量只能受一个潜变量影响的假设也被认为太过严格(6 一些潜变量模型也可以接受一个观测变量受多个潜变量的影响, 例如探索性结构方程模型。), 如在诊断精神障碍时, 许多症状出现在多种精神障碍的诊断标准里(失眠、易激惹等)。网络分析允许观测变量相互影响, 更符合实践中症状出现和发展的模式, 相较而言, 某单一的精神障碍潜变量并非解释这些症状间相互影响的成因。另一方面, 研究者可以通过中心性等相关指标来量化不同节点在网络中的重要性, 这符合实践中症状跨多个心理/心理障碍系统而相互联系的已有发现。例如, McNally (2016)提出共病中的桥接症状由于具有高中心性, 因此对整个网络结构起重要作用; Fried等(2015)对丧偶和抑郁症状的网络研究发现, 孤独感是二者相互关联的最重要因素。

3.2 观测变量之间的互动性

网络分析可以用于研究不同节点(观测变量)之间的互相影响及其随着时间的变化过程(通过构建观测变量间的纵向模型)。例如, 精神障碍中的症状和症状之间可能互为因果并相互影响, 导致严重程度不断加强(Schmittmann et al., 2013)。在开始阶段, 这一过程似乎均发生在症状水平(观测变量), 而非发生在精神障碍水平(潜变量)。研究这种互动关系的重要意义在于理解不同症状之间的因果关系及这些关系随着时间的变化进程, 从而帮助研究者开发更有针对性的干预治疗方案。

有研究发现受同一种精神障碍困扰的不同个体出现的症状表现可能完全不同, 症状之间的相互联系也迥异。如对于有失眠症状的重度抑郁个体来说, 抑郁的成因在于压力→失眠→注意力集中问题; 而对于躯体症状导致抑郁的个体来说, 则可能是:压力→血压上升→心机梗塞→情绪低落、容易疲倦、失眠(Borsboom & Cramer, 2013), 对二者的干预理应有不同的侧重点。再如Isvoranu等(2017)分析童年期创伤与后期精神疾病的关系的研究发现, 在后期测量精神错乱(psychosis)的三个维度(正性症状、负性症状、普通精神病理症状)中, 只有普通精神病理症状维度与童年创伤具有直接联系, 而正性和负性症状则通过普通精神病理症状与童年创伤相关联。由以上不难看出, 网络视角下, 不同观测变量在系统中的作用不同, 因而是系统发展和变化的重要影响因素。

3.3 整体性

网络分析将所有的观测变量纳入网络之中, 从网络整体变化的角度来考查某一心理/行为系统的发生发展过程。例如, Cramer等(2012)从网络分析的角度指出, 人格可能是一个完整的心理系统, 其形成受到遗传生物因素的影响, 而在成长过程中, 又不断与环境中的因素进行互动, 主动寻找适合自己的行为模式, 最终达到一种平衡的状态(equilibrium)。举例来说, 容易感到受威胁的人会主动回避新的环境, 避免与陌生人交往, 因此感到紧张和孤独。这里的 “感到紧张”、“感到孤独”和“容易感到受威胁”相互影响而形成了这些人行为的稳态, 而并非是由于受到“神经质”特质的潜在影响。如果这个个体经历了成功的社交, 他可能会增加与陌生人交往, 紧张、孤独和受威胁感可能也会有所减少, 所谓“牵一发而动全身”。即使一次外部反馈无法完全改变个体的行为模式, 也可能改变系统中的相关成分, 这种变化不需要通过改变一个假设的人格潜变量(如改变神经质或外向性的特质)以影响整个系统, 仅需要通过改变特定的观测变量及其与其他观测变量的联系就可形成。精神障碍系统也可能如此, 症状与症状之间相互影响而形成稳定的系统, 即达到某种精神障碍的诊断。一种治疗方式首先作用于一个或几个特定的症状, 通过改善这些症状, 其他相关症状也间接改变, 当治疗到达某一时刻, 特定症状的严重程度及症状之间的联系发生改变, 随后系统整体状态发生改变。

当然, 除以上所提及的三点之外, 网络分析还有其他的特点。例如, 它能够在短时间内构建关于数十个甚至多达数百个观测变量之间关系的模型, 从而提供探索和挖掘复杂心理系统(例如人格系统、精神障碍系统或者政治信念系统)的可能性。网络分析可以全局性地展现变量之间的复杂联系, 描绘出关于心理现象的“宏大画面”。再如, 网络分析具有较好的可视化特点——网络分析所构建的变量间的网络本质上已经是一个可视化的图谱(如图1)。在实际运用中, 受益于R语言程序包(如qgraph; Costantini, Epskamp, et al., 2015)的发展, 通过寥寥几行代码, 研究者就能够直观清晰地展现出节点与节点之间以及整个网络复杂的结构特征(Marcus et al., 2018; McNally, 2016)。

4 网络分析的应用

网络分析作为一种新方法, 近年来在心理学中得到的广泛应用, 尤其是被应用到人格心理学(如Cramer et al., 2012)、社会心理学(如Dalege, Borsboom, van Harreveld, & van der Maas, 2018)和临床心理学(如Borsboom & Cramer, 2013)。以下将分别举例说明网络分析在这些领域的实际应用。

4.1 人格与社会心理学领域的应用

在人格心理学中, 网络分析常常被应用于传统的人格测量问卷所测得的数据, 其将问卷条目作为网络中的节点, 以条目之间的偏相关为连线来建构网络。通过总结目前已有的研究, 网络分析能从如下三个方面增进我们对人格的理解。

第一, 获得新的数据模式, 从而对人格的潜变量模型得出的结论提出补充和修正。除本文图1所示案例外, 研究者在对大五人格进行网络分析时发现, 宜人性和外向性的条目相互渗透, 说明测量宜人性维度有关的条目之间的相关性并未强于这些条目和外向性维度有关的条目之间的相关性, 二者很难相互区分。从条目本身来看, 外向性的一些条目(如喜欢和别人交谈)和宜人性的一些条目(如愿意花时间与别人在一起)确实具有很高的相似性和内在的行为联系(Cramer et al., 2012)。另外, 从基因的角度对神经质进行分析发现, 在条目的水平上, 与神经质不同条目相关的基因显示出异质性, 并不符合潜变量模型提出的各变量需要保证同质性的前提假设(Nagel, Watanabe, Stringer, Posthuma, & van der Sluis, 2018)。对人格障碍的网络分析则补充了现有的理论体系:对自恋型人格障碍的网络分析发现具有病态自恋人格结构的个体的自恋特质较少受其他特质的预测(Di Pierro, Costantini, Benzi, Madeddu, & Preti, 2018); Hyatt等(2018)对自恋和自尊进行网络分析揭示了自恋和自尊的联系(果敢的交友取向)与区别(自恋与冷漠无情、不切实际、贬低的态度有关, 而自尊与这些行为特点则无关)。

第二, 突破先前研究所提出的理论。结合人格心理学研究中原先各自独立的研究话题或研究领域, 将所有相关信息绘制成易于解读的变量间网络, 网络分析承担了一个很好的“桥梁”角色, 推动了不同研究话题的互动和跨领域的理论突破。例如, 在探索成人气质(temperament)与人格特质的相关网络时, 研究者发现人格能够被看作是由气质和其他特质组成的复杂结构, 分析得到了四个集群而非常见的“大五”人格的五个维度, 即(1)外向性, (2)思维、尽责性和宜人性, (3)灵活性、开放性和想象性思维, (4)神经质(Wechsler, Benson, Machado, Bachert, & Gums, 2018)。

第三, 交叉验证通过人格的潜变量模型所获得的研究结果。例如, 对“黑暗三角”人格特质(“Dark Triad” personality)开展网络分析后, 研究者验证了操纵人际关系(interpersonal manipulation)和冷漠无情(callousness)是该人格特质网络中的核心(Marcus et al., 2018), 这一发现交叉验证了之前潜变量模型的结果(Jones & Figueredo, 2013)。相似的验证还有对尽责性的研究, 研究者通过探索性因素分析和网络分析中的集群性特征分析均发现尽责性显现出负责(responsibility)、冲动控制(impulse control)、有序(orderliness)和勤奋(industriousness)四个维度(Costantini, Richetin, et al., 2015)。

网络分析也开始应用于社会心理学领域。例如, 态度的因果网络结构研究为理解态度的形成(信念、感受和行为的相互作用)、维持和改变的原因及其强度提供了探索性的证据(Dalege et al., 2016)。实证研究指出个体的政治兴趣能够预测个体关于总统候选人态度的网络的连接强度, 而网络的连接强度又与态度的两个决定性因素(态度的稳定性和态度对行为的影响程度)显著相关(Dalege et al., 2018)。结合前人研究以及网络分析的视角, Brandt, Sibley和Osborne (2019)提出了“政治信念系统” (political belief system)的概念——他们认为个体的各种政治信念组成了一个网络, 其中处于核心地位的是一些象征性的信念(即党派属性), 而处于边缘地位的则是对于具体政策的态度。不过, 网络分析方法在社会心理学领域的应用尚属于探索阶段, 此技术巨大的潜力仍有待挖掘。

4.2 临床心理学领域的应用

在临床心理学中, 网络分析的应用主要包括探索传统精神障碍诊断标准中症状的网络结构、探索不同精神障碍的共病情况以及探索干预对某个症状以及对整个症状网络的影响这三个方面。

首先, 网络分析为理解传统精神障碍诊断中不同症状之间的关系提供了新的视角。研究者采用无加权网络分析的方法, 探索了不同精神障碍的症状之间的网络结构。目前主要有:(1) Borsboom, Cramer, Schmittmann, Epskamp和Waldorp (2011)DSM-IV (1994)中障碍与对应症状之间联系的网络分析; (2) Boschloo等(2015)DSM-IV (1994)中的12类精神障碍相关的120种症状进行了网络分析; (3) Tio等(2016)ICD-10DSM-IV-TR (2000)的网络结构开展的比较分析; 以及(4) Borsboom (2017)基于上述研究结果总结出的精神障碍诊断标准的特点。总的来说, 目前所使用的精神障碍的诊断标准具有以下特点:(1)复杂性, 即精神障碍网络中不同成分的复杂交互作用; (2)症状(节点)与组成成分协同回应性, 即精神障碍网络中组成成分对症状的变化产生协同回应; (3)直接因果关系, 即网络结构由症状间联系产生; (4)精神障碍服从网络结构, 即网络中一些症状间的联系更紧密, 这些症状集群后相互作用引发其他症状; (5)滞后效应(hysteresis), 即精神障碍是由于较强联系的症状出现滞后效应所导致的, 原因是引发症状的事件消失后已被激活的症状间仍能相互激活。

其次, 网络分析较好地描述了不同精神障碍的共病状况。网络分析通过描述节点的特征来推断节点在网络中的作用, 因此能够很好地识别不同精神障碍网络之间的“桥接”节点, 即共病的症状。除前述Cramer等(2010)探究重度抑郁障碍和广泛性焦虑症的共病机制的研究外, Ruzzano, Borsboom和Geurts (2015)探索自闭症与强迫症的共病机制发现, 虽然刻板的重复行为是二者所共有的症状诊断标准, 但网络分析结果显示自闭症与强迫症是两个完全不同的症状集群——除了共有的刻板重复行为外, 二者症状间少有直接相关。这从另一个角度证明了网络分析能够对精神障碍的共病性进行深层的梳理, 从而识别易共病与不易共病的精神障碍。Afzali等(2017)对创伤后应激障碍和重度抑郁障碍的共病机制开展网络分析发现, 其共病的桥接节点不仅局限于睡眠问题、易激惹性、注意力困难和兴趣丧失这四个共有的症状, 还存在于自责感、悲伤感和闪回等其他一些非共有症状, 该研究进一步指出个体易伤痛性和消极情绪性两个特点可能是造成这些共病症状的原因。

第三, 网络分析也开始应用于探究精神障碍干预的效果和鉴别干预的作用途径等方向。一些研究将干预作为观测变量引入网络中, 观察该变量与不同症状之间的联系以及该变量对网络整体结构的影响(如Bekhuis et al., 2018; Santos, Kossakowski, Schwartz, Beeber, & Fried, 2018)。不同症状(或网络中的不同部分)的联系强弱和方式不同, 一些症状与治疗具有强相关, 而另一些则可能仅有间接联系, 这对临床治疗研究具有重要意义。例如, Blanken等(2019)将网络分析应用于探究失眠症的认知行为治疗(cognitive behavioral therapy for insomnia, CBT-I)对失眠症和抑郁症的共病的治疗效果的研究, 结果发现CBT-I对失眠症的症状作用明显, 而对抑郁症的作用则更接近于通过改善失眠症状而起到的间接效应。

5 总结与展望

作为对传统潜变量模型的一个有力补充, 网络分析在描述心理构念上有独特的优势, 因此在最近几年该方法已经被广泛用于诸多心理学领域。从当前研究的发展趋势来看, 在未来几年网络分析可能会在如下方面获得进一步发展。

第一, 网络分析理论与实证证据结合, 如验证网络分析揭示的重要节点是否也在改变网络结构过程中起到关键作用。如前文所述, 从网络分析视角对精神障碍的研究发现一些症状相对重要, 而最重要的症状则通常被认为是网络的核心, 因此推断改变这些症状可能是改变整个网络(即治疗该障碍)的重要切入点。那么在实际治疗过程中, 对那些在网络中与其他症状有较多较强联系的症状开展重点治疗能否更有效地改善与之相联系的其他症状呢?目前尚没有研究验证这一假设, 因此未来与精神障碍治疗方法有关的研究可着重关注这一点(Fried et al., 2017)。

第二, 网络分析的可重复性问题。由于网络分析本质上是一种“数据驱动”的探索性分析方法, 所得的结果可能局限于特定的样本数据, 难以推广到其他样本。虽然数据越多, 驱动数据得出的结果也更接近于真实情况, 但样本量难以达到完美, 因此网络分析是否真实反应了心理系统的普遍特征仍待进一步验证(Epskamp, Borsboom, & Fried, 2018; Forbes, Wright, Markon, & Krueger, 2017)。研究者已经发展出比较两个网络结构是否有显著差异的方法(van Borkulo et al., 2017), 尽管已有一项研究证实了网络分析在样本内和样本间的高重复性(Borsboom et al., 2017), 说明了网络结构至少在一定情况下是可重复的和可推广的, 但在心理学研究的可重复性受到关注的背景下(Open Science Collaboration, 2015; 胡传鹏等, 2016), 对于可重复性的考察尚待进一步深入研究。因而, 未来一个重要的研究方向是发展出验证性网络模型(confirmatory network modeling)的方法来确定基于某一特定样本所拟合出的变量间网络在多大程度上能够推广到其所在群体甚至其他群体, 进而能够辨别若某一网络模型不可重复其原因为何。这些潜在的原因可能是样本选择本身不具有代表性, 无法代表其所在的群体, 因此导致通过该样本建构的网络模型可推广性有限; 也可能是所构建的网络只适用于某一群体, 而不适用于其他群体, 如同一网络结构无法同时适用于来自普通人群体的样本和来自病人群体的样本(Borsboom, Robinaugh, The Psychosystems Group, Rhemtulla, & Cramer, 2018)。

第三, 与潜变量模型的进一步融合。虽然前文介绍了诸多网络分析模型相较于传统潜变量模型的创新之处和优势; 但不可否认的是, 潜变量模型仍然拥有网络分析模型难以替代的优势。一方面, 潜变量模型(特别是广义的结构方程模型)纳入了对于测量误差的考察和控制(Borsboom, Mellenbergh, & Heerden, 2003), 这有效地规避了心理测量无法做到完全精确的问题; 另一方面, 潜变量模型提供了有效的验证性分析的框架。未来研究应开发出一个更加综合的方法, 既能够展现网络模型互动性和整体性的特点, 也能够纳入对于测量误差的考量。目前Epskamp等(2017)对综合潜变量模型与网络模型进行了初步尝试, 构建了以潜变量为节点的网络模型。未来研究可以进一步完善该模型, 以在研究中结合潜变量模型和网络分析模型的优势。

第四, 应用于个体的网络分析(Borsboom & Cramer, 2013)。由于不同个体的心理/行为特征具有独特性, 建立每个个体的网络分析有利于更加准确地理解个体心理现象以及精神障碍的出现、保持和发展过程。研究者应开发统计方法来建立基于个体的网络分析, 帮助了解具体每个个体态度、人格、行为特征形成的原因, 也帮助了解每个个体精神障碍的诱因、作用通路和潜在发病风险。最终, 应用网络分析所得发现来提供个性化的发展建议, 制定个性化的干预方案, 促进每个个体的精神健康和积极发展。

致谢:感谢匿名审稿人对本文提出的宝贵意见, 感谢加拿大曼尼托巴大学艾斯博商学院陈洁盈博士(助理教授)对本文英文摘要的帮助。

/


版权所有 © 《心理科学进展》编辑部
地址:北京市朝阳区林萃路16号院 
邮编:100101 
电话:010-64850861 
E-mail:jinzhan@psych.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发