Interpretative phenomenological analysis in China: A systematic review and guideline

作为一种质性研究方法, 解释现象学分析在心理学及社会科学的其他领域中逐渐兴起。目前在中国, 运用解释现象学分析的研究质量参差不齐, 对这些研究进行系统评价, 可以为将来的研究提供指导。通过对中英文数据库的检索及筛选, 最终纳入49篇期刊文章。根据Smith (2011)为解释现象学分析提出的4个标准对这些文章进行评价, 结果显示, 26篇研究明确提及了解释现象学的理论原则, 33篇文章的资料收集及分析过程清晰透明, 大部分研究(n = 40)条理清晰、言之成理, 但只有约1/4的研究(n = 13)提供了足够强的证据来支持其提取出来的主题。只有4篇全部达到质量标准, 11篇基本达到标准, 大部分文章没有达到标准。最后, 本研究尝试提出一份解释现象学分析的使用指南, 供将来的研究参考。

关键词: 解释现象学分析; 系统评价; 质性研究


As a qualitative method, Interpretative Phenomenological Analysis (IPA) has been increasingly employed in psychology and other social sciences disciplines. In China, the quality of research using IPA was doubtful, and thus a systematic review of the current studies was warranted. Through a comprehensive search in Chinese and English database and screening, 49 articles were included. According to Smith’s criterion, 26 studies explicitly referred to IPA theoretical principles; 33 studies had clear and transparent data collection and analysis process. Most of the studies (n = 40) were coherent and plausible, however, only a small proportion of the studies (n = 13) provided strong evidence to support the themes. In the forty-nine included studies, only 4 articles were rated as “good”, 11 articles were “acceptable”, and the remaining 34 articles were “unacceptable”. Based on previous research and recommendations, this study attempted to present a guideline to conduct and write a good IPA study.

Keywords: interpretative phenomenological analysis; systematic review; qualitative research

1 引言

在过去几十年间, 各种质性研究方法在心理学领域得到大量运用, 这些方法包括民族志、现象学、扎根理论和主题分析等, 形成了不同于主流量化研究的认识心理现象的研究取向(Willig & Rogers, 2017)。这些质性研究方法针对不同的研究问题而言各有优势。例如, 民族志能够详细地描绘社会文化情境对个体心理影响的动态过程(Case, Todd, & Kral, 2014), 现象学方法关注对个体经验及其本质进行探究(Giorgi, 2009), 扎根理论致力于针对心理学现象建构中层理论(Charmaz & Henwood, 2017), 主题分析则具有非常大的灵活性, 不预先设置理论框架, 因此可以兼容于不同的质性研究方法(Braun & Clarke, 2006)。

解释现象学分析(Interpretative Phenomenological Analysis, IPA)是一种质性研究方法, 这种方法致力于研究人们如何理解其生活经验, 而且特别关注那些对个体来说具有重要、特殊意义的生活经验(Smith, Larkin, & Flowers, 2009)。IPA有三个思想上的来源:现象学(Phenomenology)、诠释学(Hermeneutics)和特则取向(Idiography)。首先, IPA遵循现象学的理念, 现象学哲学家胡塞尔提倡“回到事物本身” (Husserl, 1970), 这里的“事物”指的就是生活经验。IPA旨在对日常生活经验展开细致和系统的反思, 关注人们在世存有(being-in- the-world)的那些具身的(embodied)、认知的、情感的和存在主义层面的事物(Smith et al., 2009)。其次, 诠释学也对IPA产生了重要的影响。在IPA的使用中, “分析总是包含着诠释”, 因此它强调研究者在理解研究对象的生活经验的过程中所扮演的角色(Smith, 2004)。这个过程涉及安东尼·吉登斯所说的“双重诠释” (double hermeneutic, Giddens, 1987), 即研究对象尝试理解他们自己的生活经历, 而研究者则对研究对象的理解加以理解(Smith & Osborn, 2004)。最后, IPA强调研究的特则取向, 认为研究首要的价值在于对生活经验的独特事例进行详尽和细致的分析, 只有这样才能揭示人类心理本身的复杂性。特则研究取向是相对通则取向(nomothetic)而言的, 通则取向要求得出一个群体层面的结论, 从而建立人类行为的一般规律(Jaccard & Dittus, 1990), 此类研究是基于统计计算和概率而进行的, 处理的是群体平均值而非特殊的案例。而IPA会对每个案例进行详细的审视, 其后再转向更为一般的结论(Smith et al., 2009)。

早期的IPA研究大多出现在健康心理学领域, 力求探索人们如何感知、理解和建构健康与疾病(Smith, Flowers, & Osborn, 1997), 例如慢性腰痛(Osborn & Smith, 1998; Smith & Osborn, 2007)、心脏疾病(Senior, Smith, Michie, & Marteau, 2002)、痤疮(Murray & Rhodes, 2011)、慢性疲劳综合征(Adele, Christina, & Paul, 2008)或帕金森综合征(Bramley & Eatough, 2005)。后来IPA也运用于临床、咨询和学习过程及师生关系等领域, 还扩展至人文科学、医疗科学和社会科学中的其他相关学科(Biggerstaff & Thompson, 2008; Charlick, Pincombe, McKellar, & Fielder, 2016; Tuffour, 2017)。

随着大量IPA研究的出现, 研究的质量也日益受到关注。在量化研究中, 内部效度、外部效度、信度和客观性通常是研究质量的指标, 但这些指标根植于量化研究实证主义的范式, 并不能直接应用于质性研究中(Golafshani, 2003)。在过去几十年间, 研究者们一直在尝试为质性研究制定一些质量评价方面的概念和指标, 如可信度(credibility)、可迁移性(transferability)、可靠性(dependability)和可验证性(confirmability), 形成了一套独立于量化研究的评价系统(Hannes, 2011; Lincoln & Guba, 1985)。另一种评价质性研究质量的做法是, 针对不同的质性研究方法, 分别制定相应的评价标准。这样做是因为不同的质性方法所基于的认识论和方法论不尽相同, 在研究目标和过程方面可能具有很大的差异(Willig & Rogers, 2017)。

有鉴于此, Smith (2011)为IPA研究开发了一份质量评价指南。在这份评价指南中, 一项“合格” (acceptable)的IPA研究需要满足以下4个标准:明确表示该研究遵循了IPA的三个理论原则(现象学、诠释学和特则取向), 研究过程足够清晰透明, 条理清晰、言之成理, 以及每个主题都有足够的证据加以支持。一项“优秀” (good)的IPA研究不仅需要满足以上4个标准, 同时还需要符合以下3个条件:文章中心突出、分析深入, 资料翔实、解释很具说服力, 以及引人入胜、发人深省。

Smith (2011)系统地检索并筛选出了1996至2008年间51篇采用IPA的英文文献, 发现只有27% (n = 14)的文章可以算得上是优秀的IPA研究, 55% (n = 28)的文章质量处于合格水平, 其余的文章(18%, n = 9)则“不合格” (unacceptable)。Smith认为IPA作为一种发展时间较短的质性研究取向, 已经得到了较为广泛的认可, 在14篇被评为优秀的IPA研究中, 有11篇是发表在健康心理学领域最顶尖的期刊上。但总体来看, 大部分(超过70%)文章并不能算是优秀的研究。

早在2006年, 就有研究者使用IPA来对中国女性尿失禁的体验进行研究(Komorowski & Chen, 2006)。随后在心理学领域出现了很多项以中国群体为研究对象的IPA研究, 比如脊髓损伤患者的创伤后成长(王艳波, 汪际, 戴敏辉, 刘晓虹, 2011)、失去亲人后的哀伤历程(何丽, 唐信峰, 王建平, 2017; 李秀, 杜文东, 2017)和智障病人照顾者的体验(Chou & Kröger, 2014)。由于针对中国群体进行的IPA研究刚刚开始不久(郑显亮, 谢园梅, 2014), 研究者们对其了解不够深入, 现已发表的IPA研究质量参差不齐:一些研究的分析过于描述性, 无法看出研究者进行的诠释(彭艳琼, 唐玮, 甘秀妮, 2016; 许洪梅等, 2016); 一些研究样本量较大, 而分析比较粗糙和浅显, 没有体现出IPA的特则取向(Hou, Huang, Prakash, & Chaudhury, 2013); 还有一些研究并没有引用足够的访谈资料来支撑其提取的主题(房蕊, 2013)。

目前中国已有的IPA研究数量丰富而质量不一, 有必要对这些研究做一次系统评价。因此本研究有两个目的, 一是系统地检索并筛选出现有的以中国人(包括大陆和港澳台)为研究对象的IPA研究, 并对这些研究的质量进行评估。二是为将来中国心理学及其他社会科学领域的IPA研究提供可供参考的指南。

2 方法

本研究遵循系统评价和元分析优先报告条目(Preferred Reporting Items for Systematic Reviews and Meta-Analyses, PRISMA; Moher, Liberati, Tetzlaff, & Altman, 2009)。

2.1 检索策略及纳入标准

从中、英文数据库中检索期刊文章。所检索的中文数据库包括万方医学网、中国知网数据库、维普数据库以及台湾华艺线上图书馆。所检索的英文数据库为Web of Science、Scopus、EMBASE和Medline。检索词为“解释现象学” (“解释现象学” “诠释现象学”; “interpretative phenomenological” “interpretive phenomenological”)和地域(“中国” “香港” “澳门” “台湾”; China, Hong Kong, Macau (o), Taiwan)。数据库检索不设起始时间, 截止时间为2018年7月14日。

将符合以下标准的文章将纳入分析:(1)明确表示所采用的研究方法是Smith (1996)的解释现象学分析; (2)研究对象为中国人, 包括中国大陆和港澳台地区的居民(2 注:在制定纳入标准时, 理想的做法是纳入中国人(包括大陆及港澳台)所开展的研究, 及研究者是中国人。但这一点在对英文数据库的检索中无法实现, 比如一篇英文文章的作者姓名为汉语拼音, 但单位为国外高校, 我们就无法确定该作者是否仍为中国国籍。因此我们采取另外一种纳入标准, 即聚焦于那些研究对象为中国群体的研究, 这在对中英文数据库的检索中都可以很好地实现。筛选结果发现, 在纳入的49篇文章中, 绝大多数的研究(n = 47)恰好是中国学者所开展, 符合我们研究的目的。只有2篇研究无法确定其作者国籍, 因为其作者姓名为汉语拼音, 但单位为国外高校。鉴于IPA研究数量并不充裕, 我们也将这两篇研究纳入到系统评价中。因此该研究标题中IPA“在中国的运用”, 最精确的理解应为“以中国群体为对象的研究”。)。综述、评论类的文章不纳入评估, 全文无法在数据库中获得以及无法通过联系作者而获得的文章也会排除。

2.2 资料提取及质量评价

根据上述纳入标准对检索出的文献进行筛选。首先是通过文章标题及摘要进行筛选, 直接排除那些确定不符合纳入标准的文献, 然后对其余文献进行全文筛选。接下来对纳入的每篇文章进行资料的提取, 包括作者、年份、抽样方式、样本人口学变量、研究主题和效度等。

研究基于Smith (2011)所提出的IPA质量评价标准, 将评估的文章分为三个类别:没有达到质量标准(“不合格”)、基本达到质量标准(“合格”)和达到质量标准(“优秀”)。具体评价标准见表1。两位研究者(侯力琪、唐信峰)根据评价标准对纳入的研究进独立的评估, 不一致之处通过讨论形成统一的评价。组内相关系数(Intraclass Correlation Coefficient, ICC)为0.83, 表明评价者之间有较高的评分信度。

表1   IPA研究评价标准

1.1 明确表示该研究遵循了IPA的三个理论原则:现象学、诠释学和特则取向
1.2 研究过程足够清晰透明, 包括如何选取研究对象、如何进行访谈和分析过程
1.3 条理清晰、言之成理
1.4 每个主题都有足够的证据加以支持, 具体如下:
1.4.1 样本量1~3:每个主题下都有来自所有研究对象的摘录
1.4.2 样本量4~8:每个主题下至少有3位研究对象的摘录
1.4.3 样本量8以上:每个主题下至少有3位研究对象的摘录, 以及该主题在研究对象中出现的频次; 或者每个主题下都有一半研究对象的摘录
1.5 补充条件 如果研究不能完全满足以上四点, 但是符合下面的三项中的任何一项, 可以被认为是部分合格, 在本研究中被归为合格一类:
1.5.1 研究提取出多个主题, 虽然不能满足条件1.4, 但是部分主题有趣且有足够的证据支持。
1.5.2 研究有多个研究对象, 虽然不能满足条件1.4, 但是摘录均来自某一位研究对象且条理清晰, 那么可将该研究看作是特则取向的案例研究, 归入合格的类别。
1.5.3 研究涉及多个类别的研究对象, 比如男性和女性, 如果某一类研究对象的分析和结果符合1.1~1.4, 那么该研究也可算作合格研究。

(2)如果研究没有满足以下条件中的任何一个, 则被判定为不合格:
2.1 不符合IPA的理论原则
2.2 研究过程不够清晰透明
2.3 不够有趣且证据不足
研究被判定为不合格往往是因为其缺乏证据支持, 通常有以下表现形式:
2.3.1 从大样本中提取大量描述性的、粗浅的主题
2.3.2 每个主题只有简短的总结和一两条未经解释的摘录
2.3.3 没有足够的摘录支撑所说明的主题
2.3.4 没有呈现每个主题在研究对象中出现的频率(在样本量8以上的研究中)
2.3.5 分析粗糙, 缺乏细节

(3)优秀的研究必须满足上述合格研究的所有条件, 且必须满足以下三个条件:

新窗口打开| 下载CSV

3 结果

3.1 研究基本信息

筛选文章的过程可参见图1。研究共检索到571篇期刊文章, 通过标题和摘要排除了460篇, 对余下的111篇进行全文筛查, 最后将49篇文章纳入评价。在被排除的62篇文章中, 有58篇所使用的研究方法并非Smith (1996)所提出的IPA, 有3篇文章为综述、评论类文章, 有1篇文章无法获得全文。


图1   文献纳入与排除PRISMA流程图

表2呈现了最终纳入评价的49篇文章的基本信息。其中有22篇中文文章, 27篇英文文章。最早的IPA研究发表于2006年, 到2013年之后, 文章的数量显著增加且有逐年增加的趋势(见图2)。大部分研究(n = 41)的样本量都在16以下, 最小的样本量为1, 最大的样本量高达86, 样本量平均值为14。在研究领域方面(见图3), 有16篇文章关注身体疾病, 有12篇文章属于学习过程及师生关系领域, 关于丧亲和临终护理分别有6篇和3篇文章, 有5篇文章关注LGBT (女同性恋者、男同性恋者、双性恋者与跨性别者)群体, 还有3篇文章聚焦于精神疾病方面的主题。

表2   纳入研究的基本信息

Cheng et al. (2010)2010英文中国香港7丧亲11101
Cheng (2017)2017英文中国香港7LGBT00101
Cheng (2018)2018英文中国香港4LGBT00111
Chou et al. (2013)2013英文中国台湾15身体疾病00101
Chou et al. (2014)2014英文中国台湾11身体疾病01101
Fan et al. (2012)2012英文中国台湾33身体疾病01101
Fu et al. (2018)2018英文中国大陆6丧亲11100
Fung et al. (2016)2016英文中国香港13精神疾病01101
Fung (2016)2016英文中国香港2学习过程及师生关系11110
Fung (2018a)2018英文中国香港1其他11111
Fung (2018b)2018英文中国香港2学习过程及师生关系11101
Ho et al. (2014)2014英文中国香港10精神疾病10111
Hou et al. (2013)2013英文中国大陆86身体疾病11100
Ko et al. (2013)2013英文中国台湾15精神疾病01101
Komorowski et al. (2006)2006英文中国大陆15身体疾病11101
Li et al. (2015)2015英文中国大陆16学习过程及师生关系01100
Liu et al. (2015a)2015英文中国大陆6学习过程及师生关系11111
Liu et al. (2015b)2015英文中国大陆8学习过程及师生关系11111
Liu et al. (2017)2017英文中国台湾13临终护理11101
Luo et al. (2018)2018英文中国大陆16身体疾病01101
Ng et al. (2016)2016英文中国香港8学习过程及师生关系11101
Southcott et al.
To et al. (2009)2009英文中国香港10其他11111
Wang et al. (2012)2012英文中国大陆6身体疾病11100
Wang et al. (2015)2015英文中国大陆12身体疾病11101
Wang et al. (2016)2016英文中国大陆25学习过程及师生关系11101
Zhang et al. (2018)2018英文中国大陆16其他11000

新窗口打开| 下载CSV


图2   各年份发表的文章数量


图3   各研究领域发表的文章数量

3.2 质量评价

如前所述, “合格”研究需要满足4个条件。有超过一半(n = 26)的研究明确提到它们遵循了IPA的三项理论原则; 三分之二(n = 33)的研究资料收集和分析过程清晰透明; 绝大多数(n = 40)研究条理清晰、言之成理; 不过在证据强度方面, 只有13篇研究提供了足够的摘录来支撑所提取出来的主题(见图4)。从总体的研究质量来看, 大部分研究(n = 34)被评为“不合格”, 11篇研究被评为“合格”, 只有4篇文章为“优秀”。


图4   “合格”研究的4个条件满足情况

此外, 本研究还关注了这些IPA研究是否采取了一定措施以保证其效度。结果显示, 有近一半的研究(n = 23)并未使用任何方法来保证研究效度。

3.2.1 IPA三大理论原则

一项合格的IPA研究需要明确指出其遵循了IPA的三项理论原则。比如, 尹秋馨等(2015)在针对特大事故重伤者亲属早期照护体验的解释现象学分析这一研究中提到:“IPA由Smith提出, 以现象学、诠释学、个案研究为理论基础, 提及当人们试图探索个体如何感知其面对的特殊情境, 如何诠释其个人世界及社会, 特别是关注个体认知、语言、情感和生理状态等的复杂历程时, 最适合应用IPA法。探讨特大事故重伤者亲属的照护体验, IPA是适用的方法。此外IPA的个案研究特征, 决定其多采用目的性抽样, 尽量选择同质性的样本, 以有效分析典型个案, 深人挖掘亲属的个人体验, 并比较个案间差异性与共同性。”不合格的研究并没有提及IPA所基于的理论基础, 只是将其作为一种资料分析的方法, 呈现其具体的分析步骤而已(彭艳琼 等, 2016; 许洪梅 等, 2016; Cheng, 2018; Chou & Kröger, 2014)。

3.2.2 资料收集和分析过程

合格的IPA研究需要有清晰透明的资料收集过程, 并遵循IPA所提出的分析过程的主要步骤。例如, 何丽和王建平(2017)在对失独者宗教应对的研究中, 呈现了研究实施的时间(“研究在2013年10月至2015年2月间进行”)和研究对象的基本信息(年龄、婚姻状况、宗教信仰、丧失对象、丧亲时间、逝者年龄以及死亡原因)。同时也说明了研究所采用的资料收集方法(“采用深度访谈法和实物收集法”), 并介绍了访谈提纲的样例(“在孩子离世之后, 你认为信仰宗教对你有何影响?”)。又如, 王艳波、范素云、贾彦彦和柴丽(2017)在研究甲状腺癌患者对诊断结果的心理体验研究中明确写到分析的具体步骤:“(1)反复阅读转录文本; (2)初步注释与评析; (3)提出主题; (4)寻找主题间关联; (5)着手下一个案分析; (6)寻找个案间的主题模式。”

相比之下, 有些研究并未描述资料分析的过程和步骤(Cheng, 2017), 还有些研究并未遵循IPA的分析步骤。其中, 一些研究“运用NVivo 8软件对资料进行存储、编码、检索及非智性分析, 概括及提炼主题” (张媛媛等, 2013)。一些研究采用“主题突出分类法对描述条目分类:根据问题本身(即行为要素)归类; 根据突出的概念和主题归类” (房蕊, 2013)。还有的IPA研究采用内容分析法来对资料进行分析:“登录手册的号码将访谈内容的字或句分门别类归纳, 计算频率或进行深入的统计分析, 使用计算机软件进行, 确认共同主题进行整理, 提炼出主题和要素” (田国素, 2013)。

3.2.3 条理清晰、言之成理

大部分研究都能够做到条理清晰, 从摘录中提取主题的过程能够自圆其说, 对资料的分析和解释也能言之成理。但也有部分研究并没有做到言之成理这一点。比如在一项针对流动儿童的师生冲突的研究中(汪昌华, Geng, 2017), 研究者摘录了一段针对教师的访谈稿:“这些孩子欠教养, 父母没很好地教育他们, 洗手要排队, 有事要和别人商量, 动不动就动手。孩子犯错误了, 把家长叫来。有些农民工家长当着老师的面, 在办公室就责骂孩子, ‘叫你听老师的话, 好好学习, 咋不听老师的话……’个别孩子的父亲甚至动手对孩子推推搡搡的, 搞的老师也挺难堪的。家长说:‘没事, 把孩子交给老师了, 你就像管自家孩子一样, 只管打。孩子在乡下野惯了, 满场飞(到处乱跑, 打闹)。城里老师水平高, 让他到城里学点本事, 长大考个大学, 能有出息。’ ”

研究者从这段话里面提取出了这样的主题:从低教养水平高教育期待的家庭中走出来的流动儿童更能接受师道尊严。但是读者从这段摘录中只看到了父母的态度, 并没有描述流动儿童的行为或态度。而且从摘录中, 读者似乎能感受到就算流动儿童“接受”师道尊严, 也并非是他们真的认可师道尊严, 而是在父母的强迫和压力之下被动地接受。研究者的分析与摘录的内容不尽相符, 提取的主题的不够合理, 而且并未对更深层次的内容进行探索。

3.2.4 证据强度

IPA虽然非常强调研究者的解释性角色, 但是这种解释必须始终基于文本。因此在研究报告中, 所呈现的主题下必须有足够的摘录对其进行支持。在所有纳入评估的研究中, 只有13项研究符合Smith (2011)提出的证据强度的要求。例如, 刘冬和唐魁玉(2014)访谈了8位丈夫是同性恋的女性, 了解她们的婚姻生活经历, 研究中每个主题下面均有超过来自三个研究对象的摘录, 很好地支撑了所提取出来的主题及分析。在To和Chu (2009)对10位意外怀孕的年轻的香港女性的研究中, 每个主题均引用了超过三个研究对象的摘录, 且呈现了每个主题在研究对象群体中出现的频次。

其他的研究并没有满足在证据强度这一点上的要求。在样本量小于3的研究中, 每个主题下没能引用所有研究对象的访谈摘录(Fung, 2018b); 在样本量为4至8的研究中, 每个主题下没能引用超过3个研究对象的摘录(李秀, 杜文东, 2017; 刘盈君, 蒋欣欣, 2014; Fu et al., 2018; Y. Wang, Wang, & Liu, 2012); 在样本量大于8的研究中, 没能引用超过3个研究对象的摘录, 且给出每个主题在研究对象群体中出现的频次(Chou et al., 2013; Southcott & Li, 2018; Q. Wang, Li, & Pang, 2016; Zhang et al., 2018)。

3.3 优秀的IPA研究

有4篇文章被评为优秀, 它们不仅符合合格研究的所有条件, 且满足优秀研究的三个条件:文章中心突出、分析深入; 资料翔实、解释很具说服力; 引人入胜、发人深省。接下来对这4项研究逐一进行简介, 以便为后来的研究者提供范例和参考。

To和Chu (2009)访谈了10名意外怀孕的年轻的香港女性, 详细地描述了她们在中国文化背景下的情绪体验。该研究清晰地呈现了资料的收集过程和研究过程。每个主题下都有来自超过三个研究对象的访谈摘录作为支撑, 而且统计了每个主题在所有研究对象中出现的频次。有研究指出中国文化背景下的父母在面对子女意外怀孕时, 可能会出于羞耻或为维护面子而建议或强迫子女堕胎。但是该研究揭示这样的情况并不存在:只有部分父母建议堕胎, 而且原因是孩子可能会成为年轻夫妇非常大的负担。另外, 该研究还生动地揭示了堕胎之后研究对象如释重负的感觉、悲伤的情绪以及对逝去的孩子的内疚。

钱玉芬(2011)的研究聚焦于一个非常有意思的主题, 探索了基督徒同性恋放弃同性恋倾向的转变过程。研究给出了清晰的资料收集和分析步骤, 还阐述了研究者作为异性恋的“先入之见”。研究描述了同性恋基督徒身份认同的挣扎与矛盾, 第一是来自社会文化道德所施加的压力, 第二是基督教信仰中反对同性恋的立场所带来的压力。文章生动地描述了转变的过程:它是一种反复、漫长、充满挫折的历程。研究发现一个有趣的现象, 在研究对象身上发生的关键性的生命转变, 都与“被爱”的经验有关, 尤其是从其信仰对象——上帝而来的爱, 使他们获得了突破性的转变动力。

Fung (2018a)访谈了一位女大提琴手在婚姻及其解体的过程中的体验和身份转变。研究者对其进行了两次面对面的半结构化访谈, 并与其保持了18个月的短信交流。研究全面地回顾了该大提琴手拮据和悲惨的童年和家庭生活对其婚姻中的观念及行动造成的影响。在婚姻中研究对象充满了对经济富足的追求以及对子女教育的高度重视。但因两人在信仰实践上日渐疏离, 丈夫又只负责提供经济来源, 在家庭生活中的参与日益减少, 二人的婚姻最终解体。研究生动地描述了一位职业女性在结婚、生小孩之后转变为全职主妇, 在婚姻解体之后又成为单亲妈妈及职业女性的历程。在文章的最后, 研究者还反思了自己对离婚的偏见可能对研究的过程及结果带来的影响。

Liu等(2015a)的研究聚焦于父母对子女的职业发展的影响, 来自两个家庭的父母和孩子都接受了访谈。在研究的证据强度方面实现得很好, 在主题下基本上都引用了来自每位研究对象的摘录。研究发现父母能够回应孩子在职业上的好奇, 以及提供适当的机会让他们探索。研究还揭示了在孩子的职业发展上, 父母会强化性别刻板印象。另外, 研究发现母亲与孩子有着更多的互动, 如带孩子参观她们的工作场所, 因此对孩子来说母亲比父亲更有职业榜样的作用。

3.4 研究效度

有26篇文章至少提到了一种保证效度的方法。这些研究主要采用以下两种方法:与研究团队的其他研究者一起讨论分析的结果(刘盈君, 蒋欣欣, 2014; Ko, Smith, Liao, & Chiang, 2014; J. Liu et al, 2015b), 或将分析结果分享给研究对象进行再次核验(member check) (Cheng, 2018; Fung et al., 2016; Ho, Yi, Griffiths, Chan, & Murray, 2014)。

4 讨论

本研究对解释现象学分析在中国的运用进行了系统评价, 纳入了中国大陆和港澳台地区使用IPA作为研究方法的期刊文章。在纳入的49篇文章中, 只有4篇符合“优秀”的标准, 11篇被评为“合格”, 大部分文章(n = 34)“不合格”。

有近一半的研究没有提及IPA的三个理论原则, 以及没有在文章中说明选择使用该方法的原因。众多质性研究指南均建议作者在文章中说明为何选择某一质性研究方法(Malterud, 2001; O’brien, Harris, Beckman, Reed, & Cook, 2014; Wu, Wyant, & Fraser, 2016), 因为不同的研究问题可能需要不同的质性研究方法。一般来说, 质性研究取向“像一把伞” (van Maanen, 1979), 下面包含了各种不同的质性研究方法, 如扎根理论、主题分析等。如果研究者希望对特定现象做出理论层面的解释, 最终能够建立起中层理论, 那扎根理论可能比较适合(Charmaz, 2014; Glaser, 1992; Strauss & Corbin, 1998)。如果只是关注特定群体对特定现象的经验, 想通过较小规模和较高同质性的样本达到研究目的, 那么IPA可能是更为合适的方法。主题分析是一种比较灵活的分析方法, 适用于很多研究主题, 如探索特定人群的经验或建构理论。另外, 主题分析通常比IPA样本量更大, 而且更加关注研究对象之间共同的主题(Braun & Clarke, 2006)。

有不少文章没有清晰透明地呈现资料收集和分析的过程。这个部分很重要, 因为不同的质性研究方法在资料的收集和分析方面可能存在显著的差异。对于大多数质性研究来说, 半结构化访谈是最佳的资料收集方式(Ayres, 2008)。IPA的访谈提纲经常会采用“漏斗注入”技术, 即一开始的问题会询问研究对象关于研究主题的一般看法, 接下来再询问更为特定和具体的问题, 像漏斗一样逐渐缩小关注点。这样的访谈节奏既能够让研究对象充分表达, 又能够接近研究者所关心的核心议题(Smith & Osborn, 2004)。对于IPA而言, 研究者首先会对一个案例进行初始批注, 然后从这些批注中寻找显现的主题, 接下来在这些主题之间寻找联系以发展上级主题。研究者逐个对研究对象的转录稿进行分析, 在处理之后的案例时, 要尽可能地把在之前的案例分析中出现的观点放入括弧。最后研究者在多个案例之间寻找共同的主题或模式(Smith et al., 2009)。与之不同的是, 主题分析则一开始就会对所有的案例进行初始编码, 然后在所有初始编码中寻找主题并为其命名(Braun & Clarke, 2006)。扎根理论则会采取理论取样, 边访谈边分析, 对理论发展不足的维度再进行取样和访谈, 直到最后理论达到饱和, 资料的收集和分析才会结束(Strauss & Corbin, 1998)。

Smith (2011)所提出的合格研究的第四条标准, 是关于所提取出的主题在总体样本中出现的频次。在所有纳入的文章中, 满足这条标准的文章最少(13/49)。虽然在质性研究中使用量化指标存在一些争议, 但是许多质性研究者都支持在质性研究中纳入量化的数据(Becker, 1970; Hammersley, 1992; Miles & Huberman, 1984)。尽管量化研究和质性研究有着不同的本体论和认识论(Sale, Lohfeld, & Brazil, 2002), 但量化的计数方式并非量化研究所独有, 在质性研究中也可以使用。在质性研究中使用量化计数有诸多优点, 比如能让读者了解到特定主题在纳入的研究群体中的可推广程度——Maxwell (1992)将其称之为内部可推广性(internal generalizability), 这能够为研究者的解释提供证据支持(Maxwell, 2010)。因此, 即使没有出现明确的计数, 质性研究也会常常使用“总是” “经常” “一些”这类词语来描述主题出现的频率, Becker (1970)将这些做法称为“准统计” (quasi statistics)。但是如果过度依赖量化计数, 可能也会带来一些负面影响, 比如选取主题时只根据它在资料中出现的频次来进行选择。如果研究者在进行资料分析时, 将量化指标作为参考和补充, 这种做法就是正当且有价值的(Maxwell, 2010; Smith et al., 2009)。

在所有纳入的研究中, 平均样本量为14, 最大高达86。太大的样本量可能会带来一系列问题。首先, IPA的特则取向必然会使它的研究聚焦于比较小的、同质性较高的样本。其次, 研究者需要对文本进行反复阅读和解释, 这需要花费大量的时间和精力, 样本过大可能会对研究的深度有所妨碍。Smith等人(2009)建议合理的样本量为3~6个, 既能提供足够的案例以展现研究对象之间有意义的相似和差异, 又不会多到使研究者面临被大量资料淹没的风险。此外, 关于数据饱和度的研究表明, 在一项纳入了60个样本的质性研究中, 前6个研究对象已经可以囊括94%的主题, 前12位研究对象所提供的资料就包含了97%的主题(Guest, Bunce, & Johnson, 2006)。因此, 对于IPA研究来说, 3~6可能是比较合适的样本量。如果研究者想再追求更大的样本量, 12位研究对象也许就足够了。

优秀的IPA研究必然会对现象和经验进行深入且富有启发的解释。虽然描述性的分析与解释性的分析在质性研究中都是可接受的(Lopez & Willis, 2004), 但IPA明确强调了研究者的解释性角色。在IPA研究中, 研究者的解释有不同的层次。在Osborn和Smith (1998的研究中对慢性良性腰痛的个人经历的分析非常精彩地体现了这些不同的解释层次, 本文将其作为案例予以介绍。下面这段话是该研究中一位女士琳达的表述:

我就是认为我是(I just think I’m)最健康的, 因为家里有三个女孩, 我是中间的一个, 我曾经认为我是(I thought I’m)最健康的, 我曾经像马一样辛勤地工作, 我曾经认为我是(I thought I was)最强壮的, 然后这种感觉突然间就被砍断了, 我连之前做的一半都做不到了。

这里研究者做出了三个层次的解释。第一层次是琳达将自己与她的姐妹们进行社会比较。在第二层次中, 研究者探究她如何使用隐喻:琳达提到了自己像马一样, 这象征着她过去拥有的力量, 而现在却感觉那么无力。“能力就被砍断了”也看作是一个隐喻, 我们仿佛看到了草被镰刀斩断的景象, 这也象征着琳达的虚弱感。在更深的层次中, 研究者对她所使用的动词时态进行了微观的文本分析, 在英语中动词有过去时和现在时之分, I was意味着过去是健康的, 但是现在不再健康。I am则意味着现在也是健康的。琳达在简短的一段叙述中“混用”了两种时态, 这种“混用”也许触及了琳达心理斗争的核心, 因为她的认同感被慢性背痛破坏了。一方面, 琳达承认自己已经失去了一种身份——一个强壮、自豪和自主的自我已经被一个无力和脆弱的自我取代。另一方面, 琳达仍然认同那个强壮的自我。因此, 新我和旧我可能同时出现在琳达的自我认同中, 呈现出一种此消彼长和矛盾的状态。Smith等人(2009)希望优秀的IPA研究能够达到第二层次甚至第三层次的解释, 但是在这些中国的IPA研究中, 几乎没能看到这些深层次的解释。

虽然Smith (2011)和本研究并未将效度作为研究质量的标准之一, 但是质性研究者对质性研究的效度问题开展了大量讨论, 并日益反对将质性研究的效度直接等同于量化研究的效度。因为质性研究的价值并不在于它的结论的可推广性, 而且质性研究也并不致力于得出普遍性的结论, 而是为某一现象的探索贡献出新鲜的、独特的、深刻的理解(Creswell, & Miller, 2000; Golafshani, 2003; Lub, 2015)。研究者们尝试提出了一些质性研究质量的评估标准, 如Yardley (2000)的四大原则:对语境的敏感性、投入和严谨、透明和连贯、影响力和重要性。也有研究者提出处理质性研究效度问题的方法, 如独立核验, 同时明确指出, 使用这些方法并不意味着研究质量自动得到保证, 不使用这些方法也不意味着研究质量低下, 重要的是研究者在质性研究过程中的高度自觉与反思(Smith et al., 2009)。因此, 本次评估同时也关注了这49项研究是否使用了某种措施来提升其效度, 目的是为了引起研究者们的重视:一方面, 效度标准不是唯一的指标, 另一方面, 提升效度、保证质量需要研究者们投入极大的严谨性、自觉性并不断付出创造性的努力。

相比于扎根理论或其他现象学取向的质性研究方法(Giorgi, 1970; Glaser & Strauss, 1967), 对IPA的运用是更为晚近的事情, 第一篇以中国群体为研究对象的IPA研究得到发表是在2006年。质性研究的方法众多, 可能是因为中国的研究者们对解释现象学分析的理论和方法理解不够透彻, 导致很多IPA研究质量并不理想。因此, 根据Brocki和Wearden (2006), Smith等人(2009)以及Smith (2011)的研究, 我们尝试制定一份IPA研究指南(参见表3), 希望为有意使用IPA的研究人员提供一些可供参考的建议。不过需要注意的是, 这份指南并非是唯一、固定不变的, 随着IPA和质性研究不断推进, 研究的指南可能也会有调整。

表3   IPA研究指南

1. 明确指出使用IPA的原因
●在做研究之前, 要想好为什么要选用IPA, 而非扎根理论、话语分析或主题分析等。选用IPA主要的原因在于想通过研究者的解释(诠释学)去理解特定群体(特则取向)的生活经验(现象学)。
2. 关注点应清晰明确
●好的IPA研究都有着清晰的主题。一般来说, 有三种类型的研究主题:
(1) “X群体如何看待Y经历?”, 比如Smith和Rhodes (2015)对抑郁症病人如何看待其第一次抑郁症发作经历的研究;
(2) “X群体如何看待Z概念?”, 比如研究神职人员对人是什么样这一问题的看法(Vignoles, Chryssochoou, & Breakwell, 2004);
(3) “X群体如何看待Y经历对Z概念的影响?”, 比如研究早期阿尔茨海默病患者如何看待和处理疾病对他们自我感知的影响(Clare, 2003)。
3. 选取较为同质的研究对象
●IPA研究得益于对某一特定群体在特定背景下的生活经验的深入探究, 因此应选取较为同质的研究对象, 即使选取的研究对象在一些对该生活经验影响较大的社会人口学变量上较为一致。
4. 进行高质量的访谈
●通过有效的访谈获取资料是好的IPA研究的先决条件, 这需要访谈者掌握熟练的技巧来进行提问和追问。IPA一般采用一对一的半结构化访谈或非结构化访谈。
5. 采用迭代的分析流程
●诠释学中有一个非常著名的概念——诠释学循环, 指的是部分和整体的关系。要了解任何特定的部分, 需要看整体, 对整个文本的了解, 可能会加深对部分文本的理解; 要了解整体, 需要要看部分, 对部分文本的深入理解, 可能会促进对文本整体的理解。
●虽然IPA给出了6个步骤的分析流程, 但这只是对一般流程的指导。在实际的分析过程中, 需要反复分析和思考资料, 要求动态的、非线性的思维方式。
6. 使用足够的摘录以支持主题
●研究需要引用足够的摘录来支持其提取出来的主题。在样本量为1~3的研究中, 每个主题下需要有来自所有研究对象的摘录; 在样本量为4~8的研究中, 每个主题下至少应有3位研究对象的摘录; 当研究的样本量大于8时, 每个主题下至少应有3位研究对象的摘录同时注明每个主题在所有研究对象中出现的频次; 或每个主题下至少包含一半研究对象的摘录。
7. 要求研究者的解释而不仅是描述
●IPA最重要的特征之一是强调研究者的解释。这里涉及一个双重诠释的过程:研究者尝试理解研究对象对自身生活经验的理解。不过解释应始终基于文本而进行, 且存在不同的层次。
8. 分析需要显示出研究对象间的趋同和分歧
●当IPA研究有不止1位研究对象时, 结果部分需要呈现研究对象间共同的主题, 也需要展示个体经验的独特性。文章需要展现并分析不同研究对象如何以不同的、独特的方式来体现该共同主题。对相似与差异、趋同和分歧的细致分析是优秀IPA研究的标志。
9. 使用独立核验来保证质量
●将研究的所有资料(研究计划、访谈提纲、录音、转录稿、分析过程及报告)提供给没有参与该研究过程的研究者, 让他们根据这些资料来检查最终的报告是否合理、可信。

新窗口打开| 下载CSV

5 结论及展望

本研究通过系统评价分析了以中国群体为研究对象的IPA的情况, 得到以下结论:(1) IPA研究在中国逐年增多, 大部分聚焦在心理学领域; (2)合格及优秀的论文仍然较少, 只占总研究数量的1/3左右。

将来的IPA研究首先需要质量上的提升, 对IPA理论及方法的遵循都应更为严谨。具体来说, 在选题上应更加聚焦于特定人群的重要经历和体验; 在样本选择上应选取小规模、同质性的样本; 在资料收集中应使用半结构化访谈获得第一人称视角的、深入的叙述; 在分析过程中应采取迭代而非线性的主题形成方式; 在分析层次上应体现研究者的诠释而不仅仅是描述现象; 在研究的可信度上应邀请其他研究者对分析过程进行独立核验。

其次, 除了在心理学领域, IPA也可以帮助社会科学的其他领域以及人文科学和医学等领域做出重要贡献。Smith等人(2009)指出, IPA的核心关注点在于人们对特定经历的体验、理解和意义建构, 这不仅是心理学的研究对象, 同时也是其他很多学科的关注点。无论研究属于哪一领域, 只要关注研究对象特殊和重要的经验, 那么IPA就适用于这些研究(Smith, 2018)。比如教育学领域的研究者运用IPA来探索学生在学习质性研究方法过程中的体验(Cooper, Fleisher, & Cotton, 2012), 护理学领域的研究者使用IPA来分析护士给血液病患者提供临终服务过程中的体验和挑战(Grech, Depares, & Scerri, 2018), 新闻学领域的研究者利用IPA来阐释报道自然灾害的记者们所体验到的多重身份角色(Tandoc & Takahashi, 2016), 信息和管理科学领域的研究者尝试通过IPA了解人们使用个人云存储服务的过程和体验(Ghaffari & Lagzian, 2018), 等等。中国目前正处于社会转型期, 关注人们的精神感受、身心状态的研究在各个领域都方兴未艾(王俊秀, 2014)。研究者可以继续使用IPA并拓展其使用范围, 对人类生活经验展开全面和深入的探索。

最后, 结合了质性和量化取向的混合研究设计近年来在各个领域得到了越来越多的运用(Johnson & Onwuegbuzie, 2004; Creswell & Plano Clark, 2017)。IPA经常出现在这样的混合研究设计中, 与量化取向的研究方法相结合, 对研究对象的生活经验和意义建构进行更为深入的探索(Vignoles et al., 2004; Geerlings, Thompson, Kraaij, & Keijsers, 2018; Zamariola, Frost, van Oost, Corneille, & Luminet, 2019)。虽然两种取向在研究范式上存在差异(量化研究的实证主义和质性研究的建构主义), 但很多研究者认为它们的结合是合理且有利的, 能发挥各自优点并克服诸多缺点, 如量化研究缺乏对研究对象的深入理解, 质性研究的结论可推广性不足等(Johnson & Turner, 2003)。因此当研究者既想要保证结论的可推广性, 又想要深入细致地探索研究对象的经验及其理解时, 可采用IPA与量化方法相结合的混合设计, 并根据研究需要或以IPA为主, 或以量化为主, 也可二者比重持平(Johnson, Onwuegbuzie, & Turner, 2007)。


