ISSN 1671-3710
CN 11-4766/R
主办:中国科学院心理研究所
出版:科学出版社

心理科学进展, 2020, 28(1): 41-54 doi: 10.3724/SP.J.1042.2020.00041

社会心理服务:研究与实践

群体决策质量评估方法及其在大学生和社区居民中的应用

池丽萍1, 辛自强,2, 孙冬青2

1中华女子学院儿童发展与教育学院, 北京 100101

2 中央财经大学社会与心理学院, 北京 100081

The evaluation methods of group decision-making and their applications among college students and community residents

CHI Liping1, XIN Ziqiang,2, SUN Dongqing2

1 School of Child Development and Education, China Women’s University, Beijing 100101, China;

2 School of Sociology and Psychology, Central University of Finance and Economics, Beijing 100081, China

通讯作者: 辛自强, E-mail:xinziqiang@sohu.com

收稿日期: 2019-08-20   网络出版日期: 2020-01-15

基金资助: 国家社会科学基金重点项目“社会治理背景下的心理建设研究”.  16AZD057
中华女子学院校级重大科研项目.  

Received: 2019-08-20   Online: 2020-01-15

摘要

社会心理服务体系建设要求用心理学理论和方法开展精细化社会治理, 而在多元主体共商共治的过程中出现了群体决策质量无法得到有效评估的问题。群体决策“过程-结果模型”认为应该从“双过程” (信息加工过程和人际互动过程)和“双结果” (客观结果和主观感受)两个方面综合评估群体决策质量。基于该模型建构的群体决策质量问卷自评法和录像他评法被应用于大学生和社区居民一些真实问题解决的群体决策质量评估。研究结果显示群体决策质量自评问卷效度良好, 适合作为群体决策质量的自评工具; 录像他评法与问卷自评法结果相互印证能够全面地反映群体决策质量, 可应用于更广阔的社会治理领域中。

关键词: 群体决策 ; 过程-结果模型 ; 社区议事 ; 社会治理

Abstract

The construction of social psychological service system means applying psychological theories, methods and techniques to social governance. Social governance usually is a process of multi-subject co-governance, in which all stakeholders make a group decision based on negotiation. However, it is difficult to systematically evaluate the quality of group decision-making. Therefore, a "process-result model" of group decision-making was proposed, in which the quality of group decision-making is evaluated on the levels of “process” and “result”. Concretely, there are two types of processes of “information processing” and “interpersonal interaction”, and two types of results including “objective decision results” and “subjective feeling”. Based on the model, a video evaluation method and a self-assessment questionnaire to measure the quality of group decision-making were developed and applied among college students and urban community residents. It was found that the self-assessment questionnaire of group decision-making was a valid instrument. Moreover, the results from the video evaluation method and the self-assessment questionnaire could confirm each other, which suggests that these two methods can be generalized into more settings of social governance.

Keywords: group decision-making ; process-result model ; community council ; social governance

PDF (863KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

池丽萍, 辛自强, 孙冬青. 群体决策质量评估方法及其在大学生和社区居民中的应用. 心理科学进展[J], 2020, 28(1): 41-54 doi:10.3724/SP.J.1042.2020.00041

CHI Liping, XIN Ziqiang, SUN Dongqing. The evaluation methods of group decision-making and their applications among college students and community residents. Advances in Psychological Science[J], 2020, 28(1): 41-54 doi:10.3724/SP.J.1042.2020.00041

1 引言

社会心理服务体系建设是我国创新社会治理的重要举措, 社会治理涉及多元主体(政府、社会组织、公民、公务员等), 各方通过“共商”实现“共治”。其本质是为达成某一目标, 各主体按照某种规则(如法律与行政规范、议事规则)进行沟通、协调并做出决策, 这一过程可以理解为群体决策(group decision making)过程(辛自强, 2018a)。由此, 如何评估并提升人们的群体决策质量, 是社会治理和社会心理服务体系建设需要面对的一项基础性工作。

群体决策指两个以上个体组成的群体围绕决策问题进行信息分享、交流互动, 最终达成共同认可的解决方案的过程(孙冬青, 辛自强, 2017)。它广泛存在于民生政策制定、企业经营战略调整(Ertac & Gurdal, 2019)、大学生校园问题协商及社区居民民主议事(孙江涛, 2018)等各领域中。经济学、管理学及心理学等相关学科的研究结果显示, 群体决策质量往往优于个体决策(卢志平, 2010), 且决策结果能够得到更好的贯彻和落实(毕鹏程, 2010; 陈明榴, 2015; 于泳红, 汪航, 2008; Devine, Clayton, Philips, Dunford, & Melner, 1999)。然而, 如何评估和提升群体决策质量却一直困扰着群体决策的实际应用者和研究者。本文拟在综述以往研究的基础上阐述我们对这一问题的看法, 以及已经开展的相关学术探索。

2 群体决策质量评估方法研究进展

群体决策质量的评估方法在很大程度上是由研究范式和决策任务类型决定的(孙冬青, 辛自强, 2017)。目前在经验研究中常见的决策任务有两类:标准实验任务和开放式的非标准任务。

标准实验任务存在唯一正确的答案, 因此可以以此为标准确定群体决策结果是否正确或者确定决策选择的正确率(Burtscher & Meyer, 2014; Lam & Schaubroech, 2011)。除了可对决策结果做客观评估, 还可关注决策过程中的信息加工特点, 如参照标准答案考察群体成员对任务场景中信息记忆的敏感度、信息分享和使用情况(Xiao, Zhang, & Basadur, 2016)以及决策标准的保守或冒险程度(Postmes, Spears, & Cihangir, 2001)。许多经典的群体决策研究范式均提供了可用正确率作为决策质量评估指标的任务。例如, 在隐藏文档范式的“谋杀迷案”任务、“最佳求职者”等任务中, 可根据决策群体是否能够依据信息正确推测出真凶或最佳求职者来评判决策质量, 推测正确则决策质量好, 错误则决策差(Cordes, 2016; Deiglmayr & Spada, 2010)。又如, 在项目排序研究范式的“荒岛求生情境”中, 要求成员在限定时间内共同完成多组排序任务, 根据最终决策结果的正确排序个数以及总题目数可求出群体决策正确率(Burtscher & Meyer, 2014)。这类决策质量评估方法都只适用于有标准答案的简单静态情境, 虽然客观性较好, 但其生态效度低, 难以考察群体成员的动态互动过程。

对于开放式的非标准任务, 其决策结果的不唯一性、非标准化给决策质量的评估带来困难。研究者们多采用最终结果所包含观点的数量、深度和广度, 以及决策所耗费的时间、投票轮次(如郑全全, 李宏, 2003; Taylor, Berry, & Block, 1958)等来评估决策质量。然而, 仅考察这些反映决策结果的指标, 难以说明结果何以如此, 因此, 有些研究者从决策过程中抽取出信息加工过程指标, 如共享信息和非共享信息的提及率、重复率、保持量、群体成员信息偏好的改变量、讨论问题的具体内容等(Larson, Pennie, Foster-Fishman, & Keys, 1994)。此外, 群体氛围、成员表达的自由程度、成员对他人及决策过程的影响(郑全全, 朱华燕, 2001; Reimer et al., 2010; Timmermans & Vlek, 1996; Woolley & Malone, 2011)、成员身份及观点表述方式(Alfandari, 2019; Sinaceur, Thomas- Hunt, Neale, O’Neill, & Haag, 2010)、是否出现群体思维(Chapman, 2006)等反映群体决策中人际互动特征的变量对决策结果的影响也吸引了研究者的目光。

值得注意的是, 前述两类任务的研究往往将人际及信息加工特征变量只作为最终决策结果的影响因素, 而很少意识到这些因素本身就是群体决策质量的直接体现。例如, 群体成员是否在决策中获得表达机会, 可能会影响其对决策结果的认同感和执行度, 这种主观感受有时比决策结果是否最优来得更重要。这种主观感受的重要性, 恰恰在致力于研发群体决策辅助工具的那些应用研究中得到了关注。它们往往注重考察产品用户对决策过程和结果的满意度、对决策方案的信心以及自己感知的参与程度(如Hillebregt, Scholten, Post, Visser-Meily, & Ketelaar, 2019; Timmermans & Vlek, 1996)。

3 建构群体决策质量评估模型的基本思路

现实生活中的大部分群体决策都不存在简单的唯一答案, 因此不能直接套用标准化实验任务中的对错与否、正确率等指标来评估决策质量。在社会治理中, 群体决策的复杂度远远超过这类标准的实验任务。例如, 大学生如何通过决策确定集体宿舍空调的使用规则和电费分摊方法, 社区如何解决楼道等公共空间被居民私人占用的问题, 这些问题既无统一解决方法, 也无标准答案。在社会治理过程中, 人们总是要面对这些结构不良的、边界不清的, 甚至目标都不明确的问题。而先前针对开放性非标准任务的研究, 很少涉及社会治理场景, 而且没有综合考虑客观结果、信息加工过程、人际互动过程等因素来系统评估决策质量。因此, 如何开发适合的模型来全面描述、评估社会治理中这类现实的群体决策的特点或质量是亟待解决的问题。通过深入的文献分析(孙冬青, 辛自强, 2017), 我们认为应该基于如下两个原则建立合适的评估模型。

一方面, 要坚持过程和结果并重的原则。现有文献中, 对群体决策质量的评估主要有两类方法:基于决策结果的评估和基于决策过程的评估。针对决策结果质量的评估通常采用专家现场评估, 或者以各项客观指标, 如上文提到的任务完成所用时间、投票轮次、观点总数或平均观点数量、产生的新观点数量、新观点的深度和广度等来衡量(如郑全全, 李宏, 2003; Sinaceur et al., 2010; Timmermans & Vlek, 1996)。其优势体现在评估方法客观、评估指标定量化, 评估过程中人为因素影响能降至最低。但是, 结果评估不可避免地会忽略决策过程中信息加工状态、群体成员互动等因素对群体决策的影响。因此, 借用录音、录像等手段记录决策过程并对其中各类信息被加工的程度(Xiao et al., 2016)、群体成员的观点冲突产生与消解过程(如沙勇忠, 陆莉, 2016; Blackhurst, Wu, & Craighead, 2008)、情绪与观点表达方式(Alfandari, 2019; Salerno, Peter-Hagene, & Jay, 2019)等进行分析便成为决策质量评估中必不可少的部分。群体决策总是要通过一定的信息加工和人际互动过程, 力争达成某种共识或做出某种决策, 是“过程”和“结果”的统一体, 因此, 我们应该将过程评估和结果评估两个思路统一起来。

另一方面, 要坚持主观和客观兼顾的原则。上述对“过程” (如信息交流状态、成员互动情况等)和“结果” (如决策用时、观点数量等)的评估都侧重决策的客观方面, 然而, 群体决策的主体是“人”, 我们不能只考察决策的客观进程和结果, 还要关注决策参与者的主观体验。例如, 在社会治理过程中, 决策过程和结果是否实际上达到“最优”并不是影响决策执行的唯一因素。研究表明, 决策参与者对决策任务及结果的认同度和满意度、对自己付出的努力及参与度的评价都会影响决策质量和决策的落实程度(毕鹏程, 2010; 郑全全, 郑波, 郑锡宁, 许跃进, 2005; Hillebregt et al., 2019), 因此, 这些主观因素应该作为群体决策质量评估的指标之一。这意味着群体决策质量的评估不仅要观测决策过程、结果等客观指标, 还需要考虑群体决策参与者的主观感受。

4 群体决策质量评估模型及评估方法

4.1 过程-结果模型

基于上述思路, 我们提出了群体决策质量评估的“过程-结果模型” (孙冬青, 辛自强, 2017)。该模型涵盖了群体决策中的两个过程和两个结果(见图1)。其中, 两个过程分别指群体决策中信息加工过程和人际互动过程; 两种结果分别是客观任务结果和主观感受结果。

从过程角度来看, 群体决策可视为一个伴随着人际互动的信息加工过程。决策任务信息以及决策者分享的信息、生成的信息会被群体成员获取、加工、使用、交换(毕鹏程, 2010), 从而表现出一系列个体内的信息加工过程, 以及个体间的信息交换和流动过程。信息在群体成员之间的交换以及群体的权力结构、参与方式、相互影响等都属于人际互动过程。例如, 群体成员表达观点、游说他人、产生冲突、达成共识等都是群体决策中常见的人际互动过程(Alfandari, 2019; Blackhurst et al., 2008; Rilling & Sanfey, 2011)。在图1的理论模型中, 信息加工过程包括决策中产生新信息的数量和质量、信息被共享的程度、信息表达的准确性以及它被理解的准确性等; 人际互动过程则以群体成员参与的主动性、互动氛围的开放性、他人对观点的反馈、领导风格、是否出现群体思维等作为测量指标来反映群体决策 质量。

从结果的角度来看, 客观结果体现在决策是否有效“解决问题”, 如达成了某种共识或形成了某种方案; 主观结果则体现为决策者是否有良好的主观感受。在图1的理论模型中, 我们拟用完成决策任务的时间、产生方案或观点的质量作为客观的任务完成指标; 用决策成员对决策结果的满意度、认可度、对决策群体关系的评价等作为主观的结果指标。

4.2 评估方法

由于上述的两类过程和两类结果的内容和性质不同, 我们开发了两种方法评估群体决策质量:一是问卷自评法, 由群体成员或决策者基于自己实际的决策经历来评估图1模型中的信息加工过程、人际互动过程和主观感受结果; 二是录像他评法, 该方法通过专家或第三方来对上述两个过程和决策的客观结果进行评估。两种方法可独立使用, 也可同时使用, 将录像他评法作为问卷自评法的效标, 提供更详细的评估指标。

图1

图1   群体决策质量评估的“过程-结果模型”


问卷自评法可以使用我们开发的“群体决策质量自评问卷”。该问卷包含信息加工、人际互动和主观结果三个维度, 共18个项目。其中, 信息加工维度包括表1中的1、2、3、10、11题, 分别考察决策中重要信息数量、新信息数量、内容的集中性、信息被有效理解的程度; 人际互动维度包括表1中的第4、5、6、7、12、13、14、15、16题, 分别涉及互动中成员的参与度、是否及时反馈、平等氛围、领导作用和群体思维; 表1中的第8、9、17、18题是对主观结果的评估, 考察成员对结果的满意度、执行意愿和对群体社会关系的评价。问卷所有项目均采用从“1”到“5”的五点计分方式, 其中, 第7和16题需要反向计分。问卷各维度得分越高, 表示群体决策在信息加工、人际互动及决策主观感受等方面表现越好, 决策质量也越高。

表1   群体决策质量自评问卷项目

问卷项目选项
(1)这次讨论中, 你提出多少相关的意见或建议?①完全没有 ②有一些 ③比较多 ④相当多 ⑤非常多
(2)你提出的观点是否能被他人准确理解?①完全不理解 ②少部分理解 ③一半理解 ④大部分理解 ⑤完全理解
(3)讨论中, 大家说出了多少你之前不知道的重要消息?①完全没有 ②有一些 ③比较多 ④相当多 ⑤非常多
(4)讨论中, 你是否主动对他人的观点做出评价?①从没有 ②偶尔有 ③有时有 ④经常有 ⑤总是有
(5)你在多大程度上主动参与到这次话题的讨论中?①从不 ②偶尔 ③有时 ④经常 ⑤总是
(6)讨论过程中你是否有机会平等地表达你的观点?①从没有 ②偶尔有 ③有时有 ④经常有 ⑤总是有
(7)你发表观点时, 是否担心自己的观点受到他人指责?①从没有 ②偶尔有 ③有时有 ④经常有 ⑤总是有
(8)决策结果是否符合你个人的需求?①完全不符 ②比较不符 ③说不好 ④比较符合 ⑤完全符合
(9)你是否会配合这次讨论结果的执行(或实施)?①一定不会 ②大部分不会 ③说不好 ④大部分会 ⑤一定会
(10)这次讨论中, 大家说出了多少对决策有重要作用的信息?①完全没有 ②有一些 ③比较多 ④相当多 ⑤非常多
(11)大家谈论的内容是否和商讨的事情有关, 没有跑题?①总是跑题 ②经常跑题 ③有时跑题 ④偶尔跑题 ⑤从未跑题
(12)大家在讨论过程中是否踊跃地建言献策?①从没有 ②偶尔有 ③有时有 ④经常有 ⑤总是有
(13)讨论过程中大家是否存在不同观点的争论?①从没有 ②偶尔有 ③有时有 ④经常有 ⑤总是有
(14)讨论中, 每个人的发言机会平等吗?
①非常不平等 ②比较不平等 ③说不好 ④比较平等 ⑤完全平等
(15)领导鼓励大家表达自己不同的观点和意见吗?
①非常不鼓励 ②不太鼓励 ③说不好 ④比较鼓励 ⑤非常鼓励
(16)为了和多数人保持一致, 是否有些人有不同的想法也不说?①完全没有 ②有一些 ③比较多 ④相当多 ⑤非常多
(17)你对这次群体讨论得出的结论满意吗?
①完全不满意 ②比较不满意 ③说不好 ④比较满意 ⑤完全满意
(18)讨论结束后, 大家的关系是否和谐融洽?
①非常不和谐 ②比较不和谐 ③说不好 ④比较和谐 ⑤非常和谐

新窗口打开| 下载CSV


为了保证自评测量方法的客观准确性, 该问卷还区分出自我评价和群体评价两个子问卷。其中, 自我评价子问卷(表1中的1~9题)是每个成员对自己决策过程和结果的评价; 群体评价子问卷(表1中的10~18题)是成员对整个决策群体状况的评价。两个子问卷的测量结果彼此呼应, 应呈较高的正相关关系, 即当群体成员对自我的评价较积极时, 对整个群体的评价也应该相对积极。

使用录像他评法进行决策质量评估需要对群体决策过程全程录像, 并进行录像的文本转录和编码。操作步骤如下:

步骤一, 录像文本转录。将待评估的群体决策视频中的音频逐字转录为文本, 保留音频中的自然停顿、重复、口误等原始信息。视频中的重要非言语信息(如制止他人的手势、点头等)在转录文本的相应位置做出文字说明。转录文本应区分每个成员的发言内容、发言时长并将转写文本导入EXCEL文件中便于后续的分类标记、观点汇总等工作。

步骤二, 分类标记。以群体成员在决策讨论中的不间断发言为单位, 每个发言单位均对应标记相应的发言者编号和所用时间。据此可以提取出整个群体的互动总次数、每个成员的互动次数、每个成员在群体决策过程中的发言总量和发言总时长、每个议题的讨论时长等指标信息。

步骤三, 观点汇总及分类。逐句阅读转写文本, 标记决策过程中提及的所有观点(无论这个观点是否被最终采纳)并将观点列在EXCEL文件的对应位置上, 由此可得到群体决策观点总库。而后, 请2位以上未参与评估研究的专业人员对观点总库中的所有观点进行讨论分类, 为建构观点树做准备。

步骤四, 建构观点树。将观点总库中的所有观点按照概括程度区分成三层:主干、大枝和小枝。其中, 主干能反映讨论过程中观点所涵盖的领域范围, 每个主干下包括若干大枝; 大枝反映的是主干领域中的观点类型, 每个大枝下又包含若干小枝; 小枝体现每个大枝观点分类中不同的具体观点。相同观点的不同表达方式均作为并列观点, 纳入同一个小枝中。观点树的具体建构过程见下文研究实例。

步骤五, 互动内容编码。逐句阅读转写文本, 根据每个句子、发言之间的关系判断讨论过程是否可以划分阶段, 每个阶段中讨论的议题是否唯一, 针对每个议题是否有不同观点和建议, 是否有反馈、回应、理解错误等问题, 是否存在观点交锋, 是否得出统一结论, 讨论进程如何推动, 是否出现跑题现象, 讨论是否有规则可循(如轮流发言等), 互动中是否出现领导, 群体领导发言在讨论进程中的作用, 群体氛围如何, 是否出现小团体讨论等现象进行标记。此步骤为人际互动过程分析做准备。

步骤六, 编码结果汇总复核。将上述文本编码内容进行汇总, 同时检查并排除重复计数、编码类型不互斥等情况。

利用上述文本编码信息可以测量和评估图1模型中的决策信息加工、人际互动和客观结果三个方面。首先, 对信息加工过程的评估。在上述观点汇总与分类的基础上建立观点树, 对决策过程中所产生的观点广度和深度进行定量测量。其次, 对人际互动过程的评估。在上述文本编码分析的基础上, 对群体决策过程的总互动次数、个体发言次数、领导角色、讨论进程等方面进行定量和定性分析, 以评估人际互动过程。最后, 决策任务的客观结果评定。采用决策时长和最终决策方案的质量等指标来评估。其中, 决策最终方案质量评估仍借助观点树计算观点的广度和深度指标。

录像他评法对群体决策质量的评估能够保证评估的客观性, 满足了可反复观察、多次评估的需求。同时, 录像他评法对决策过程的评估可与群体决策自评问卷中的过程评价内容互为印证。例如, 对应自评问卷项目“讨论中, 每个人的发言机会平等吗”, 可以根据录像转写文本中个体的发言数量占总体发言数量的比率进行核对; 又如“这次讨论中, 大家说出了多少对决策有重要作用的信息”, 可与录像转写文本中的有效观点数量进行对比。

综上, 两种评估方法在使用过程中各有利弊。问卷自评法简单易行, 且不依赖专家知识, 适合实践部门快速、简单地评估群体决策质量。录像他评法能够生动地展示决策过程的细节, 深入探测决策特点, 但是其实施过程和操作步骤较复杂, 需要依赖专家知识, 更适合研究者进行学术研究或需要系统全面评估群体决策质量时使用。

5 群体决策质量评估方法在大学生群体中的应用

我们将基于“过程-结果模型”建构的群体决策质量评估方法应用于大学生群体决策中, 初步展示了群体决策质量的问卷自评法和录像他评法的应用效果。

5.1 被试与群体决策任务

采用大学校园公开招募的形式邀请49名在校大学生围绕真实的“宿舍空调使用问题”进行群体决策(该校不久前刚为学生宿舍安装了空调)。选取2男3女5人组成10个“临时”决策小组(其中一组由4人组成)。实验者向每个决策小组成员发放决策任务材料。材料描述了夏季宿舍空调使用过程中, 由于床位距离空调的位置不同、每个人的舒适体表温度不同、电费分摊意见分歧影响了宿舍同学的关系。决策小组需要共同商讨出今后空调的使用方案, 解决空调什么时间开, 温度为多少, 费用如何分配等问题, 且该方案将作为未来全校统一的使用标准, 不得更改。这一决策任务结合了该校宿舍空调安装的真实背景, 因此任务真实、小组成员带入感强。决策小组成员需要完成三个任务:(1)结合任务材料和自己在宿舍空调使用问题上所面临的困扰, 独立思考可能的解决办法并简单写出方案, 限时5分钟; (2)小组共同商讨, 制定出符合大家需求的空调使用方案, 限时30分钟(此时段全程录像); (3)根据小组讨论情况填答群体决策质量自评问卷。

5.2 大学生群体决策质量的问卷自评结果

所收集的49人自评问卷数据全部有效, 可进行统计分析。首先, 对问卷内部进行相关分析, 结果表明自我评估子问卷(M = 3.69, SD = 0.40)和群体评估子问卷(M = 3.85, SD = 0.35)得分存在中等程度的正相关r = 0.56, p < 0.01。这一结果符合问卷编制的理论构想, 说明评估问卷的整体结构合理。

其次, 计算每个决策小组的自评问卷得分并进行排序。自评问卷计分包括“自我分” (即自我评价子问卷总分除以题目数9)和“群体分” (即群体评价子问卷得分除以题目数9)。表2呈现了每个决策小组的得分及排序情况。结果显示, 第7组群体决策质量自评问卷的自我分和群体分均最高, 即决策质量最高; 第8组自评问卷的两个分数都为最低, 即决策自评最差。10个小组的自我分和群体分的排序虽然有差别, 但整体模式大致相同。根据问卷编制构想, “群体分”应为更客观的决策质量评估指标, 而“自我分”可能受到成员自我效能感、自我保护心理的影响, 评价未必那么客观。因此下文将10组群体决策质量的“群体分”排序作为比较对象。

表2   不同小组决策质量评估得分的描述性统计(M ± SD)

组别12345678910
群体分3.93 ± 0.463.67 ± 0.003.71 ± 0.393.82 ± 0.283.89 ± 0.243.67 ± 0.454.24 ± 0.303.58 ± 0.183.89 ± 0.354.07 ± 0.20
排序38.5764.58.51104.52
自我分3.89 ± 0.533.72 ± 0.333.56 ± 0.083.62 ± 0.193.82 ± 0.333.60 ± 0.704.00 ± 0.323.42 ± 0.363.53 ± 0.413.71 ± 0.38
排序24863711095

新窗口打开| 下载CSV


最后, 为验证群体决策质量自评问卷的有效性, 邀请2名心理学专业研究生作为评估者(均不知道群体决策自评问卷的得分排序)观看这10个小组决策过程的录像并对10段录像的决策质量进行排序, 排序结果见表3。对2名评估者(A、B)的排序进行斯皮尔曼等级相关分析, r = 0.83, p < 0.01, 说明2名评估者的评定较为一致。根据问卷编制假设, “群体分”能更客观地反映决策质量, 因此将10组群体决策质量的“群体分”排序作为比较对象。结果显示, 决策质量排序前三名均为第1组、第7组和第10组, 后三名基本为第6组、第8组、第4组, 除第2组和第5组不同评估者排序略有出入外, 决策质量评估问卷的群体分排序和评估者排序基本吻合。对表3中的3个评分排序计算出的肯德尔和谐系数W=0.92 (c2(9) = 24.74), p < 0.01, 说明问卷自评顺序和评估者他人评定较为一致, 即群体决策质量自评问卷有效。

表3   评估者对各组群体决策质量排序

组别12345678910
评估者A排序15867921043
评估者B排序37684911052
问卷群体分排序38.5764.58.51104.52

新窗口打开| 下载CSV


5.3 大学生群体决策质量的录像他评结果

采用录像他评法比较10个小组决策的信息加工过程、人际互动过程和客观的任务完成情况。

5.3.1 对决策信息加工过程的评估

对决策信息加工情况的评估采用观点树评分。参照郑全全和李宏(2003)的方法, 我们首先对宿舍空调使用方案决策过程中的观点建立了观点树, 具体建立程序如下。

步骤1:观点汇总。在转写文本的编码过程中将10个小组的群体决策过程及结果所产生的观点汇总, 共获得146条观点。

步骤2:观点分类建库。邀请3名心理系的学生(未参加此实验)对所有观点进行讨论分类, 将针对相同问题的观点进行归类, 同时将相同观点在不同组别中出现的不同表达列举出来作为并列观点。

步骤3:构建观点树。针对宿舍空调使用问题建立了一个三层的观点树。其中包含主干、大枝和小枝。我们通过数字符号标记观点, 例如“1.2.3”表示此观点位置是主干一(温度设置问题)的第二个大枝(设置差异温度)的第三小枝“区分昼夜设置温度”。根据10组讨论涉及到的各种观点, 我们把全部的观点分为11个主干(包括温度设置、时间控制、费用分配、风向与风速、宿舍及床位、遥控器管理、保养维护、监管惩罚、使用原则、矛盾分歧解决和温馨提示等11个问题), 38个大枝(每个主干下有2~7个大枝), 以及更多小枝。

然后, 对群体决策产生观点的广度进行评估。观点广度的计分采用如下方法:只要涉及了某一主干中的任一观点(无论是在哪一大枝或小枝中), 则记为10分, 各主干不重复计分, 最高110分。得分越高表示决策产生的观点越广泛。将每个决策小组提及的观点和观点树对照计算其观点广度。10个小组的群体决策观点广度分数如图2所示。

图2

图2   群体决策过程各组产生观点的广度


图2可以看出, 第1、7、9组决策观点范围最广。举例来说, 第7组观点涉及的10个主干分别为:空调使用的时间、温度、费用、风向、宿舍床位、遥控器、监管惩罚、使用原则、矛盾分歧解决以及温馨提示; 而第2、6、8组观点范围较小。例如, 第8组的讨论中, 仅涉及空调使用的时间、温度、费用、使用原则以及温馨提示5个主干, 未涉及其他相关问题。

而后, 对群体决策过程产生的观点深度进行评估。观点深度指标的计分方法为只要提及大枝或小枝中任一观点, 则记10分, 最高380分(10*38)。分值越高表明决策产生的观点深度越大。据此计分方法, 10组群体决策方案中观点的深度评估分数如图3所示。

图3

图3   群体决策过程各组产生观点的深度


图3结果我们可以看出, 其中第7、9、10组决策观点深度值最大, 而第2、3、6、8组观点深度值较小。结合图2中观点广度的评估, 其中第7组群体决策产生的观点不仅范围广还较为深入, 说明其产生的观点质量最好, 该小组在群体决策质量自评量表中的“决策信息维度”得分也最高(M = 3.20, SD = 0.32); 而第8组群体决策产生的观点广度较窄, 同时较为表面, 该组在群体决策质量自评问卷的“决策信息维度”得分最低(M = 2.64, SD = 0.39)。这说明录像他评法与问卷自评法在决策信息加工方面所得评分结果基本一致。

5.3.2 对人际互动过程的评估

首先, 对人际互动过程进行定量评估。定量评估以录像转录文本中群体总发言次数来表示群体互动次数, 以每个成员(分别标为成员1、2、3、4、5)的发言次数来反映群体互动过程的话语分布并辅以雷达图直观体现群体发言机会是否均等。由表4可以看出, 在限时30分钟的讨论中, 不仅各小组互动总次数不同, 小组内成员的发言次数也不平均。

然后, 将每组成员发言次数制成雷达图(图4)。雷达图中1、2、3、4、5表示群体讨论中的5位成员, 五边形中心点为发言0次, 中间圈为50次, 外圈为100次, 最外圈150次(各成员发言次数均少于50次的小组, 雷达图五边形的中心点为发言0次, 中间圈为20次, 外圈为40次, 最外圈60次)。雷达图形状越饱满则表示群体发言机会越均等。

表4   各组人际互动过程的描述统计

组别互动
次数
成员1成员2成员3成员4成员5
1206664111781
211526421631
3100401243311
43128263554666
53335779145115
6202286893346
73257160858128
82381192547011
9238504817069
101842947454221

新窗口打开| 下载CSV


图4

图4   各决策小组各成员发言次数雷达图


图4我们可以清晰看出, 第7组的成员发言次数雷达图较为饱满, 除成员5发言次数较少外, 成员1、2、3、4发言次数较多, 且4人的话语分配比重近似, 由此可以说明第7组的决策过程是平等公平的, 每个人都有同等的权利表达自己的意见; 该小组在群体决策质量自评问卷的“人际互动维度”上得分最高(M = 4.33, SD = 0.42)。而第6组话语分布则不同, 较多的话语权在成员3身上, 其余四个成员发言很少, 最少的6次, 最多的也不足50次, 因此雷达图形状较为扁平, 这说明第6组的决策过程是由成员3主导, 其他人发表意见较少, 整体决策氛围并非公正平等。该组在问卷的“人际互动维度”上得分最低(M = 3.64, SD = 0.57)。

雷达图展现了群体决策中个体的话语分布情况, 其背后代表的是群体成员参与情况和决策氛围。结合前面分析的结果, 第7组群体决策质量自评问卷和信息加工过程评价均最佳, 同时成员发言次数雷达图也最为饱满, 可以推论出群体成员的整体参与度越高、决策氛围越平等则做出的决策质量越高。

最后, 对各决策小组进行互动类型描述。对10组详细的讨论进程进行划分, 对每段的讨论内容进行概括归类, 并统计出群体讨论提问题次数、跑题次数、领导的作用。根据录像和文本分析, 我们认为群体讨论过程可以分为以下三类(如图5所示)。

图5

图5   群体讨论类型


第一类为循序渐进型。该类型是指, 整体的讨论过程分为多个小讨论, 每个小讨论围绕一个议题开展并得出结论, 然后再开启下一个议题的小讨论, 每个议题讨论后不再重复, 如此下去直到所有议题讨论结束。我们用三个相连有序的椭圆表示, 其中每个椭圆表示针对某一主题的讨论。典型的如第1、7、10组。

第二类为两步一回头型。该类型是指, 整体的讨论过程依旧可以分为多个小讨论, 每次讨论针对一个议题进行, 然后再开启下一个议题, 值得注意的是, 该类型中小讨论过程也许并未得出明确结论就开启了下一个议题, 因此讨论过的议题可能再次重复, 于是整体的讨论过程呈现出前进几步后退一步的缓慢前进形态。我们用多个互相交叠的椭圆表示该过程, 交叠表示重复讨论某个讨论过的议题, 但讨论整体趋势是向前推进。典型的如第2、5、9组。

第三类为随机漫步型。该类型是指, 群体的整个讨论过程几乎没有明确的小讨论划分, 呈现出散乱的随机漫步形式, 即讨论者想到哪里就说到哪里或者讨论过的问题循环讨论。我们用一个大椭圆里包含独立散乱的小椭圆, 或包含交错循环的小椭圆来表示。例如第4、8组的讨论较为发散, 第6组则是循环讨论。

对各组决策过程录像进行反复观看并编码分析, 将各组特点列在表5中。通过横向比较10组群体决策过程, 我们可以发现多数决策小组的整体讨论过程均可以分为多个阶段, 每个阶段间的关系呈现出该组的互动类型。其中大部分小组都是小组成员针对问题依次轮流发言。此外, 虽然每组在开始前都通过自荐或他荐的形式选出小组长, 但并非每组的小组长都能胜任“领导”的角色——组织开展并不断推进本次讨论。每组的人际互动特点总结如表5

表5   各组群体决策互动特点分析

组别讨论阶段数互动类别是否轮流发言是否有明确
领导者
特点
110循序渐进3人主要发言, 空调使用经验丰富
28两步一回头无讨论交锋, 每人负责一项单独决定; 缺一人
36循序渐进讨论太表面, 没有深入展开
4随机漫步讨论无主线, 整体散乱, 目标不明确
511两步一回头新点子多, 时间感强
68随机漫步组长讲话具有攻击性、褒贬色彩严重
714循序渐进思路清晰、讨论充分, 后期有跑题
8随机漫步为避免矛盾出现群体思维、无理由妥协; 一人迟到
910两步一回头时间富裕, 存在小圈子讨论现象
1011循序渐进交锋充分, 多次征询

新窗口打开| 下载CSV


通过对群体互动类别的划分以及各组互动特点的分析, 我们发现较好的群体决策过程都是循序渐进型, 整体讨论被划分为数个小讨论逐项解决, 每一阶段的讨论都很具体深入, 有明确结论; 群体讨论过程中是否存在每位成员轮流表态并不是决定群体决策质量的关键因素; 群体讨论中无明显领导角色的小组决策质量往往不佳, 说明领导在决策中的作用是相当重要的。

5.3.3 对决策结果的客观评估

衡量决策任务完成情况的客观指标包括决策所用时间长短、发言总字数和最终决策方案的质量。由于本研究的决策任务完成是限定时间的, 因此各组任务完成的时间差别不大, 用时最短23分38秒, 最长36分40秒。决策用时越长, 发言总字数越多, 因此这两个指标并非本研究中评估决策结果的有力指标。我们将每个决策小组最终决策方案中的观点与观点树对照, 计算其观点广度和深度, 具体结果见表6。第1、3、7、10组的最终决策方案无论是在观点广度还是深度上得分都相对较高, 而第4、6、8组方案的广度和深度得分均较低。对照表5的群体互动特点分析结果可以得出明确结论:循序渐进型且有明确领导者的小组所得到的最终决策方案涉及观点丰富、讨论深入; 而随机漫步型并且无领导者或领导角色胜任度不佳的群体所得最终方案质量较差, 存在较多观点遗失, 条理性也较差。

表6   不同决策组最终决策方案的广度和深度得分

组别12345678910
广度70408030503070405070
深度12050110505060110605080

新窗口打开| 下载CSV


综上, 在大学生群体决策质量评估中, 群体决策质量自评问卷得分可以有效判别群体决策质量, 同时与基于录像的第三方评估、录像他评法中的观点树评估及互动评估结果一致, 三者互证可表明评估方法的有效性。

6 群体决策质量评估方法在社区中的应用

我国城市社区的居民议事会议是一种典型的群体决策实践, 然而由于缺少科学的评估方法, 社区群体决策的优劣无法及时判断, 造成部分失误的决策实施后产生了不良社会影响(王燕, 2015)。我们将基于“过程-结果模型”的群体决策质量评估方法应用于社区, 一方面希望了解社区居民议事现状, 展示评估方法如何在社会治理实践工作中应用, 另一方面通过对社区居民进行议事规则的干预培训及培训效果检验, 探寻提升社区群体决策水平的途径。

6.1 研究方法

研究采用有前后测的实验组对照组设计。自变量为议事规则培训, 是被试间变量, 实验组有议事规则培训, 控制组无培训; 因变量为社区居民群体决策质量。前、后测通过“群体决策质量自评问卷”进行自评, 同时采用决策过程的录像他评法测量。在北京市某街道下属的三个社区(A、B、C)开展研究, 其中A和B为实验组, C为控制组(该社区在前测中群体决策表现最好)。每个社区10人(含2~3名社区干部, 其余为社区居民, 含居民代表、社区志愿者及普通居民), 最终有效样本24人。被试年龄最大81岁, 最小30岁, 平均61.10岁(SD = 13.19)。

选择“社区居民占用楼道堆放杂物问题”和“促进社区居民节约用水、用电”两个议题作为社区群体决策议题。这两个议题是通过向街道社区建设科的领导、多位居委会主任征询, 并由居委会主任从5个和社区密切相关的议题中选出的。为控制议题内容对群体决策会议效果的影响, 在前测中为实验组A社区安排的议题为“占用楼道堆放杂物问题”, 实验组B社区安排的议题为“节水节电问题”, 控制组C社区安排的议题为“占用楼道堆放杂物问题”。后测时, 每个社区安排未曾讨论过的那个议题来讨论。每个社区群体决策的前后测均控制会场座位形式、群体决策时长、参与成员保持不变, 其实施程序包括分发议题相关材料、阅读材料并准备发言、集体讨论30分钟、填写群体决策质量自评问卷, 其中集体讨论全程录像。针对前测发现的社区议事存在的问题, 对实验组A和B进行社区议事规则的培训。社区议事会是实现社区事务共商共治的主要途径, 然而前测结果及以往研究(赵春飞, 2016)均显示当前的社区议事会往往缺乏科学的议事规则, 经常出现“跑题” “一言堂”等现象, 各方信息无法有效沟通, 居民利益无法在决策中体现, 也达不到集中智慧, 共同协商解决实际问题的目的, 因此我们的干预重点在于议事规则的介绍和演练。培训内容包括:(1)为居民播放关于“争执”“跑题”和“一言堂”内容的教学短视频, 播放随机截取的社区居民前测议事过程录像1分钟, 引导居民发现自己社区议事中出现的问题和不足; (2)介绍罗伯特议事规则(罗伯特, 2014), 并结合南塘十三条(寇延丁, 袁天鹏, 2012)展开具体讲解; (3)组织居民练习如何提出一个有效的动议, 其他人如何附议; (4)设置“机智问答”活动, 让居民判断给出的议事情境表现是否正确并说明理由, 进一步强化议事规则学习成果。培训时间为30分钟左右。对照组C社区的居民在培训时段仅观看上述(1)中的教学短视频和1分钟前测议事过程录像, 然后随意发言。前测、干预、后测三次活动时间间隔均为1个星期。

6.2 社区居民群体决策现状

首先, 采用录像他评法客观描述当前社区居民议事现状, 并对比培训前后两次议事状况以检验培训是否有效。

第一, 对群体决策信息加工过程的分析。按照前文介绍的转录文本编码方法和步骤, 对社区居民围绕“楼道堆放杂物问题”和“节水节电问题”的讨论过程分别建立了观点树。其中, 关于“楼道堆放杂物问题”的讨论可汇总、建构成含6个主干(包括宣传教育、宣传方法、处理方式、监管工作、政府作为、其他方法), 20个大枝(每个主干下包括2~6个大枝, 如普法、榜样、贴条、举报等)的观点树。根据“节水节电问题”讨论所产生的观点构建出的观点树也含有6个主干(包括节水、节电、教育、政策、宣传、科技助力等), 20个大枝(每个主干下包括1~5个大枝, 如水的多次利用、环保电器使用等)。可见, 两个议题产生的观点广度最大值均为60分, 深度最大值均为200分, 结合对社区居民有关这两个议题的难度判断、了解程度、解决能力的问卷调查结果, 可以认为两个议题具有相似性, 可以进行比较。三个社区前、后两次议事会议的观点广度和深度见表7。对比每个社区前后两次议事情况可以发现, 实验组A决策产生观点的广度和深度在培训后得到明显提高; 实验组B产生观点的广度和深度变化并不明显, 培训后反而有轻微下降; 控制组C变化并不明显, 第二次议事有轻微下降。

表7   各社区两次议事会议决策观点广度、深度与自评问卷得分

组别人数前测广度前测深度后测广度后测深度前测问卷后测问卷
A社区93090601804.09 ± 0.384.31 ± 0.26
B社区760150501304.25 ± 0.424.03 ± 0.52
C社区860160501204.50 ± 0.294.33 ± 0.30

新窗口打开| 下载CSV


第二, 对群体决策人际互动过程的分析。对第一次社区居民议事会议互动状况的分析显示, 每个社区的问题表现不同(具体情况见表8)。实验组A第一次群体会议持续30分44秒, 其中有19分26秒均有2人或2人以上同时发言, 相当于2/3的群体讨论过程混乱无章, 难以听清在场发言者的观点。情况最严重时有4人同时发言, 大家不断提高自己的音量以求自己的观点可以被他人听清。A社区议事会另一个明显的现象即为小团体讨论, 2~4人组成会议的小团体, 小团体经常脱离整体会议而各说各的。经过培训后, 实验组A的第二次议事会在议事程序、氛围上有了明显改善, 表现在如下三个方面。第一, 举手发言。在培训后的社区会议中, 居民能够主动举手, 得到主持人同意后才开始发表自己的见解观点。第二, 一次只有一人发言。社区居民能牢记一次只能一个人发言的规定, 在议事过程中会主动制止其他试图插话的居民。通过举手发言的规定, 在30分钟的会议讨论中, 多人同时发言的现象不足1分钟, 小团体“各说各的”现象较第一次社区议事时明显减少。第三, 发言机会均等。通过培训, A社区整个议事过程中每个人都获得了相同的发言机会, 除2名社区干部发言1~2次外, 其余成员每人至少发言4次, 最多10次, 而不像第一次社区议事时, 发言次数最多的高达17次, 最少的全程没有说过一句话。

表8   各社区第一次议事会(前测)现状

组别时长发言
字数
总发言
次数
跑题
次数
多人同时发言一言堂
时长占比发言次数占比
A社区30′44″3626114419′26″62.91%1714.91%
B社区30′12″682415552′01″6.68%4830.97%
C社区28′18″575713421′46″(7)6.42%1712.69%

新窗口打开| 下载CSV


实验组B在第一次议事中较为严重和明显的问题有两个。其一是“一言堂”现象。在整体的155轮发言中, 某位社区干部发言达48次之多, 相当于全部发言次数的31%; 该组发言转录文本字数共6824字, 此干部发言字数2435字, 占总体的36%。其二是“跑题”现象。例如, 有居民花约5分钟(议事时间的六分之一)描述自家如何帮助楼上邻居解决漏水问题; 另外, 讨论最后5分钟大家更多围绕社会宏观的节水问题讨论, 如商业租户如何规范用水、农田如何节水、森林公园建设蓄水池等问题, 这些均非社区节水主题应详细讨论的内容, 因此视为跑题。经过培训后, 实验组B可以做到举手发言, 但是“一言堂”改善效果并不明显, 社区干部在讨论过程中依旧占据主要话语权, 在26分22秒的讨论中, 该干部占用最后的9分钟(讨论总时间的三分之一)阐述自己的观点并针对其他人提出的问题给出解决建议; 转录文字统计显示这位干部发言字数仍占总话语量的36%。除此之外, 实验组B的其他成员均能就议题轮流发言, 说明自己面临的问题及观点, 议事氛围较好, 且紧紧围绕议题展开, 跑题现象明显减少。

相较于前两个社区, 控制组C的第一次议事会在社区主任的主持下进行的井然有序。参与社区议事的居民依次表达自己的观点, 并结合自己的实际经验针对本次议题提出可行的解决方案。在28分钟多的讨论中, 多人同时发言的现象出现7次, 总时长仅1分46秒, 议事成员说话最多的17次, 除了1名社区干部未发言外, 最少的发言5次, 可见议事氛围较为平等。讨论结束后, 社区干部根据会议记录总结了大家发言的要点, 大家表示一致认同。因为控制组C未接受干预, 其第二次讨论模式基本无变化。第二次19分10秒的讨论中有1分17秒是多人同时发言, 与第一次讨论几乎相同。对于第二次讨论中群体决策观点深度和广度的减少, 主要是由于议事时间较短(不到20分钟), 讨论不充分。整体来说两次讨论无本质差异。

最后, 采用自评问卷评估三个社区的决策质量及干预效果。选择完整参加了前测议事、干预和后测议事的24个居民作为有效样本, 对其前测和后测填答的群体决策质量自评问卷进行统计分析。鉴于自评问卷的“群体分”相对更为客观, 问卷自评指标均采用群体分。采用单因素方差分析比较三个社区前测时自评问卷的群体分, 结果显示三个社区群体分差异达到边缘显著, F(2, 21) = 2.70, p = 0.09, η2 = 0.21, 事后检验表明实验组A与控制组C得分差异边缘显著, 其他得分之间差异不显著。对实验组A、B进行培训之后, 再次利用单因素方差分析比较三个社区的“群体分”, 结果显示A、B、C三社区的群体分数不存在显著差异, F(2, 21) = 1.58, p > 0.05, η2 = 0.13。具体的描述统计结果见表7。为考察每个社区在群体决策质量自评问卷的前测和后测分数上是否存在差异, 以群体分为因变量进行配对样本t检验, 三个社区的检验结果稍有差异:实验组A接受培训之后群体分提高, 与前测群体分数的差异达到边缘显著, 且效应量达到中等水平, t(8) = 2.12, p = 0.07, d = 0.68; 实验组B虽然接受了培训, 但是前后测分数差异不显著, t(6) = 0.27, p > 0.05, d = 0.47; 控制组C没有参加培训, 前后测分数不存在显著差异, t(7) = 0.54, p > 0.05, d = 0.58。

综上所述, 社区居民群体决策研究得到两个主要结论:第一, 群体决策质量的录像他评法和问卷自评法均能够客观描述当前社区议事会的现状, 有效区分社区群体决策优劣。由于客观条件所限社区议事小组取样较小, 且对实验组的培训干预次数和总时长不足, 导致实验组B群体决策质量自评问卷的前测和后测差异未达到显著水平, 但录像他评法结果有力地支持了实验组A自评问卷后测成绩有所提高的结果。

第二, 议事规则的培训能够部分改善社区议事中存在的程序、方法上的问题。本研究中, 议事规则培训在A社区效果很明显, 而在B社区效果并不太突出, 这可能与议事规则培训内容的特定性和培训时长有关。议事规则的培训主要针对的是议事程序和形式上的问题(如举手发言、一次一人发言, 每人发言次数和机会平等等), A社区议事最主要的不足恰恰是此类议事程序和形式问题, 因此培训干预效果明显。而对于B社区长期形成的长官“一言堂”现象, 则不是简短培训就可改善的, 可能需要经过较长时期的系列培训, 才能改变社区干部根深蒂固的“权威”思维。本次社区议事规则培训仅开展了一次、30分钟, 不足以从根本上改善居民议事状况。未来长期、持续的培训和实践演练有可能全面改善和提升城市社区议事会的决策质量。

综上所述, 群体决策质量的问卷自评法和录像他评法能够全面、有效评估大学校园以及城市社区里一些真实问题的群体决策质量, 这也证明了群体决策质量评估的“过程-结果模型”的合理性。这套评估方法同样适用于其他更广阔的社会治理领域, 如社区治理、公共政策制定等。我国的社会心理服务体系建设强调社会治理要遵循心理规律, 做到在政策制定和实施过程中, 用心理学的理论和方法指导精细化的社会治理(傅小兰, 2017; 辛自强, 2018b)。我们的群体决策质量评估模型与方法能够通过测量决策过程中的信息加工水平、人际互动模式、决策成员的主观心理感受及决策方案质量, 在决策实施前了解决策讨论是否充分, 是否有重要信息遗漏, 决策是否保证了各利益方诉求的充分表达, 并提前预判最终方案的成熟度、创新度、实用性、可执行性和群众拥护度, 防止失误或是错误决策的实施, 减少决策失误造成的物质和人力资源浪费, 避免其对社会心态、社会稳定产生负面影响。

/


版权所有 © 《心理科学进展》编辑部
地址:北京市朝阳区林萃路16号院 
邮编:100101 
电话:010-64850861 
E-mail:jinzhan@psych.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发