• •
李昌锦, 焦丽颖, 陈圳, 许恒彬, 吴胜涛, 许燕
Li Chang-Jin, Jiao Liying, Chen Zhen, Xu Hengbin, Wu Shengtao Michael, Xu Yan
摘要: 随着人机共生时代的到来,大语言模型(LLMs)在广泛应用中暴露出的价值对齐缺失与算法偏见引发了严重的伦理担忧,引导人工智能技术向善发展成为紧迫挑战。本研究探讨了基于HEXACO人格模型的人格化对齐对LLMs道德判断的影响。研究1检验并证实了LLMs可以通过遵循提示词有效表达HEXACO人格特质。研究2探讨了人格化对齐对LLMs功利主义倾向的影响及其与人类的异同。结果表明,高诚实-谦恭、宜人性和尽责性的人格提示词显著减少了GPT-3.5、GPT-4和ERNIE 3.5做出功利主义选择的倾向。由此,本研究提出基于HEXACO人格模型和人格元特质理论的LLMs人格化对齐框架,强调稳定性元特质的诚实-谦恭、宜人性和尽责性等维度在LLMs人格化对齐中起到的核心作用。本研究为人工智能人格化对齐技术的理论构建与实践路径提供了心理学依据。