|
基于大语言模型的自杀意念文本数据增强与识别技术
章彦博, 黄峰, 莫柳铃, 刘晓倩, 朱廷劭
2025, 57 (6):
987-1000.
doi: 10.3724/SP.J.1041.2025.0987
自杀已成为全球性公共卫生难题, 传统的自杀意念识别方法主要依赖患者主动求助, 而基于文本分析的自动识别模型则受限于标注数据的稀缺性。本研究创新性地提出一种基于大语言模型的数据增强方法, 旨在提升自杀意念文本识别的精度。研究采用双阶段设计:研究1聚焦于数据增强, 研究2验证增强效果。在研究1中, 选用ChatGLM3-6B和Qwen-7B-Chat作为底层模型, 结合有监督学习策略与零样本和少样本学习方法, 优化训练数据集质量。通过8组严谨的对比实验, 结果显示两类自研模型在数据增强方面表现卓越, 其处理后数据集的综合得分分别达到0.90和0.92, 显著优于基线模型(p < 0.001)。研究2进一步评估了数据增强对识别模型性能的影响, 结果表明, 增强后的模型在识别准确率和正确拒绝率指标上全面超越最佳基线模型(p < 0.001)。本研究不仅验证了基于大语言模型的数据增强方法在提升自杀意念识别模型性能方面的有效性, 还为心理健康领域的人工智能应用开辟了新方向。这种方法有望在保护用户隐私的同时, 提供及时、有效的自杀风险早期预警, 为自杀预防工作提供重要的技术支持和研究思路。未来研究可着眼于扩大数据异质性、优化提示工程设计、引入人机交互范式等, 进一步拓展该方法在促进临床心理诊断领域的应用。
参考文献 |
相关文章 |
计量指标
|