近日,北京大学心理与认知科学学院甘怡群教授课题组在高影响力期刊Clinical Psychology Review(中科院心理学一区Top,IF = 12.2),发表题为AI-powered Methods for the Psychological Assessment of Adolescent Mental Disorders: A Systematic Review and Meta-analysis的系统性综述和元分析。

该研究是受期刊特邀投稿。2025年4月,Clinical Psychology Review 特刊 “Translational Psychological Treatment” 的三位联合主编——德国马尔堡大学Winfried Rief教授(临床心理学与心理治疗系主任,欧洲临床心理学杂志Clinical Psychology in Europe主编)、加拿大里贾纳大学Gordon Asmundson教授(焦虑与压力研究领域国际权威)以及德国马尔堡大学Stefan G. Hofmann教授(临床心理学与转化情感科学领域知名学者)——共同向甘怡群教授发出正式约稿邀请。甘怡群教授课题组于2025年10月完成稿件并提交,经严格同行评审后获得接收。Winfried Rief教授在审稿过程中对稿件给予高度评价。

人工智能驱动的心理评估凭借其处理多模态数据和实时评估方面的优势,正在变革传统的心理健康评估模式。目前,各类基于人工智能的心理评估方法不断涌现,但其预测性能与临床应用现状仍不明晰。青少年阶段神经可塑性强、心理健康问题发展迅速且变化多样,亟需更先进、更高效的评估与干预手段来促进心理健康发展。为此,本研究首次提出多模态评估框架(Multimodal Assessment Framework),将评估方法系统区分为九种不同模态(以其中两种模态为例,见图1),不仅明确了各模态的独特特征,更从转化心理学视角阐明了每种模态在心理健康评估中的作用。该框架有助于更清晰地界定资源投入和成本效益,从而为未来开发基于人工智能的临床决策系统提供证据支持。

本研究对188项采用人智能技术工评估青少年心理健康的研究进行系统回顾。在元分析过程中,文献筛选和数据提取环节均采用课题组提出的大语言模型—专家协作方法(LLM-human collaboration)。该方法在保障研究严谨性与准确性的同时,显著提升工作效率并节约了人力资源。元分析结果显示,在内部验证(即在用于模型开发的同一数据集内进行的测试)中,平均 AUC 值范围在 0.75 至 0.85 之间;而在外部验证(即在新的、独立的数据集上进行的测试)中,平均 AUC 值范围在 0.76 到 0.96 之间。这一结果表,现有模型具有良好的区分能力(以抑郁评估为例,见图2)。进一步的亚组分析发现,在抑郁与自杀风险评估任务重,多模态模型的AUC值均显著高于单模态模型(以抑郁为例,见图3),凸显了多模态整合在提升模型性能方面的优势。


图2 抑郁的元分析


图3 基于不同模态的元分析估计

人工智能在青少年心理健康评估领域展现出明确的应用潜力,有望为青少年心理健康的精准评估和个性化干预提供有力辅助。然而,其实际表现会因所用数据模态与所评估的具体心理健康问题而异。本研究发现可为未来开发基于人工智能的临床决策支持系统提供实证依据。需要强调的是,需将此类技术整合融入常规临床实践中,需要采用分阶段、并经过外部验证的临床转化路径,且其设计与真实临床工作流程紧密契合。此外,在系统开发过程中,需提高临床可解释性、部署效率、伦理治理水平以及文化适应能力,以确保心理健康技术资源的可及性与公平性,惠及每一位有需要的青少年。

北京大学博士后刘金梦(现为中央财经大学社会与心理学院助理教授)和博士后丁晓彤为本文共同第一作者,甘怡群教授为本文通讯作者。研究得到了国家重点研发计划、国家自然科学基金面上项目、国家自然科学基金青年项目和陈仲庚临床与咨询心理学发展基金的支持。

参考文献:Liu, J., Ding, X., & Gan, Y. (2026). AI-powered methods for psychological assessment in adolescence psychological disorders: A systematic review and meta-analysis. Clinical Psychology Review. Advance online publication. https://doi.org/10.1016/j.cpr.2026.102728

论文链接:https://www.sciencedirect.com/science/article/pii/S0272735826000371


2026-04-08