摘要
本发明提出基于思维链提示和特征增强的多模态心理健康检测方法,利用大模型提示模块,通过思维链提示,深入挖掘图像与文本包含的情感倾向,症状表现以及潜藏隐喻等深层语义信息,从而提升了模型对用户表达中隐含内容的解析能力。此外,分别以文本与图像特征主导来融合通过大模型提示模块的得到的信息,既能确保单模态关键信息不被稀释,又能捕捉文本与图像间的隐性关联,从而有效整合不同模态的信息。本发明的方法在识别精度等方法优于当前多模态大模型,具有较高的准确率和鲁棒性,适用于早期心理干预、临床医疗辅助等多种场景,能够有效监测用户心理健康状态,为公共心理健康检测提供技术支撑,具有较好的应用前景。
技术关键词
心理健康检测
图像嵌入
心理健康状态
图像编码
文本编码器
多模态
语句
数据
饮食失调
样本
语义
分类器
鲁棒性
线性
量表
注意力
系统为您推荐了相关专利信息
实体对齐方法
融合多模态特征
多模态数据采集
矩阵
图谱
缺陷图像分割方法
视觉特征
前景文本
多层次
矩阵
融合图像特征
图文匹配方法
编码模块
模型训练方法
多模态特征融合