一种基于多模态融合的抑郁症识别方法、系统及存储介质

正文

推荐专利

申请号：CN202510660507

申请日期：2025-05-22

公开号：CN120182899A

公开日期：2025-06-20

类型：发明专利

摘要

本发明公开了一种基于多模态融合的抑郁症识别方法、系统及存储介质，包括：对获取的视频数据进行短时序时间窗口划分，将视频数据分割成多个短时序视频单元；采用图文对比预训练模型的图像编码器来处理每个短时序视频单元，并得到视频特征向量；通过大语言模型生成描述，使用图文对比预训练模型中的文本编码器提取语义信息，并得到文本特征向量；计算视频特征向量和文本特征向量之间的相关度，再进行视频特征向量和文本特征向量的融合，得到特征融合向量；采用双向长短时记忆网络对特征融合向量进行分类，输出识别结果。本发明有效增强了模型对视频和文本关联特征的关注度，提高了抑郁症识别的准确率。

技术关键词

视频特征向量文本特征向量预训练模型文本编码器图像编码器大语言模型多模态识别方法时序图文面部关键点抑郁点查找算法 K均值聚类算法识别系统数据注意力模型语义

系统为您推荐了相关专利信息

一种基于生成对抗网络的多模态知识图谱补全方法

知识图谱补全方法生成对抗网络模态特征三元组实体

基于提示学习的生成式对话状态跟踪方法

对话状态跟踪方法关系预训练语言模型编码器链接方法

基于大模型的推测解码方法、装置、设备以及存储介质

序列掩码矩阵注意力子模块多模态

一种自上而下采样的多尺度点云预训练方法、设备及介质

编码器解码器模型解码器架构近邻算法物体检测

飞行器识别方法、飞行器识别装置、电子设备及存储介质

飞行器识别方法深度学习网络模型迁移学习模型预处理飞行器计算机可读取存储介质

一种基于多模态融合的抑郁症识别方法、系统及存储介质

站点导航

APP 下载