摘要
本申请公开了一种基于多模态大模型的对话情感识别方法及设备,涉及情感识别领域,该方法包括在当前场景中获取对话中的所有语句集合;每一语句中包括音频、视频和文本三个模态;构建对话情感识别模型;所述对话情感识别模型包括:特征提取层、双向门控单元、多模态大模型、BERT语言模型、模态信息互补模块、基于语义图的多层残差图卷积网络以及全连接层;根据对话中的所有语句集合,采用训练好的对话情感识别模型,得到情感识别结果。本申请能够提高对话情感识别的准确性与稳健性。
技术关键词
情感识别模型
情感识别方法
多模态
注意力
情感识别设备
多层感知机
语义
语句
长短期记忆网络
矩阵
发言人
互补特征
文本
线索
节点特征
音频
视频
编码
数据获取模块
系统为您推荐了相关专利信息
协同方法
故障图片
格式化
分布式计算平台
信号处理提取
CT重建方法
迭代算法
泊松噪声
代数重建算法
CT扫描数据
解码器
图像分割方法
编码器构造
高层次
融合特征