摘要
一种基于上下文感知和跨模态共享注意力的对话情感识别方法,采集不同对话场景下的蕴含上下文的文本以及音频信息形成数据集,完成数据集的构建;对构建的数据集进行预处理,以提取相应的模态特征;分别搭建一个音频上下文感知网络、一个跨模态共享注意力网络及一个自适应融合网络,再将所搭建的网络依次连接形成初始情感识别模型;对初始情感识别模型进行端到端的训练,对训练好的情感分类模型进行保存,形成情感识别模型;采用特征编码器对所采集到的文本及音频数据进行特征提取,得到文本及音频特征;将文本及音频特征输入至情感识别模型中,利用情感识别模型识别并输出预定义的情况类别。该方法能有效解决空间异质性问题,具备优异的识别效果。
技术关键词
情感分类模型
情感识别模型
情感识别方法
残差结构
上下文感知网络
注意力
文本
情感类别
跨模态
音频特征数据
模态特征
编码器
上下文特征
超参数
场景
采样模块
系统为您推荐了相关专利信息
人脸情绪识别模型
补偿方法
多模态
发言者
情感识别模型
建筑物提取方法
融合注意力机制
邻域
局部特征信息
局部特征提取
情绪分析方法
面部特征点
文本情感分类模型
强度
标签
害虫检测方法
诱虫灯设备
网络摄像头
害虫图像
通道注意力机制