摘要
本发明公开了一种基于复数神经网络的多模态对话情感识别方法,涉及神经网络技术领域,该方法设计了基于复数神经网络的模型,多模态包括文本、视觉和听觉模态;模型包括:模态编码器,用于获得上下文感知的单模态表示,并映射到复数向量空间;多模态融合模块,用于基于线性融合函数聚合各模态得到融合的多模态表征;对话者建模模块,用于基于复数向量空间中相位的促进性或破坏性加法,在对话中显式学习和传播说话者感知的动态;情感分类器用于对对话者感知的情感状态进行预测。本发明在计算效率更高的同时提供具有竞争力的结果,能捕获ERC数据中的细微关系和依赖,可以高效地合并有价值的多模态信息,从而让模型对模态间潜在相关性能够更深入地理解。
技术关键词
情感识别方法
情感分类器
双向长短期记忆网络
多模态对话
情感状态建模
关系
听觉
编码器
单层感知机
神经网络技术
机制
语句
文本
视觉
情感类别
线性
模块
场景