摘要
本申请提供了一种基于多模态情绪识别的人机交互方法、装置和业务系统,该方法包括:将多模态特征拼接为描述向量;根据描述向量确定注意力权重;基于注意力权重将描述向量与预设基础情绪融合为情绪分层向量;基于情绪分层向量、描述向量和实际情绪训练第一任务头,基于情绪分层向量、描述向量和实际状态训练第二任务头;将情绪分层向量和描述向量分别输入第一任务头和第二任务头得到对应识别结果;根据识别结果确定目标语言风格并根据目标语言风格生成目标输出语言。该方法解决了现有技术中在进行复杂情绪谱系分析时特征信息处理不当,导致情绪组成的识别和情绪异常的判定不准确,进而导致人机交互输出准确性不足,降低用户体验的问题。
技术关键词
音频特征
视觉特征
多模态情绪
分层
风格
人机交互方法
文本
数据
注意力机制
基础
业务系统
预训练语言模型
可读存储介质
人机交互装置
标签
样本
模态特征
残差网络
程序
系统为您推荐了相关专利信息
电子数据存证
验证方法
区块链智能合约
构建树结构
存证信息
性别鉴定方法
稻飞虱
SMOTE算法
形态学图像处理
高光谱成像技术