一种面向机器人的串行式多模态情绪识别方法

正文

推荐专利

申请号：CN202510452440

申请日期：2025-04-11

公开号：CN120030498B

公开日期：2025-08-08

类型：发明专利

摘要

本发明涉及人工智能技术领域，具体指一种面向机器人的串行式多模态情绪识别方法，包括：获取音频数据序列和图像数据序列；将音频指令文本和音频数据序列，输入训练好的音频多模态模型，输出音频反馈文本；将音频反馈文本和图像数据序列进行时间戳对齐后，输入训练好的图像多模态模型，输出情绪识别结果和图像反馈文本；在模型训练过程中，预训练阶段对初始音频和图像多模态模型分别进行训练，协同训练阶段基于跨模态双向反馈机制，对预训练后的音频多模态模型和图像多模态模型进行训练，目标训练阶段动态调整正向反馈和反向反馈损失对应权重，对协同训练后的音频多模态模型和图像多模态模型进行训练。本发明提升了情绪识别的处理效率和识别精度。

技术关键词

图像多模态情绪识别方法训练集序列机器人文本特征向量情绪识别系统模块通信音频处理单元基频轮廓教师跨模态矩阵数据采集模块表达式

系统为您推荐了相关专利信息

一种从放疗定位CT图像中去除金属伪影的方法

去噪模型身体数据收集模块切片伪影

一种基于多普勒谱的海面弱目标检测方法

多普勒海杂波回波检测器构建训练集

一种三合一过胶塑封机的多模态温控方法与系统

温控方法模糊控制规则数据塑封机光照补偿算法

一种多模式山洪灾害现地预警阈值动态划定方法及系统

山洪灾害分布式水文模型情景划定方法栅格

PPS高强耐温复合材料及其制备与在人形机器人中的应用

复合材料钛酸钾晶须人形机器人高强连续玻璃纤维

一种面向机器人的串行式多模态情绪识别方法

站点导航

APP 下载