摘要
本发明属于人工智能技术领域,尤其是指一种面向服务型机器人的多模态情感识别方法及系统,所述方法包括:采集用户情绪变化的音视频流数据,分离出视觉与语音数据;通过预训练模型提取视觉、语音情感特征,计算各模态预测概率分布;基于该分布构建双模态置信度量化模型,得到各模态置信度;采用分段式动态权重分配策略融合特征,进而识别用户情感状态。本发明融合视觉与语音模态,结合动态时间规整实现特征对齐,通过置信度模型、动态权重策略及跨模态时序协同模块、共享表示空间优化性能,在复杂环境下具备高识别准确率、强鲁棒性及实时处理能力,适用于多种服务场景。
技术关键词
情感特征
情感识别方法
服务型机器人
动态权重分配
语音分类模型
动态时间规整技术
双模态
图像分类模型
融合特征
计算机软件产品
模态特征
数据
音频特征
跨模态
视觉特征
计算机存储介质
置信度阈值
情感状态识别
系统为您推荐了相关专利信息
情感识别方法
深度编码
语音特征
多头注意力机制
情感特征
情感识别模型
情感特征
生成作品
脑电采集设备
迁移学习技术
隧道突涌水
风险预测方法
掘进机
刀盘扭矩
模型库
汽车LED照明
发光二极管
电耦合
数据采集模块
微控制器
调制信号识别方法
加权损失函数
特征提取网络
深度强化学习
注意力机制