摘要
本发明属于人工智能技术领域,尤其是指一种面向服务型机器人的多模态情感识别方法及系统,所述方法包括:采集用户情绪变化的音视频流数据,分离出视觉与语音数据;通过预训练模型提取视觉、语音情感特征,计算各模态预测概率分布;基于该分布构建双模态置信度量化模型,得到各模态置信度;采用分段式动态权重分配策略融合特征,进而识别用户情感状态。本发明融合视觉与语音模态,结合动态时间规整实现特征对齐,通过置信度模型、动态权重策略及跨模态时序协同模块、共享表示空间优化性能,在复杂环境下具备高识别准确率、强鲁棒性及实时处理能力,适用于多种服务场景。
技术关键词
情感特征
情感识别方法
服务型机器人
动态权重分配
语音分类模型
动态时间规整技术
双模态
图像分类模型
融合特征
计算机软件产品
模态特征
数据
音频特征
跨模态
视觉特征
计算机存储介质
置信度阈值
情感状态识别