摘要
本发明提出的面向人机交互基于大模型的多模态细粒度情感识别方法,基于方面驱动的视觉‑文本对齐与融合网络(AVTAF),通过注意配对交互模块(APIM)实现从粗粒度到细粒度的跨模态对齐,可精准捕捉机器人场景中的情感相关视觉特征(如面部表情、手势),并抑制环境噪声;同时,增强依赖图注意力网络(RD‑GAT)通过整合外部情感知识(如SenticNet),提升大模型对多模态情感语义的推理能力。这一技术为机器人情感交互的智能化升级与大模型的多模态理解提供了新范式,有望推动家庭服务机器人、医疗陪护助手、多模态内容生成等领域的突破性应用。
技术关键词
情感识别方法
双线性
视觉特征
文本
矩阵
多头注意力机制
面向人机交互
网络图结构
情感特征
模态特征
融合面部表情
节点
多模态
特征提取模块
家庭服务机器人
解码器
抑制环境噪声
图像
机器人场景
系统为您推荐了相关专利信息
电化学储能设备
时序
温度预测模型
预警方法
数据
预测提醒方法
日历
模式特征向量
BERT模型
模式识别模型
专业知识库
文本匹配方法
语义特征
文本匹配装置
匹配设备
工件点云
抓取方法
视觉系统
机械臂基座
手眼标定