面向人机交互基于大模型的多模态细粒度情感识别方法

正文

推荐专利

申请号：CN202510420762

申请日期：2025-04-06

公开号：CN120296668A

公开日期：2025-07-11

类型：发明专利

摘要

本发明提出的面向人机交互基于大模型的多模态细粒度情感识别方法，基于方面驱动的视觉‑文本对齐与融合网络(AVTAF)，通过注意配对交互模块(APIM)实现从粗粒度到细粒度的跨模态对齐，可精准捕捉机器人场景中的情感相关视觉特征(如面部表情、手势)，并抑制环境噪声；同时，增强依赖图注意力网络(RD‑GAT)通过整合外部情感知识(如SenticNet)，提升大模型对多模态情感语义的推理能力。这一技术为机器人情感交互的智能化升级与大模型的多模态理解提供了新范式，有望推动家庭服务机器人、医疗陪护助手、多模态内容生成等领域的突破性应用。

技术关键词

情感识别方法双线性视觉特征文本矩阵多头注意力机制面向人机交互网络图结构情感特征模态特征融合面部表情节点多模态特征提取模块家庭服务机器人解码器抑制环境噪声图像机器人场景

系统为您推荐了相关专利信息

基于知识图谱增强的医疗诊断方法及应用

多模态医疗诊断方法跨模态解码器模态特征

一种基于强化深度学习的电化学储能热滥用预警方法

电化学储能设备时序温度预测模型预警方法数据

基于人工智能的数码日历事件预测提醒方法及系统

预测提醒方法日历模式特征向量 BERT模型模式识别模型

基于概率分布的文本匹配方法、装置、设备及存储介质

专业知识库文本匹配方法语义特征文本匹配装置匹配设备

基于3D视觉系统的堆叠工件无序抓取方法及系统

工件点云抓取方法视觉系统机械臂基座手眼标定

面向人机交互基于大模型的多模态细粒度情感识别方法

站点导航

APP 下载