基于跨模态交互联合检测器的人物图像表情标记方法

正文

推荐专利

申请号：CN202411606615

申请日期：2024-11-12

公开号：CN119740065B

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了基于跨模态交互联合检测器的人物图像表情标记方法，包括以下步骤：获取包含人物的图像；提取图像的人物和相关背景知识，并应用文本分类器预测和标记正面情感或负面情感概率；捕捉对象和伴随文本之间的相互作用：通过提取物体和文本的空间坐标，计算相对距离作为注意力权重，建立基于注意力的多模态融合机制，整合多模态信息并将其输入检测机；计算文本的情感得分，并将该得分直接贡献给检测器；根据得分，对图像中人物的情感进行分类和标记。本申请生成对图像中人物情感的全面描述，以及特定领域的背景知识和详细信息；结合注意机制构建对象和文本的跨模态交互融合特征。

技术关键词

标记方法检测器跨模态图像融合特征文本分类器多模态信息标签执行对象检测注意力机制坐标编码检测机多模态特征

系统为您推荐了相关专利信息

一种基于过零点实时频率追踪的低频减载方法及系统

深度生成对抗网络滑动离散傅里叶变换动态时间窗低频减载方法三维卷积神经网络

基于自动截图捕获和语义分割的电力检修图上查勘方法

查勘方法图像识别算法开源地图混合编码器多头注意力机制

一种基于属性的双分支行人重识别方法

识别方法分支身份样本行人重识别数据

一种无纺布及其印花方法

无纺布印花气凝胶纤维图像格式转换超高分子量聚乙烯纤维纳米银抗菌纤维

图像识别方法、诊断方法、系统及存储介质

图像识别方法神经网络模型实时图像引入注意力机制诊断方法

基于跨模态交互联合检测器的人物图像表情标记方法

站点导航

APP 下载