基于跨模态交互联合检测器的人物图像表情标记方法

AITNT
正文
推荐专利
基于跨模态交互联合检测器的人物图像表情标记方法
申请号:CN202411606615
申请日期:2024-11-12
公开号:CN119740065B
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了基于跨模态交互联合检测器的人物图像表情标记方法,包括以下步骤:获取包含人物的图像;提取图像的人物和相关背景知识,并应用文本分类器预测和标记正面情感或负面情感概率;捕捉对象和伴随文本之间的相互作用:通过提取物体和文本的空间坐标,计算相对距离作为注意力权重,建立基于注意力的多模态融合机制,整合多模态信息并将其输入检测机;计算文本的情感得分,并将该得分直接贡献给检测器;根据得分,对图像中人物的情感进行分类和标记。本申请生成对图像中人物情感的全面描述,以及特定领域的背景知识和详细信息;结合注意机制构建对象和文本的跨模态交互融合特征。
技术关键词
标记方法 检测器 跨模态 图像 融合特征 文本分类器 多模态信息 标签 执行对象检测 注意力机制 坐标 编码 检测机 多模态特征
系统为您推荐了相关专利信息
1
一种基于过零点实时频率追踪的低频减载方法及系统
深度生成对抗网络 滑动离散傅里叶变换 动态时间窗 低频减载方法 三维卷积神经网络
2
基于自动截图捕获和语义分割的电力检修图上查勘方法
查勘方法 图像识别算法 开源地图 混合编码器 多头注意力机制
3
一种基于属性的双分支行人重识别方法
识别方法 分支 身份 样本 行人重识别数据
4
一种无纺布及其印花方法
无纺布印花 气凝胶纤维 图像格式转换 超高分子量聚乙烯纤维 纳米银抗菌纤维
5
图像识别方法、诊断方法、系统及存储介质
图像识别方法 神经网络模型 实时图像 引入注意力机制 诊断方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号