基于视觉注意力增强的任务处理方法、装置、设备及介质

AITNT
正文
推荐专利
基于视觉注意力增强的任务处理方法、装置、设备及介质
申请号:CN202511060283
申请日期:2025-07-30
公开号:CN120953760A
公开日期:2025-11-14
类型:发明专利
摘要
本发明涉及人工智能技术领域,可应用于智能体自主决策、金融科技及医疗健康等业务场景中,公开了一种基于视觉注意力增强的任务处理方法、装置、设备及介质,包括:获取视觉、语言和动作数据预处理后生成多模态初始特征,提取视觉分层特征,双中央凹注意力模块处理高层视觉特征并融合,侧抑制网络得到增强视觉特征,跨模态融合模块以增强视觉特征为查询向量、语言分量和动作分量为键和值向量生成融合特征,融合特征输入决策网络生成目标类别与位置信息,基于与实际标签差异生成反馈信息,更新模块参数后完成目标任务。本发明通过结合仿生视觉机制和多模态注意力融合,提升视觉特征提取与背景抑制能力,可在复杂场景中提高目标捕捉效率与识别精度。
技术关键词
注意力 高层视觉特征 分支 跨模态 多模态 融合特征 模块 分层特征 数据 网络 局部结构特征 生成动作 层级 决策 文本 邻域特征 依赖特征 标签
系统为您推荐了相关专利信息
1
急性冠脉综合征早期预警方法及计算机可读存储介质
急性冠脉综合征 早期预警方法 多模态生理 生成特征向量 时序
2
一种孤独症谱系障碍的诊断处理方法及系统
孤独症谱系障碍 注意力 眼动特征 电信号 脑电特征提取
3
融合增强实体与多级表示的文档级关系抽取
节点 注意力 异质 关系抽取技术 邻居
4
一种基于思维链的大小模型协同目标检测与识别方法
识别方法 特征描述符 多模态 标签 坐标
5
一种高膨润土含量泥浆的地聚物固化性能增强改性方法
膨润土含量 改性助剂 改性方法 固化剂 光度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号