基于特征增强的多模态任务决策方法及装置

AITNT
正文
推荐专利
基于特征增强的多模态任务决策方法及装置
申请号:CN202510532953
申请日期:2025-04-25
公开号:CN120635481A
公开日期:2025-09-12
类型:发明专利
摘要
本申请提供一种基于特征增强的多模态任务决策方法及装置,涉及计算机技术领域,该方法包括:计算多个图像帧中相邻图像帧之间的帧差信息;将多个图像帧输入到语义编码器中,得到语义特征,以及将帧差信息输入到运动编码器中,得到运动特征;将语义特征和运动特征输入到交叉注意力网络中得到增强后的语义特征和增强后的运动特征;将增强后的语义特征和运动特征输入到与目标任务相关的任务决策网络中,生成对应的决策信息。本申请提供的基于特征增强的多模态任务决策方法及装置,通过在训练阶段利用视觉语言模型提供的具备先验知识的知识感知特征引导视觉编码器关注与任务相关的对象,极大地提高了视觉编码器的特征提取能力。
技术关键词
语义特征 运动特征 感知特征 决策方法 运动编码器 图像 融合特征 注意力 样本 视觉 网络 特征提取能力 像素 特征提取模块 处理器 色彩值 键值
系统为您推荐了相关专利信息
1
一种基于定位场景自动切换NFC模拟卡的方法、设备及存储介质
轻量级神经网络 场景 模拟卡片 智能终端 门禁卡
2
一种基于视觉的焊接质量智能评估方法与系统
三维体素模型 智能评估方法 多模态成像设备 多尺度特征金字塔 动态资源调度
3
三维场景渲染方法、装置、设备和存储介质
三维场景渲染方法 视角 图像 出射光角度 参数
4
一种果蔬提取液色泽变化监测方法
变化监测方法 图像 果蔬 样本 图谱
5
一种基于跨模态正交解耦的零知识真伪语音检测方法、系统、电子设备及存储介质
声学特征 语音检测方法 语义特征 跨模态 计算机执行指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号