一种基于适配器的红外与可见光参数高效迁移学习方法

AITNT
正文
推荐专利
一种基于适配器的红外与可见光参数高效迁移学习方法
申请号:CN202510730087
申请日期:2025-06-03
公开号:CN120671767A
公开日期:2025-09-19
类型:发明专利
摘要
本发明属于计算机视觉技术领域,涉及一种基于适配器的红外与可见光参数高效迁移学习方法,包括:获取配对的红外图像和可见光图像并输入训练好的目标任务预测模型,得到预测结果;预测模型的训练过程包括:获取多组配对的红外图像xir和可见光图像xvis;将图像xir和xvis输入对应模态的嵌入层,得到红外特征令牌Zir和可见光特征令牌Zvis;将令牌Zir和Zvis输入外部模态提示适配器,得到外部模态提示PE;将提示PE和Zvis令牌输入插入适配器的可见光预训练视觉模型进行编码,得到编码特征;将编码特征输入目标任务解码器,得到预测结果;根据预测结果更新预测模型的参数,直到得到训练好的预测模型;本发明引入多个适配器将预训练视觉模型适配到多种红外与可见光下游任务,提高了模型的通用性和可扩展性。
技术关键词
适配器 迁移学习方法 编码特征 注意力 编码器 可见光图像 混合单元 令牌 前馈神经网络 融合特征 卷积模块 卷积特征 参数 解码器 模态特征 视觉 积层 双模态
系统为您推荐了相关专利信息
1
基于人工智能的新能源电力价格管理方法及系统
动态预测模型 价格管理方法 电力 卷积模块 扩展模块
2
基于一致性关系推理的遥感图像目标检测方法及系统
区域建议网络 关系 推理网络 交叉注意力机制 遥感图像数据
3
一种用于输煤廊道的巡检机器人系统及巡检方法
巡检机器人系统 输煤廊道 行走轨道 清扫组件 识别RFID标签
4
基于扩散图注意力网络的不对称药物相互作用预测方法
药物 深度神经网络 矩阵 节点特征 信息传播机制
5
一种基于多模态大模型的视频时空理解方法、装置及介质
多模态 文本 大语言模型 标记 视觉特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号