摘要
本发明公开了基于异构映射网络和多层级特征增强的轻量化图像描述系统,包括如下步骤:采用编码器‑解码器的基础框架搭建该系统,采用训练成熟的多模态大模型CLIP和语言大模型GPT‑2分别作为系统的编码器和解码器。在编码器和解码器之间设置了并行的异构映射网络通道用以实现对图像特征进行更全面的特征提取和特征映射。将每个映射通道的映射输出利用交叉注意力机制同解码器连接构成第一层特征增强机制,将三个通道映射输出拼接后的综合输出同解码器连接构成第二层特征增强机制。利用所设计的轻量化框架、异构映射网络和多层级特征增强机制对实现过程进行总体设计,构成整体模型实现对图像的自动化描述。
技术关键词
交叉注意力机制
解码器
异构
网络
层级
轻量化框架
编码器
图像
通道
语句
模块
同义词
语义
文本
场景
词语
系统为您推荐了相关专利信息
轨迹预测方法
粒子
神经网络模型
节点特征
土木工程岩土
动态特征提取
智能问答方法
注意力机制
数据
网络
防碰撞方法
障碍物
卡尔曼滤波模型
高效编码器
激光雷达