基于异构映射网络和多层级特征增强的轻量化图像描述系统

AITNT
正文
推荐专利
基于异构映射网络和多层级特征增强的轻量化图像描述系统
申请号:CN202411686076
申请日期:2024-11-24
公开号:CN119559640A
公开日期:2025-03-04
类型:发明专利
摘要
本发明公开了基于异构映射网络和多层级特征增强的轻量化图像描述系统,包括如下步骤:采用编码器‑解码器的基础框架搭建该系统,采用训练成熟的多模态大模型CLIP和语言大模型GPT‑2分别作为系统的编码器和解码器。在编码器和解码器之间设置了并行的异构映射网络通道用以实现对图像特征进行更全面的特征提取和特征映射。将每个映射通道的映射输出利用交叉注意力机制同解码器连接构成第一层特征增强机制,将三个通道映射输出拼接后的综合输出同解码器连接构成第二层特征增强机制。利用所设计的轻量化框架、异构映射网络和多层级特征增强机制对实现过程进行总体设计,构成整体模型实现对图像的自动化描述。
技术关键词
交叉注意力机制 解码器 异构 网络 层级 轻量化框架 编码器 图像 通道 语句 模块 同义词 语义 文本 场景 词语
系统为您推荐了相关专利信息
1
基于对称编码的粒子轨迹预测方法、设备、介质及产品
轨迹预测方法 粒子 神经网络模型 节点特征 土木工程岩土
2
智能问答方法和装置、电子设备及存储介质
动态特征提取 智能问答方法 注意力机制 数据 网络
3
无监督的视频通用时序边界检测方法、设备及存储介质
边界检测方法 时序 指数 视频 卷积神经网络提取
4
一种基于AC-DETR的工程车防碰撞方法及系统
防碰撞方法 障碍物 卡尔曼滤波模型 高效编码器 激光雷达
5
CTP图像生成模型构建方法、生成方法、装置、设备和介质
图像生成模型 图像生成方法 样本 标签 物理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号