一种基于复合视觉编码的遥感大模型性能提升方法和装置

AITNT
正文
推荐专利
一种基于复合视觉编码的遥感大模型性能提升方法和装置
申请号:CN202511512511
申请日期:2025-10-22
公开号:CN120997529B
公开日期:2025-12-26
类型:发明专利
摘要
本申请提供了一种基于复合视觉编码的遥感大模型性能提升方法和装置,涉及遥感图像大语言模型技术领域。该方法基于开源的视觉通用语言模型重新改写网络结构,加入用于提取局部细节和捕捉全局语义的复合视觉编码ConvToMe层,ConvToMe层通过ConvNeXt层提取局部细节,结合ToMe ViT层捕捉全局语义,得到性能提升的遥感大模型,通过复合的视觉编码达到同时保留全局语境和局部细节,提升鲁棒性的同时,提升模型精度的效果。
技术关键词
性能提升方法 遥感图像数据 局部细节特征 矩阵 多模态 文本特征向量 筛选系统 视觉特征 语义特征 跨模态 瓶颈结构 性能提升装置 模态特征 编码向量 令牌 坐标 图像块
系统为您推荐了相关专利信息
1
基于自适应分布式边缘计算和AI算法的智慧农业大棚控制系统
分布式边缘 智慧农业大棚 智能农业大棚 多模态数据融合 智能控制模块
2
基于偏振成像的去油烟图像获取方法、装置及电子设备
图像获取方法 偏振成像系统 字典 矩阵分解算法 电子设备
3
一种基于智能供需估值模拟的爆款概念产品创造应用系统及方法
识别模块 生成概念 组合模块 预测用户需求 元素
4
基于多时相土壤线一致性修正的土壤含水率反演方法和系统
反演方法 卫星影像数据 理论 反演模型 反射率数据
5
采购文件校验方法、装置、介质和产品
混合神经网络模型 知识点 文件校验方法 电子 分类规则
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号