摘要
本申请公开了基于多模态大模型的建筑物矢量多边形轮廓提取方法、装置、存储介质及电子设备。该方法包括:获取建筑物的遥感影像和文本指令;将所述遥感影像和所述文本指令输入到训练好的多模态大模型中,得到建筑物多边形角点坐标序列,连接角点形成建筑物矢量多边形轮廓;其中,所述多模态大模型是通过预测‑裁剪协同训练策略进行训练的。本申请能够满足复杂场景下的效率与鲁棒性要求,并提升了对小尺度建筑物的特征捕捉能力。
技术关键词
轮廓提取方法
建筑物
多边形
视觉特征
大语言模型
文本
轮廓提取装置
影像
多尺度特征提取
训练样本集
指令
多模态特征
对齐模块
坐标
编码器
序列
策略
注意力
系统为您推荐了相关专利信息
图像特征向量
视觉特征
训练特征
语法结构
视觉字典
图像内容特征
文字识别方法
网格
特征提取程序
特征提取装置
调度优化方法
平均等待时间
遗传算法
船舶载重
理解自然语言