摘要
本发明涉及计算机视觉技术领域,尤其涉及一种基于公开大模型进行语义分割数据集标注的方法,通过使用Swin Transformer和BERT作为主干网络,有效地提取图像和文本的特征,并结合标注预测和图像分割技术,提高了标注的效率和准确性。
技术关键词
文本
多尺度特征融合
层级
语义
特征融合技术
引入注意力机制
图像分割技术
融合特征
计算机视觉技术
BERT模型
更新模型参数
图像特征提取
分辨率
特征金字塔
双线性插值
坐标
上采样
系统为您推荐了相关专利信息
体积识别方法
大语言模型
结构纹理图像
斑块
生成结构
票据识别方法
网格特征
多尺度特征提取
语义向量
图像
语义特征
知识库结构
分布式计算节点
切片技术
多层次