一种基于预训练的开放世界语义分割自动概念补全方法

正文

推荐专利

申请号：CN202411129267

申请日期：2024-08-16

公开号：CN119206205A

公开日期：2024-12-27

类型：发明专利

摘要

本发明公开了一种基于预训练的开放世界语义分割自动概念补全方法。包括：计算教师模型和学生模型的图像编码特征，通过图像特征蒸馏，将教师模型的知识传递到学生模型；使用预设视觉语言预训练模型，利用大规模图像‑文本数据生成的图像编码特征与教师模型生成的图像编码特征对比相似度，生成子标题，进行自动概念补全，得到补全后的标题；利用补全后标题的编码特征、子标题的编码特征与学生模型生成的图像编码特征对比损失来促进学生模型实现跨模态语义信息对齐；利用训练完成的学生模型对图像进行有效分割和识别。本发明通过图像特征蒸馏，确保图像特征和文本特征在同一语义空间中有效对齐。使用自动概念补全，确保文本标签的一致性和准确性。

技术关键词

补全方法预训练模型编码特征语义学生概念教师跨模态视觉文本编码器图像编码器蒸馏图像特征编码图像分割令牌多层感知器标签

系统为您推荐了相关专利信息

命令自然语言风险文件检测方法语义

图像块影像图像分割反射率电子设备

分割方法有向无环图文本策略自然语言

度计算方法解析句子分词条件随机场语义

电子控制模块功能测试用例功能自动化测试测试方法数据

一种基于预训练的开放世界语义分割自动概念补全方法

站点导航

APP 下载