一种基于DINOv2和CLIP的建筑草图的多模态自动分类方法

AITNT
正文
推荐专利
一种基于DINOv2和CLIP的建筑草图的多模态自动分类方法
申请号:CN202411864554
申请日期:2024-12-18
公开号:CN119339405B
公开日期:2025-03-25
类型:发明专利
摘要
本发明涉及图像分类技术领域,具体涉及一种基于DINOv2和CLIP的建筑草图的多模态自动分类方法,收集建筑草图数据样本;对建筑草图数据样本进行数据增广,形成建筑草图的数据集;对建筑草图的数据集进行文本打标;对打标文本进行质量检查;利用获得的数据集,联合训练DINOv2提取的视觉特征与CLIP的文本嵌入特征,联合训练得到特征融合层;使用分类头对融合后的特征进行分类预测。实现高效自动化的底图分类,生图时无需依赖人工对底图进行分类,解决人工判断的准确性低、效率低、错误率高的问题,同时解决在样本不足条件下,自动化草图分类的准确性问题。
技术关键词
自动分类方法 建筑 文本 梯度下降优化算法 样本 嵌入特征 草图数据集 视觉特征 图像分类技术 图片 矩阵 微调机制 标签 注意力 依赖人工 参数 风格 错误率 格式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号