一种基于BERT和自监督学习的小样本城市场景图像分析方法

正文

推荐专利

申请号：CN202510233699

申请日期：2025-02-28

公开号：CN120145112A

公开日期：2025-06-13

类型：发明专利

摘要

本发明属于计算机视觉和自然语言处理技术领域，公开了一种基于BERT和自监督学习的小样本城市场景图像分析方法。通过结合自监督学习充分挖掘无标注城市环境图像数据的潜在信息，同时利用跨模态语义增强机制，整合城市环境图像与描述文本的多模态特征，实现对小样本城市环境图像的精准诊断。本发明不仅提升了模型在小样本场景下的泛化能力，还显著改善了现有方法在复杂分析场景中的诊断效率和准确性，克服了现有技术中对数据依赖性强、对硬件资源要求高以及跨模态信息利用不足的缺陷。

技术关键词

图像分析方法跨模态融合特征监督学习框架文本场景样本注意力机制图像特征提取 BERT模型编码器数据整体空间结构初始化解码器双线性插值算法拼图语义参数

系统为您推荐了相关专利信息

一种用于数据处理的人工智能系统

动态位置编码人工智能系统量子态注意力深度学习模型

一种模块化医疗智能体构建方法和系统

体构建方法文本排序模型智能医疗辅助大语言模型

一种基于大语言模型的异常检测方法及装置

文本异常检测方法大语言模型训练集神经网络模型

一种分布式光伏集群发电功率预测方法及系统

分布式光伏集群发电功率预测方法分布式光伏发电序列图像

一种基于多编码器生成对抗学习的半监督文本分类方法及系统

生成对抗学习监督文本分类无标签样本编码器结构数据

一种基于BERT和自监督学习的小样本城市场景图像分析方法

站点导航

APP 下载