基于文本提示的视觉大模型缺陷识别方法及系统

AITNT
正文
推荐专利
基于文本提示的视觉大模型缺陷识别方法及系统
申请号:CN202510050085
申请日期:2025-01-13
公开号:CN119785118A
公开日期:2025-04-08
类型:发明专利
摘要
本发明提供基于文本提示的视觉大模型缺陷识别方法及系统,该系统包括:数据采集模块,通过无人机或其他设备采集建筑幕墙表面的高分辨率图像,并配以相关的文本描述;视觉特征提取模块,提取高层次语义特征;文本特征建模模块,将文本描述转化为嵌入向量;多模态融合模块,结合视觉特征和文本特征;缺陷分类模块,将融合后的特征输入到分类层中,输出每个潜在缺陷类别的概率分布;模型优化模块,提高泛化能力和检测准确性;结果输出模块,生成可视化图像和详细报告。本发明不仅解决了现有技术在检测效率、适用范围和识别精度方面的不足,还通过智能化手段提升了整个检测流程的安全性和便捷性,为现代建筑幕墙的维护提供了强有力的技术支持。
技术关键词
文本 建筑幕墙表面 缺陷识别方法 视觉特征提取 深度卷积神经网络 多头注意力机制 缺陷类别 数据采集模块 图像 缺陷识别系统 高层语义特征 多模态 监督学习方法 高层次 无人机
系统为您推荐了相关专利信息
1
基于检索增强生成和大语言模型的自动化测试方法及系统
自动化测试方法 自动化测试工具 大语言模型 自然语言 生成技术
2
关于音频信息混淆可逆对抗样本的隐私保护方法、装置
自动语音识别系统 对抗性 隐私保护方法 傅里叶变换函数 掩码矩阵
3
一种基于动态模板匹配的跨平台OCR识别方法
OCR识别方法 版图 平台 特征模板 布局特征
4
结合NPL和大模型的医学文本特征提取方法、系统及介质
病历文书 文本特征提取方法 医学 实体 关键词提取算法
5
基于语音激活的知识图谱数据智能问答方法及系统
自然语言文本 智能问答方法 知识图谱数据库 命名实体识别 电网设备运行数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号