一种基于先验知识的大批量图像数据快速判读方法及系统

正文

推荐专利

申请号：CN202511029999

申请日期：2025-07-25

公开号：CN120932038A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种基于先验知识的大批量图像数据快速判读方法及系统，属于计算机视觉和生成式人工智能领域，包括：S1，构建任务场景数据集，并使用数据集训练CNN‑DE算法，得到检测目标类型和目标位置的模型；S2，使用步骤S1的训练集构建图文数据集，并使用该图文数据集训练微调LVLM模型；S3，基于步骤S1的数据集，结合图像并使用文本为图像打标签构建多模态对齐的数据集，使用该数据集微调CLIP，得到能够基于内容检索的辅助判读模型；S4，将三个模型整合成一个系统，调整系统的输入输出，构建人机交互界面，对接数据库。本发明提供了基于先验知识的多模型、多模态协同图像自动目标检测方案，具有工业应用价值和前景。

技术关键词

判读方法人机交互界面 DE算法图像数据图文训练集打标签多模态协同计算机设备判读系统场景指标标注工具计算机视觉模块文本框架超参数

系统为您推荐了相关专利信息

煤矿设备健康状态评估方法、装置及设备

煤矿设备时序特征健康状态评估方法多模态数据采集状态评估装置

一种基于智能优化算法的污废水处理控制系统和方法

废水处理控制系统动态预测模型智能优化算法水质设备运行状态

一种大型活动多阶段交通保障资源智能调度方法及系统

资源智能调度方法多阶段优化调度算法多智能体强化学习历史数据回归分析

前端大文件上传方法及装置

大文件上传方法分片双网络多路复用技术连续动作空间

一种基于点云描述符提取的车辆位置识别方法及系统

车辆位置识别方法激光点云数据预训练模型车辆位置识别系统关键帧

一种基于先验知识的大批量图像数据快速判读方法及系统

站点导航

APP 下载