摘要
本申请提供一种基于图文多模态的机动车照片合规性检测方法,其可以有效提高复杂场景下机动车照片合规性检测的准确率。其采用轻量化MobileCLIP模型融合图像视觉特征与检测规则的文本语义,实现同时对机动车照片中多项合规性内容的端到端检测。通过多模态特征融合与联合训练,解决了传统单模态方法语义理解不足的问题。
技术关键词
合规性检测方法
机动车
特征提取模块
照片
图文
图像特征向量
多模态特征融合
图像视觉特征
文本特征向量
输入模块
项目
数据
样本
语义
图片
系统为您推荐了相关专利信息
作业批改方法
作业批改系统
校准接口
参数
深度确定性策略梯度
X光胸片
组学特征
图像特征编码
智能分析方法
图像特征提取
图像内容特征
特征提取模型
计算机可读指令
图像采集设备
计算机设备