一种基于视觉语言交互式学习的AI图像检测模型优化方法

正文

推荐专利

申请号：CN202510580178

申请日期：2025-05-07

公开号：CN120088263B

公开日期：2025-08-15

类型：发明专利

摘要

本发明提供了一种基于视觉语言交互式学习的AI图像检测模型优化方法，涉及视觉语言处理技术领域。所述模型优化方法包括：提取图像训练集的视觉特征和文本特征，基于文本特征对视觉特征进行加权处理获得重建文本，基于视觉特征对文本特征进行加权处理获得重建图像，基于均方误差损失优化跨模态交互式重建过程的重建文本和重建图像；获取跨模态交互式重建过程中的视觉特征及文本特征，计算粗粒度代理点特征和细粒度代理点特征并构建四个字典，基于余弦相似性损失函数拉近模态之间的空间分布，并基于动量更新机制更新所述四个字典，获得优化后的AI图像检测模型。本发明通过设计跨模态交互式重建与字典学习更新，提升了模型检测AI图像的准确率。

技术关键词

视觉特征图像检测模型交互式学习交叉注意力机制图像解码器跨模态图像字典细粒度特征文本编码器图像编码器模型优化方法输出特征样本

系统为您推荐了相关专利信息

一种大语言模型辅助的跨模态医学数据哈希检索方法

哈希检索方法大语言模型汉明距离报告医学图像模态

多模态空气污染物的预测方法、装置、设备、介质及产品

监测站点数据深度学习网络模型多模态气象空气

车辆交互方法、服务器和计算机可读存储介质

车辆交互方法风险语音播报信息多模态车辆状态信息

一种面向复杂越野环境的无人车辆障碍感知方法及系统

车辆控制参数全局路径规划深度网络模型非标准立体视觉系统

一种基于AI的儿童故事绘本生成方法及系统

儿童故事文本段落生成方法语义向量纹理

一种基于视觉语言交互式学习的AI图像检测模型优化方法

站点导航

APP 下载