一种融合多样态图像特征的待检测图像识别方法及系统

正文

推荐专利

申请号：CN202511193406

申请日期：2025-08-25

公开号：CN121010826A

公开日期：2025-11-25

类型：发明专利

摘要

本发明提出一种融合多样态图像特征的待检测图像识别方法及系统，属于深度学习领域和计算机视觉领域，包括：S1：提取待检测图像的文本数据和图像特征，将输入提示词引导大语言模型，获取并融合描述含义的文字和图像特征的提示词，得到的图像文本描述；将输入文本编码器，得到特征向量；S2：将经过分片操作和线性排列投影，得到一维嵌入向量，将输入图像编码特征提取模块，获取图像纹理特征向量；S3：将和输入融合增强模块，进行特征融合增强，得到最终特征表示；S4：将输入到分类器中，确定是否为有害图像。本发明方法引入大语言模型，提高了有害图像的识别准确率。

技术关键词

图像识别方法图像纹理特征大语言模型特征提取模块文本编码器图像编码分类器深度神经网络分片非暂态计算机可读存储介质图像识别系统文本特征向量图像识别装置光学字符识别处理器线性

系统为您推荐了相关专利信息

一种交互智能体协作系统及其控制方法

协作系统多端口后端服务平台大语言模型模组

基于对比学习的视频片段检索方法、装置、设备及介质

视频片段检索方法文本预训练模型样本编码算法

一种基于深度学习的图像拼接算法

图像拼接数据图像拼接算法图像拼接系统特征提取网络紧凑特征

一种早产儿眼底辅助筛查管理方法及系统

早产儿管理方法文本特征提取模块图像特征提取

多指标融合的中文专利价值评估方法

XGBoost模型价值评估方法文本大语言模型价值评估系统

一种融合多样态图像特征的待检测图像识别方法及系统

站点导航

APP 下载