多模态图像文本多标签分类方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202411978394

申请日期：2024-12-30

公开号：CN119762892A

公开日期：2025-04-04

类型：发明专利

摘要

本发明提供了多模态图像文本多标签分类方法、系统、设备及存储介质，该方法包括：构建多模态多标签二分类模型，进行权重合并推理优化；基于笔记数据库进行数据标注，生成高质量数据集；将高质量数据集输入多模态多标签二分类模型中的图文基座模型以提取特征，获得文本信息增强特征和图像信息增强特征；基于文本信息增强特征和图像信息增强特征获得增强后的图像文本特征；基于增强后的图像文本特征对图像进行多标签分类。本发明能够更好地理解图像和文本之间的关系，从而提升模型对图文信息联合表示的能力，增强了模型在多模态任务中的性能，提升多标签分类的整体效能。

技术关键词

多标签分类方法二分类模型多模态文本图像多标签分类系统数据图文兴趣点分类设备整体效能处理器线性爬虫基座模块可读存储介质键值程序

系统为您推荐了相关专利信息

一种图像对齐方法、装置、设备及存储介质

图像对齐方法 NCC算法空间变换关系计算机可执行指令 RANSAC算法

一种基于时空谱信息协同的遥感影像重建方法

影像重建方法空间预测器遥感影像数据亮度指标

一种应用服务推送方法、装置、设备及介质

屏幕压力感应习惯应用服务推送方法文本非易失性计算机存储介质

一种专病库生产方法、系统、设备及存储介质

训练文本数据病历计算机程序指令样本数据存储

一种杆塔的智能检测方法及卫星图像处理系统

杆塔信息智能检测方法杆塔图像校正图像处理系统

多模态图像文本多标签分类方法、系统、设备及存储介质

站点导航

APP 下载