基于跨模态知识交互的无源域适应图像分类处理方法

正文

推荐专利

申请号：CN202511159737

申请日期：2025-08-19

公开号：CN121010823A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了基于跨模态知识交互的无源域适应图像分类处理方法，属于图像处理技术领域。该方法包括：构建源域图像数据集；在源域上构建可学习的提示词向量；构建目标域图像数据集；对训练集中的图像进行特征提取和维度压缩处理，生成特征类分库；计算每一张图像属于每个类别的第二概率，生成预测得分库；基于特征类分库和预测得分库生成混合预测库，根据混合预测库生成伪标签；由文本编码器和图像编码器构成教师模型，将神经网络模型作为学生模型，进行知识蒸馏，利用训练集对学生模型进行训练；利用训练后的学生模型对测试集中的图像进行分类处理。本发明显著减少了错误强化循环的风险，在目标域与源域差异较大时仍能保持高分类精度。

技术关键词

文本编码器图像编码器跨模态图像特征信息生成特征数据样本表达式神经网络模型学生风格标签图像生成模型压缩器参数热力图标记序列

系统为您推荐了相关专利信息

一种自动清渣控制方法及系统

控制策略监测点节点指标水质

轻量级物理约束时序信道模型确定方法、应用方法及装置

语义标签时序信道冲激响应多径参数物理

一种基于知识图谱子图匹配的大模型推理增强方法

图谱注意力大语言模型生成自然语言索引

时空特征增强的医疗视觉疾病网络构建方法

网络构建方法关键帧视觉多模态生成对抗网络

基于多模态大模型的地质灾害智能预警速报生成方法

地质灾害智能深度卷积神经网络模型长短期记忆网络地质灾害监测设备多模态

基于跨模态知识交互的无源域适应图像分类处理方法

站点导航

APP 下载