多模态模型的高效知识蒸馏方法与微模型生成方法及系统

AITNT
正文
推荐专利
多模态模型的高效知识蒸馏方法与微模型生成方法及系统
申请号:CN202510265897
申请日期:2025-03-07
公开号:CN119762943B
公开日期:2025-05-09
类型:发明专利
摘要
本发明属于计算机视觉领域与量化模型技术领域,具体涉及一种多模态模型的高效知识蒸馏方法与微模型生成方法及系统,包括:对原始图像数据进行标准化、编码、和融合处理得到特征图,输出小模型编码器下的深度特征;对不同类型的提示信息进行编码、拼接和再编码处理,得到提示特征;采用知识蒸馏优化后的小模型对提示特征进行候选区域预测,并对预测结果中的不准确区域动态采样生成新的提示特征,且与原有的提示特征结合,输出更新后的掩码解码器和提示特征组合;利用轻量级区域建议网络生成区域建议,并融合区域建议与提示特征,得到辅助信息;结合深度特征、提示特征组合、区域建议和辅助信息,进行掩码预测,生成目标对象所在区域的二值掩码。
技术关键词
知识蒸馏方法 模型生成方法 区域建议网络 原始图像数据 知识蒸馏优化 解码器 多模态 特征金字塔网络 矩阵 图像编码器 图像数据处理模块 分辨率 动态 信息处理模块 卷积技术 剪枝方法 可读存储介质
系统为您推荐了相关专利信息
1
水电站安全检测模型生成和安全检测方法、装置
SCADA系统 暂态模型 稳态模型 检测模型生成方法 数据
2
一种基于深度学习的视觉检测系统
图像获取单元 节点 神经网络模型 原始图像数据 训练数据量
3
热成型构件位姿监测预警方法
自动化监测控制 监测预警方法 热成型 图像采集单元 光源
4
一种自适应语义分割海底线性目标探测模型的构建方法
海底线缆 线性 灰度特征 特征点 纹理特征
5
三维模型生成方法、终端设备及计算机可读存储介质
三维模型生成方法 生成三维模型 随机噪声 可读存储介质 邻域
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号