摘要
本申请提供了一种视觉问答的处理方法、装置、介质和系统。该方法通过采用神经网络模型,对第一CLIP模型的配置信息和参数进行蒸馏处理,得到蒸馏参数;采用蒸馏参数训练第二CLIP模型,得到训练后的第二CLIP模型;采用第一CLIP模型和训练后的第二CLIP模型优化神经网络模型的输出,得到最优蒸馏参数,并采用最优蒸馏参数优化训练后的第二CLIP模型,得到最优第二CLIP模型。降低了推理时的延迟,提高了视觉问答任务的处理速度,即解决了现有方案的对视觉问答任务进行处理的网络结构较为复杂,从而导致处理速度较慢的问题。
技术关键词
蒸馏
参数
优化神经网络模型
视觉
可读存储介质
处理单元
分词
文本
程序
计算机
网络结构
图像
存储器
处理器
格式
系统为您推荐了相关专利信息
网络通信服务
电路交换回退机制
智能模型
服务质量类别标识符
通信服务器
组合导航系统
放样方法
图像匹配
位置姿态数据
三维点云数据
海洋结构物表面
缩放参数
区域检测方法
颜色
区域检测系统
多模态数据融合
心率
推荐方法
功率值
策略梯度强化学习