视觉问答的处理方法、装置、介质和系统

AITNT
正文
推荐专利
视觉问答的处理方法、装置、介质和系统
申请号:CN202411374807
申请日期:2024-09-29
公开号:CN119358608A
公开日期:2025-01-24
类型:发明专利
摘要
本申请提供了一种视觉问答的处理方法、装置、介质和系统。该方法通过采用神经网络模型,对第一CLIP模型的配置信息和参数进行蒸馏处理,得到蒸馏参数;采用蒸馏参数训练第二CLIP模型,得到训练后的第二CLIP模型;采用第一CLIP模型和训练后的第二CLIP模型优化神经网络模型的输出,得到最优蒸馏参数,并采用最优蒸馏参数优化训练后的第二CLIP模型,得到最优第二CLIP模型。降低了推理时的延迟,提高了视觉问答任务的处理速度,即解决了现有方案的对视觉问答任务进行处理的网络结构较为复杂,从而导致处理速度较慢的问题。
技术关键词
蒸馏 参数 优化神经网络模型 视觉 可读存储介质 处理单元 分词 文本 程序 计算机 网络结构 图像 存储器 处理器 格式
系统为您推荐了相关专利信息
1
跨网络通信服务控制方法、系统及通信服务器
网络通信服务 电路交换回退机制 智能模型 服务质量类别标识符 通信服务器
2
基于图像匹配的视觉放样方法及GNSS组合导航系统
组合导航系统 放样方法 图像匹配 位置姿态数据 三维点云数据
3
基于水下图像的海洋结构物表面腐蚀区域检测方法及系统
海洋结构物表面 缩放参数 区域检测方法 颜色 区域检测系统
4
一种针对阵发性房颤的预测方法、系统、介质及设备
逻辑回归模型 动态心电图 编码器 样本 房颤
5
基于多模态数据融合的呼吸节律推荐方法及相关装置
多模态数据融合 心率 推荐方法 功率值 策略梯度强化学习
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号