面向视觉语言模型的模型推理方法、装置、设备及介质

正文

推荐专利

申请号：CN202510535090

申请日期：2025-04-27

公开号：CN120046743B

公开日期：2025-07-18

类型：发明专利

摘要

本申请公开了面向视觉语言模型的模型推理方法、装置、设备及介质，涉及模型推理领域，包括：基于语义引导网络、初始视觉语言模型、视觉样本以及与文本描述确定初始单步问题集，并对初始单步问题集进行优化，得到目标单步问题集；利用目标单步问题集、预设语义扩展策略以及预设问题推理策略确定目标多步问题集；基于目标单步问题集、目标多步问题集以及所述初始视觉语言模型确定训练样本集和第一微调后模型；利用混合掩码策略对第一微调后模型进行微调，得到第二微调后模型；将第二微调后模型进行蒸馏，利用训练样本集对得到的蒸馏模型进行训练，以利用得到的目标视觉语言模型触发模型推理。因此，本申请能够提高视觉语言模型的模型推理能力。

技术关键词

视觉实体掩码策略推理方法文本逻辑递进关系语义蒸馏训练样本集跨模态推理装置学生微调单元网络模块解析单元教师

系统为您推荐了相关专利信息

基于深度学习的个性化商品推荐优化方法

兴趣个性化商品社交关系图谱飞蛾扑火算法商品推荐列表

客户信用评级报告的端到端生成方法及装置

指标大语言模型报告生成方法企业

一种用于机器人作业技能连续演化的智能体方法及系统

机器人作业关键帧语义特征语言知识库语言编码器

基于地面移动机器人的视觉惯性同时定位与建图导航方法

地面移动机器人关键帧导航方法机器人基坐标系相机

一种基于DNN降噪技术的智能面板控制方法

神经网络模型语音身份指令显示交互界面

面向视觉语言模型的模型推理方法、装置、设备及介质

站点导航

APP 下载