基于多阶段知识蒸馏的自迭代训练方法及系统

正文

推荐专利

申请号：CN202510697883

申请日期：2025-05-28

公开号：CN120611790A

公开日期：2025-09-09

类型：发明专利

摘要

本发明属于人工智能技术领域，涉及一种基于多阶段知识蒸馏的自迭代训练方法及系统，所述方法包括：1)采用推理模型构建包含四元组结构的视觉推理数据集；2)将视觉推理数据集按索引顺序等分为多个互斥子数据集，分别用每一个子数据集对视觉语言模型进行监督微调和评价以获得监督微调最优模型；3)实施基于规则奖励的强化学习训练和评价以获得强化学习最优模型；4)对视觉推理数据集进行知识蒸馏和清洗，以获得清洗后的蒸馏数据集；5)重复执行步骤2)‑4)并进行评价，在达到收敛状态时停止迭代并将最后一轮迭代得到的强化学习最优模型作为全局最优模型。其在显著降低训练成本的同时有效提升了视觉语言模型的视觉推理能力。

技术关键词

视觉推理迭代训练方法蒸馏多阶段数据答案图像模块人工智能技术训练设备训练系统处理器索引格式可读存储介质程序基准指标存储器

系统为您推荐了相关专利信息

近距订单选择与实时配送响应方法及系统

订单动态交通数据动态路径优化模块分析单元

线性代数方程组的快速求解方法

矩阵方程梯度算法依序多项式

一种无感知数据动态迁移方法

数据迁移网络带宽资源数据动态迁移方法数据中心卡尔曼滤波算法

基于语义向量的领域知识图谱进化方法、装置、介质及设备

语义向量进化方法语义图谱知识图谱技术矩阵

融合多源数据的新能源车辆电池温度组合模型预测方法

新能源车辆电池模型预测方法融合多源数据新能源汽车电池长短记忆神经网络

基于多阶段知识蒸馏的自迭代训练方法及系统

站点导航

APP 下载