基于反事实数据增强和多视角思维链的大模型知识蒸馏方法

AITNT
正文
推荐专利
基于反事实数据增强和多视角思维链的大模型知识蒸馏方法
申请号:CN202411594814
申请日期:2024-11-10
公开号:CN119721182B
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了一种基于反事实数据增强和多视角思维链的大模型知识蒸馏方法。本发明首先利用主题词和语法分析树获取文本语义的关键特征,并用大语言模型自动的生成高质量反事实数据,然后利用多视角思维链增强反事实数据的多样性,提升小语言模型的推理能力。和现有技术相比,本发明提出的大模型反事实蒸馏框架能够增强小模型推理的鲁棒性和泛化能力,在不同架构的小语言模型和不同分布的数据集上都取得了优异的性能。
技术关键词
大语言模型 知识蒸馏方法 文本 答案 数据 多视角 语言模型训练方法 字符 标签 鲁棒性 指令 语义 框架
系统为您推荐了相关专利信息
1
一种高速艇高机动性自适应襟翼装置及其控制方法
襟翼装置 船体 机械锁定装置 线性执行器 集成角度传感器
2
滨海核电站海洋致灾生物时序预测方法、产品、介质及设备
时序预测模型 时序预测方法 海洋环境影响 海洋环境要素 核电站
3
一种融合噪声地图的噪声监测点位自动确定方法
三维噪声 监测点 网格 噪声地图 三维可视化场景
4
一种面向具身智能设备的视觉模型压缩方法
模型压缩方法 学生 智能设备 教师 随机梯度下降
5
一种面向船舶辐射噪声识别的听觉神经特征提取方法
船舶辐射噪声 脑电特征 特征提取方法 听觉 分段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号