一种结合多层次知识蒸馏的查重小语言模型训练方法

AITNT
正文
推荐专利
一种结合多层次知识蒸馏的查重小语言模型训练方法
申请号:CN202510705315
申请日期:2025-05-28
公开号:CN120562402A
公开日期:2025-08-29
类型:发明专利
摘要
本发明实施例提供了一种结合多层次知识蒸馏的查重小语言模型训练方法,该方法包括:获取查重样本对,并根据查重样本对的文本特征,确定查重样本对的复杂度;根据查重样本对的复杂度,确定教师模型的蒸馏层级,以及,确定教师模型的每个蒸馏层级的加权系数;根据教师模型的每个网络蒸馏的加权系数、教师模型的每个蒸馏层级的第一输出结果,以及学生模型的每个蒸馏层级的第二输出结果,确定教师模型与学生模型之间的蒸馏损失;根据教师模型与学生模型之间的蒸馏损失,对学生模型的参数进行更新;重复上述步骤,直至更新后的学生模型满足预设条件,则将更新后的学生模型作为查重小语言模型,从而实现了低功耗、高精度的查重效果。
技术关键词
蒸馏 层级 教师 学生 语言模型训练方法 样本 复杂度 文本 多层次 语义 上存储计算机程序 网络 参数更新模块 模型训练装置 密度 可读存储介质 处理器 关系 输出模块
系统为您推荐了相关专利信息
1
一种考虑残差修正的日内光伏功率滚动预测方法
数值天气预报 深度神经网络训练 光伏电站功率 站点 时序特征
2
一种影像匹配方法、装置、设备及存储介质
层级 影像匹配方法 列表 可见光 关键点
3
基于超像素的自动编码器AEKAN的无监督多模态变化检测方法
变化检测方法 自动编码器 像素 多模态 异构
4
一种基于深度神经网络的笼养肉鸭翻覆识别算法
肉鸭 深度神经网络 识别算法 开发板 模型剪枝
5
一种基于大模型的冗余物料数据清洗系统
数据清洗系统 子模块 冗余 统一语义理解 蒙特卡洛树搜索
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号