一种知识蒸馏方法、装置、设备、介质及产品

正文

推荐专利

申请号：CN202510155440

申请日期：2025-02-12

公开号：CN119990257A

公开日期：2025-05-13

类型：发明专利

摘要

本申请公开了一种知识蒸馏方法、装置、设备、介质及产品，涉及人工智能技术领域，该方法包括：将第t次循环次数对应的当前迭代次数下的文本分别输入教师模型和学生模型，得到概率分布集合；根据概率分布集合计算前向KL散度以及反向KL散度的值得到损失函数值；若标记词为非结束标记符，则将标记词拼接到文本后面，然后进入第t次循环次数对应的下次迭代；否则根据损失函数值对学生模型的参数进行更新，然后令循环次数t加1并初始化下一循环次数对应的迭代次数，进入下次循环，直到训练数据集中的文本被抽取完毕，保存最后一次循环次数对应的学生模型的参数及学生模型的架构，本申请可提高学生模型的精度和泛化能力。

技术关键词

知识蒸馏方法学生文本教师中间层标记蒸馏装置参数更新模块超参数处理器人工智能技术计算机程序产品数据计算机设备可读存储介质存储器序列

系统为您推荐了相关专利信息

一种面向菌种开发的智能检索推理方法及系统

便携式文档格式标记语言文件文本段落交互模型推理方法

芯片评测报告的生成方法及装置、存储介质、电子设备

报告芯片生成方法唯一性数据

金刚石与金属膜层的高效界面结合方法

界面傅里叶变换红外光谱迭代优化算法金属材料中间层

一种基于互联网的校园安全管理系统和方法

校园安全监控学生移动轨迹数据视频特征数据管理系统

一种数据库敏感数据脱敏与回溯控制方法及系统

数据库敏感数据脱敏策略审计日志字段文本

一种知识蒸馏方法、装置、设备、介质及产品

站点导航

APP 下载