模型蒸馏方法、会话方法、装置、电子设备和存储介质

AITNT
正文
推荐专利
模型蒸馏方法、会话方法、装置、电子设备和存储介质
申请号:CN202411834002
申请日期:2024-12-12
公开号:CN119808834A
公开日期:2025-04-11
类型:发明专利
摘要
本公开提供一种模型蒸馏方法、会话方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及知识蒸馏技术和大模型技术。方法包括:获取预训练的教师模型和新构建的学生模型;将训练样本输入教师模型和学生模型,根据教师模型中间特征层输出和学生模型中间特征层输出之间的损失,调整学生模型的参数,得到第一中间模型;将训练样本输入教师模型和第一中间模型,根据教师模型预测层输出和第一中间模型预测层输出之间的损失,以及第一中间模型预测层输出与样本标签之间的损失,调整第一中间模型的参数,得到用于执行目标任务的学生模型。通过将模型蒸馏过程分多阶段进行,避免学生模型因为参数少导致模型无法收敛,提高了模型蒸馏的效率。
技术关键词
教师 学生 文本识别模型 模型蒸馏方法 会话方法 参数 标签 知识蒸馏技术 关系 自然语言 图像处理 电子设备 处理器 人工智能技术 语音 计算机程序产品
系统为您推荐了相关专利信息
1
基于掩码生成式蒸馏与跨任务一致性的密集目标检测优化方法
检测优化方法 学生 教师 协方差矩阵 生成算法
2
一种基于储备池计算的敞开式TBM掘进机掘进参数预测方法
掘进参数 线性回归算法 矩阵 网络结构 隧道掘进机
3
用于题目解析的方法、电子设备及计算机可读存储介质
档位 大语言模型 策略 知识点 视频
4
一种基于多教师知识蒸馏的轻量化入侵检测方法
入侵检测方法 教师 蒸馏 工控网络流量 学生
5
一种基于人工智能的学校课程质量评估方法及系统
支持向量机模型 随机森林模型 学校 指标 学生
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号