摘要
本公开提供一种语言模型的知识传递方法、知识推理方法及装置,所述知识传递方法包括:获取预训练好的第一语言模型和第二语言模型;从所述第一语言模型的模型参数中抽取与目标推理任务相关的第一参数;根据第二语言模型的模型参数,将第一参数对齐到第二语言模型的参数空间,得到第二参数;基于所述第二参数,调整所述第二语言模型的模型参数,得到调整后的第二语言模型。本公开可以解决跨规模语言模型之间的知识传递效率和准确性存在局限的问题,实现跨规模语言模型之间高效、准确的知识传递。
技术关键词
知识传递方法
知识推理方法
信息处理单元
参数
自然语言文本
计算机可执行指令
超网络
推理装置
传递装置
样本
处理器
电子设备
数据
可读存储介质
计算机程序产品
规模
系统为您推荐了相关专利信息
脚本
信息模块
命令
计算机程序指令
人机交互界面
动态调度优化方法
负荷预测模型
传感设备
大数据
特征加权融合
加密数据
高斯混合模型
安全装置
关键字
异常数据
多源遥感数据
能耗预测模型
高精度数字高程模型
作业智能
机载传感器