摘要
本发明公开了一种基于大模型微调的知识问答方法、装置及存储介质,包括:(1)在大语言模型的原始参数旁边添加正交子空间,所述的正交子空间包括正交基、训练参数以及以正交基的逆;(2)进行两阶段训练;第一阶段,冻结训练参数,将正交子空间拟合到目标知识领域数据集的子空间;第二阶段,冻结正交基,在已拟合至目标知识领域数据集的子空间下对训练参数进行训练,以完成知识注入;(3)将目标知识领域的问题输入训练完的大语言模型,生成响应答案。利用本发明,可以解决在知识问答场景中,使用常规高效参数微调方法注入新领域知识时效果不佳的问题。
技术关键词
知识问答方法
参数
大语言模型
两阶段
问答场景
问答装置
微调方法
贪心算法
数据
答案
处理器
可读存储介质
基底
存储器
中间层
程序
计算机
策略
系统为您推荐了相关专利信息
语音
深度神经网络
背景噪声信息
降噪单元
多层感知器
变化检测方法
无人机航拍视频
城市建筑三维模型
无人航拍机
无人机倾斜摄影
关键运行参数
调压模块
故障诊断方法
语义图谱
时间关联向量