一种基于大模型微调的知识问答方法、装置及存储介质

正文

推荐专利

申请号：CN202510588607

申请日期：2025-05-08

公开号：CN120106230B

公开日期：2025-09-05

类型：发明专利

摘要

本发明公开了一种基于大模型微调的知识问答方法、装置及存储介质，包括：（1）在大语言模型的原始参数旁边添加正交子空间，所述的正交子空间包括正交基、训练参数以及以正交基的逆；（2）进行两阶段训练；第一阶段，冻结训练参数，将正交子空间拟合到目标知识领域数据集的子空间；第二阶段，冻结正交基，在已拟合至目标知识领域数据集的子空间下对训练参数进行训练，以完成知识注入；（3）将目标知识领域的问题输入训练完的大语言模型，生成响应答案。利用本发明，可以解决在知识问答场景中，使用常规高效参数微调方法注入新领域知识时效果不佳的问题。

技术关键词

知识问答方法参数大语言模型两阶段问答场景问答装置微调方法贪心算法数据答案处理器可读存储介质基底存储器中间层程序计算机策略

系统为您推荐了相关专利信息

一种语音处理方法、装置及介质

语音深度神经网络背景噪声信息降噪单元多层感知器

路径纹理驱动的3D表面加工轨迹生成方法及其装置

轨迹生成方法三角形面片纹理顶点 STL模型

基于无人机视频和三维模型的城市建筑变化检测方法

变化检测方法无人机航拍视频城市建筑三维模型无人航拍机无人机倾斜摄影

面向隐私对话数据的回复信任性预测方法

训练样本集数值参数性预测方法三元组

一种调压模块的故障诊断方法及系统

关键运行参数调压模块故障诊断方法语义图谱时间关联向量

一种基于大模型微调的知识问答方法、装置及存储介质

站点导航

APP 下载