一种基于大模型微调的知识问答方法、装置及存储介质

AITNT
正文
推荐专利
一种基于大模型微调的知识问答方法、装置及存储介质
申请号:CN202510588607
申请日期:2025-05-08
公开号:CN120106230B
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种基于大模型微调的知识问答方法、装置及存储介质,包括:(1)在大语言模型的原始参数旁边添加正交子空间,所述的正交子空间包括正交基、训练参数以及以正交基的逆;(2)进行两阶段训练;第一阶段,冻结训练参数,将正交子空间拟合到目标知识领域数据集的子空间;第二阶段,冻结正交基,在已拟合至目标知识领域数据集的子空间下对训练参数进行训练,以完成知识注入;(3)将目标知识领域的问题输入训练完的大语言模型,生成响应答案。利用本发明,可以解决在知识问答场景中,使用常规高效参数微调方法注入新领域知识时效果不佳的问题。
技术关键词
知识问答方法 参数 大语言模型 两阶段 问答场景 问答装置 微调方法 贪心算法 数据 答案 处理器 可读存储介质 基底 存储器 中间层 程序 计算机 策略
系统为您推荐了相关专利信息
1
一种语音处理方法、装置及介质
语音 深度神经网络 背景噪声信息 降噪单元 多层感知器
2
路径纹理驱动的3D表面加工轨迹生成方法及其装置
轨迹生成方法 三角形面片 纹理 顶点 STL模型
3
基于无人机视频和三维模型的城市建筑变化检测方法
变化检测方法 无人机航拍视频 城市建筑三维模型 无人航拍机 无人机倾斜摄影
4
面向隐私对话数据的回复信任性预测方法
训练样本集 数值 参数 性预测方法 三元组
5
一种调压模块的故障诊断方法及系统
关键运行参数 调压模块 故障诊断方法 语义图谱 时间关联向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号