摘要
本发明公开一种基于梯度驱动的拒绝感知智能问答模型微调方法,包括:构建拒绝感知数据集,包括已知正确样本和未知需拒绝样本;构建二阶梯度引导的拒绝影响公式,利用梯度驱动进行样本选择,形成蒸馏数据集;给蒸馏数据集中每个样本分配一个权重,利用元学习优化置信度阈值和温度,进行自适应权重微调;完成对大模型部署与微调,输出新的模型权重。本发明解决了现有技术中难以平衡“减少幻觉”与“避免过度拒绝”的问题,实现准确、高效地回答各类问题,为智能问答的泛化能力提升提供有力支持。
技术关键词
问答模型
微调方法
样本
置信度阈值
蒸馏
非暂态计算机可读存储介质
数据
微调系统
处理器
计算机程序产品
答案
模块
存储器
电子设备
指标
参数
系统为您推荐了相关专利信息
状复合材料
有限元分析模型
空间可展开结构
调用代理模型
随机森林模型
强化学习模型
信息答复方法
模型训练方法
数据
可执行程序代码
风险评估方法
图像处理算法
多模态
集成学习方法
序列