摘要
本发明提供了一种基于线性回归的大模型答案溯源方法,首先针对跟定问题利用检索增强方法引入外部知识作为上下文,拼接问题和上下文输入模型得到原始答案。其次对上下文断句,依概率对句子进行掩码,排除掩盖的句子形成新的上下文,利用后验概率计算新上下文情况下生成原始答案的概率;该过程重复多次,形成多个<掩码数组,概率>序对,生成训练数据。最后利用上一步生成的训练数据,训练线性回归模型以预测掩码后的段落生成原始答案的概率,该回归模型的权重矩阵作为上下文中句子重要性衡量指标,权重较大的句子作为答案的来源。经过以上3个步骤,实现了大模型生成答案的追根溯源,从而增强模型的可解释性,有利于用户评估答案的可靠性。
技术关键词
线性回归模型
大语言模型
溯源方法
文本
生成答案
bert模型
语义关键词
生成训练数据
矩阵
语义层面
后验概率
网络
参数
指标
分块
处理器
系统为您推荐了相关专利信息
智能测温系统
子模块
电缆终端
可见光图像
视频监测装置
长短期记忆神经网络
情感分类方法
多通道
文本
注意力机制
文本特征向量
分析位置信息
关键词
情感特征
数据监测技术
农产品溯源方法
区块链技术
物联网技术
加密算法
传感器节点