摘要
本发明涉及一种文档问答方法、装置、电子设备及计算机存储介质,该方法包括:基于预设片段长度,对每个样本文档进行对齐处理,得到多个样本片段;对任意两个样本片段进行语义相关度标注得到第一标注数据,根据第一标注数据对文档检索模型进行微调得到目标文档检索模型;基于多个样本片段和语义相关度确定第二标注数据,根据第二标注数据对语义排序模型进行微调得到目标语义排序模型,基于多个问题和每个问题对应的至少一个样本片段,构成第四标注数据,基于第四标注数据对基础大模型进行微调得到生成式大模型,基于微调后的三个模型确定待处理问题对应的目标答案。本发明的方法在根本上解决通用大模型问答在铁路领域数据集上经常出现的问题。
技术关键词
语义相关度
排序模型
样本
数据
问答方法
答案
计算机存储介质
铁路
电子设备
可读存储介质
问答装置
基础
处理器
模块
格式
存储器
指令
关系
系统为您推荐了相关专利信息
挖掘控制方法
高风险
反演模型
挖掘控制系统
偏差
神经网络控制器
智慧调度系统
制冷设备
车内外温度传感器
运输车辆
行车引导方法
干涉合成孔径雷达
行车引导装置
终点
极限学习机
智能物联网传感器
水质检测数据
队列模型
云服务器
水质预测方法
RGB摄像头
交互系统
红外摄像头
模式切换模块
窄带红外滤光片