摘要
本发明实施例提供了一种面向企业的文档问答模型训练方法和系统,其中,所述方法包括:获取通用监督微调数据、通用文档问答数据和企业内部数据;将所述通用监督微调数据、所述通用文档问答数据和所述企业内部数据按照预定比例进行混合得到训练数据;基于所述训练数据,按照统一的文档问答提示词模板对基础大语言模型进行监督微调训练得到文档问答模型。本发明实施例显著提高了文档问答模型的准确性、可控性和拒识能力,解决了现有RAG系统在企业应用场景中的不足,使其更加适用于企业级知识问答任务。
技术关键词
企业内部数据
问答模型训练方法
大语言模型
单轮
多轮对话
机器可读介质
格式
电子设备
生成答案
混合模块
数据获取模块
训练系统
企业级
模板
处理器
可读存储介质
基础
系统为您推荐了相关专利信息
大数据分析模型
企业内部数据
决策
风险分析方法
项目
地下电缆管道
模型训练方法
缺陷识别方法
样本
图像内容信息
舆情预警方法
情感分析模型
多模态舆情分析
关键词
风险
问答方法
思路
模式
非暂态计算机可读存储介质
大语言模型