摘要
本发明公开了基于自我迭代的企业大模型训练系统及方法,属于人工智能技术领域,要解决的技术问题为:大模型在企业知识问答领域中面对非专业用户时表现不佳。包括:自我迭代数据集构建模块,基于目标领域语料和教师模型构建问答语料库,基于目标模型和教师模型进行问题的回答分析,通过回答分析的多次迭代构建自我迭代数据集;训练数据构建模块,基于预定的格式将自我迭代数据集构造为自我迭代训练数据集;模型训练模块,用于配置奖励策略,基于奖励策略和自我迭代训练数据集、通过GRPO训练方法训练模型。
技术关键词
问答语料库
模型训练系统
策略
教师
模型训练方法
模型训练模块
数据
企业
格式
人工智能技术
场景
系统为您推荐了相关专利信息
决策优化方法
大数据
滑动时间窗口
分布式训练系统
策略
工业互联网
仿真教学系统
学生
网络设备
仿真模型
系统优化调度方法
协同系统
电热
蒸汽蓄热器
优化调度策略