问答大模型训练方法、问答方法、装置、设备及存储介质

AITNT
正文
推荐专利
问答大模型训练方法、问答方法、装置、设备及存储介质
申请号:CN202511001456
申请日期:2025-07-21
公开号:CN120893511A
公开日期:2025-11-04
类型:发明专利
摘要
本发明提供一种问答大模型训练方法、问答方法、装置、设备及存储介质,涉及人工智能技术领域,其中方法包括:获取待训练的问答大模型及问题样本集;所述问题样本集中包括多个难度等级的问题样本;对于所述问题样本集中的每个所述问题样本,获取所述问题样本的思维链集合;所述思维链集合中包括分别由多个推理大模型输出的思维链;根据所述问题样本的难度等级及所述思维链集合,对所述问答大模型进行强化学习训练,得到训练好的目标问答大模型。本发明实现增强训练稳定性及模型的探索能力。
技术关键词
模型训练方法 样本 问答方法 答案 模型训练模块 非暂态计算机可读存储介质 模型训练装置 正确率 人工智能技术 处理器 存储器 数值 电子设备 语义 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号