问答大模型训练及问答方法、装置、相关设备及程序产品

正文

推荐专利

申请号：CN202510455031

申请日期：2025-04-11

公开号：CN120179789A

公开日期：2025-06-20

类型：发明专利

摘要

本申请公开了一种问答大模型训练及问答方法、装置、相关设备及程序产品，涉及人工智能技术领域。本申请采用强化学习方式对问答大模型进行训练，通过将问题样本送入问答大模型，得到其输出结果。确定其中答案的质量，并确定思维链的长度与设定思维链长度要求的匹配度，按照答案的质量及思维链长度的匹配度确定输出结果的奖励值，该奖励值与答案的质量、匹配度均成正相关关系，按照该输出结果的奖励值对问答大模型进行强化学习训练，增强问答大模型对输出的思维链长度的控制能力，同时，同时提升问答大模型输出的答案的质量。

技术关键词

答案模型训练方法问答方法样本模型训练装置数据获取单元数据处理单元人工智能技术计算机程序产品处理器关系无监督可读存储介质存储器电子设备标签

系统为您推荐了相关专利信息

一种基于产教融合的大数据处理方法及系统

关键词核心数据处理方法特征值教学数据库

大模型能力多维评测方法和装置

评测方法非暂态计算机可读存储介质处理器评测装置人工智能技术

基于半监督学习的单阶段全卷积网络目标检测方法

全卷积网络半监督学习样本金字塔结构检测头

一种用于气象灾害预警用气象数据采集系统

气象数据采集系统气象灾害预警强对流图像特征向量天气

一种AI服务信息获取方法

服务信息获取方法动态更新核心节点跨模态

问答大模型训练及问答方法、装置、相关设备及程序产品

站点导航

APP 下载