问答大模型训练及问答方法、装置、相关设备及程序产品

AITNT
正文
推荐专利
问答大模型训练及问答方法、装置、相关设备及程序产品
申请号:CN202510455031
申请日期:2025-04-11
公开号:CN120179789A
公开日期:2025-06-20
类型:发明专利
摘要
本申请公开了一种问答大模型训练及问答方法、装置、相关设备及程序产品,涉及人工智能技术领域。本申请采用强化学习方式对问答大模型进行训练,通过将问题样本送入问答大模型,得到其输出结果。确定其中答案的质量,并确定思维链的长度与设定思维链长度要求的匹配度,按照答案的质量及思维链长度的匹配度确定输出结果的奖励值,该奖励值与答案的质量、匹配度均成正相关关系,按照该输出结果的奖励值对问答大模型进行强化学习训练,增强问答大模型对输出的思维链长度的控制能力,同时,同时提升问答大模型输出的答案的质量。
技术关键词
答案 模型训练方法 问答方法 样本 模型训练装置 数据获取单元 数据处理单元 人工智能技术 计算机程序产品 处理器 关系 无监督 可读存储介质 存储器 电子设备 标签
系统为您推荐了相关专利信息
1
一种基于产教融合的大数据处理方法及系统
关键词 核心 数据处理方法 特征值 教学数据库
2
大模型能力多维评测方法和装置
评测方法 非暂态计算机可读存储介质 处理器 评测装置 人工智能技术
3
基于半监督学习的单阶段全卷积网络目标检测方法
全卷积网络 半监督学习 样本 金字塔结构 检测头
4
一种用于气象灾害预警用气象数据采集系统
气象数据采集系统 气象灾害预警 强对流 图像特征向量 天气
5
一种AI服务信息获取方法
服务信息获取方法 动态更新 核心 节点 跨模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号