摘要
本发明涉及计算模型,公开了构建用于围棋对弈的大语言模型的方法、用于围棋对弈的计算设备、计算机可读存储介质和计算机程序产品。一种构建用于围棋对弈的大语言模型的方法,包括:S1:用第一训练输入对大语言模型基座进行监督微调,以获得初始大语言模型;S2:由初始大语言模型基于第二训练输入对围棋任务执行多次预测,以生成多个预测结果;S3:基于多个预测结果确定损失函数;以及S4:基于损失函数调整初始大语言模型的参数,以得到用于围棋对弈的大语言模型。根据本发明的方法克服了通用大语言模型对围棋任务的推理幻觉,通过基于专业围棋数据和奖励函数对大语言模型进行训练,提升了大语言模型预测下一步落子位置和对应胜率的能力。
技术关键词
大语言模型
计算机程序产品
专业
数据
执行围棋
可读存储介质
启发式规则
自然语言
格式化
分支
模板
处理器
基座
数学
参数
分段
系统为您推荐了相关专利信息
深度学习预测模型
模拟演练系统
智能评估系统
历史交通数据
应急响应速度
光伏电站数据采集
数据采集单元
分析单元
光伏发电功率
数据传输模块