构建用于围棋对弈的大语言模型的方法、用于围棋对弈的计算设备、计算机可读存储介质和计算机程序产品

正文

推荐专利

申请号：CN202511332136

申请日期：2025-09-18

公开号：CN120822623B

公开日期：2025-12-02

类型：发明专利

摘要

本发明涉及计算模型，公开了构建用于围棋对弈的大语言模型的方法、用于围棋对弈的计算设备、计算机可读存储介质和计算机程序产品。一种构建用于围棋对弈的大语言模型的方法，包括：S1：用第一训练输入对大语言模型基座进行监督微调，以获得初始大语言模型；S2：由初始大语言模型基于第二训练输入对围棋任务执行多次预测，以生成多个预测结果；S3：基于多个预测结果确定损失函数；以及S4：基于损失函数调整初始大语言模型的参数，以得到用于围棋对弈的大语言模型。根据本发明的方法克服了通用大语言模型对围棋任务的推理幻觉，通过基于专业围棋数据和奖励函数对大语言模型进行训练，提升了大语言模型预测下一步落子位置和对应胜率的能力。

技术关键词

大语言模型计算机程序产品专业数据执行围棋可读存储介质启发式规则自然语言格式化分支模板处理器基座数学参数分段

系统为您推荐了相关专利信息

一种急救物资紧急调配的智能决策方法及系统

深度学习预测模型模拟演练系统智能评估系统历史交通数据应急响应速度

内容显示方法、设备、介质和程序产品

自定义内容内容显示方法模板视频图像

一种复杂气象环境下光伏发电功率预测系统

光伏电站数据采集数据采集单元分析单元光伏发电功率数据传输模块

张量拆分结果验证方法、装置、计算机设备和存储介质

深度学习模型验证方法格式计算机设备层级

一种土木建筑造价数据分析系统

数据分析系统工程量清单控制策略项目子模块

构建用于围棋对弈的大语言模型的方法、用于围棋对弈的计算设备、计算机可读存储介质和计算机程序产品

站点导航

APP 下载