构建用于围棋对弈的大语言模型的方法、用于围棋对弈的计算设备、计算机可读存储介质和计算机程序产品

AITNT
正文
推荐专利
构建用于围棋对弈的大语言模型的方法、用于围棋对弈的计算设备、计算机可读存储介质和计算机程序产品
申请号:CN202511332136
申请日期:2025-09-18
公开号:CN120822623B
公开日期:2025-12-02
类型:发明专利
摘要
本发明涉及计算模型,公开了构建用于围棋对弈的大语言模型的方法、用于围棋对弈的计算设备、计算机可读存储介质和计算机程序产品。一种构建用于围棋对弈的大语言模型的方法,包括:S1:用第一训练输入对大语言模型基座进行监督微调,以获得初始大语言模型;S2:由初始大语言模型基于第二训练输入对围棋任务执行多次预测,以生成多个预测结果;S3:基于多个预测结果确定损失函数;以及S4:基于损失函数调整初始大语言模型的参数,以得到用于围棋对弈的大语言模型。根据本发明的方法克服了通用大语言模型对围棋任务的推理幻觉,通过基于专业围棋数据和奖励函数对大语言模型进行训练,提升了大语言模型预测下一步落子位置和对应胜率的能力。
技术关键词
大语言模型 计算机程序产品 专业 数据 执行围棋 可读存储介质 启发式规则 自然语言 格式化 分支 模板 处理器 基座 数学 参数 分段
系统为您推荐了相关专利信息
1
一种急救物资紧急调配的智能决策方法及系统
深度学习预测模型 模拟演练系统 智能评估系统 历史交通数据 应急响应速度
2
内容显示方法、设备、介质和程序产品
自定义内容 内容显示方法 模板 视频 图像
3
一种复杂气象环境下光伏发电功率预测系统
光伏电站数据采集 数据采集单元 分析单元 光伏发电功率 数据传输模块
4
张量拆分结果验证方法、装置、计算机设备和存储介质
深度学习模型 验证方法 格式 计算机设备 层级
5
一种土木建筑造价数据分析系统
数据分析系统 工程量清单 控制策略 项目 子模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号