一种大语言模型的微调方法、装置、存储介质及电子设备
站点导航
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
AI需求对接
APP 下载
iOS 下载
安卓下载
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
清空
确定
AITNT
正文
推荐专利
一种大语言模型的微调方法、装置、存储介质及电子设备
申请号:
CN202510363817
申请日期:
2025-03-25
公开号:
CN120373401A
公开日期:
2025-07-25
类型:
发明专利
摘要
本说明书实施例公开了一种大语言模型的微调方法,将传统的强化学习阶段的微调训练改进为DPO训练,可将“如何选出奖励最大的响应”这种复杂的强化学习问题简化为“这个响应的奖励高还是低”这种相对简单的二分类问题,从而将大语言模型在强化学习阶段的训练复杂度降低,简化了大语言模型的微调训练,提升了微调训练的效率。
技术关键词
大语言模型
样本
微调方法
指令
生成用户
微调装置
处理器
电子设备
可读存储介质
模块
存储器
复杂度
阶段
计算机
程序
参数
沪ICP备2023015588号