大语言模型的训练方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
大语言模型的训练方法、装置、电子设备及存储介质
申请号:CN202411522546
申请日期:2024-10-29
公开号:CN119647586B
公开日期:2025-11-28
类型:发明专利
摘要
本发明提供一种大语言模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域。其中,大语言模型的训练方法,包括:获取指令响应数据对;其中,指令响应数据对由指令和利用大语言模型根据指令生成的响应组成,响应包括预设领域的文本;从指令响应数据对包含的响应中,提取响应包含的约束信息;根据响应、响应包含的约束信息以及响应对应的指令,生成训练数据集;利用训练数据集,对预训练的大语言模型进行继续训练,得到目标大语言模型,以利用目标大语言模型根据指令,生成响应。本发明可以高效地训练得到可准确执行具有复杂约束的指令的大语言模型,进而有效提升计算资源的利用率。
技术关键词
大语言模型 指令 样本 生成训练数据 标签 非暂态计算机可读存储介质 生成提示词 电子设备 处理器 人工智能技术 计算机程序产品 文本 训练装置 脚本 模块 存储器 模板
系统为您推荐了相关专利信息
1
数据查询方法、装置、电子设备及存储介质
标签 数据查询方法 关系 资产 节点
2
一种血压计校准方法和系统
血压计校准方法 校准血压计 支持向量机回归网络 非线性 记录环境参数
3
报文传输方法、系统、网络设备及计算设备集群
设备组 报文传输方法 端口 网络设备执行 组网
4
一种基于随钻录井数据的储层价值解释方法及装置
数据收集单元 随机森林模型 录井解释技术 智能模型 异常数据处理
5
一种基于心冲击图的心脏功能异常检测系统、方法及介质
异常检测系统 心脏 冲击特征 异常检测方法 信号预处理模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号