大语言模型的训练方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411522546

申请日期：2024-10-29

公开号：CN119647586B

公开日期：2025-11-28

类型：发明专利

摘要

本发明提供一种大语言模型的训练方法、装置、电子设备及存储介质，涉及人工智能技术领域。其中，大语言模型的训练方法，包括：获取指令响应数据对；其中，指令响应数据对由指令和利用大语言模型根据指令生成的响应组成，响应包括预设领域的文本；从指令响应数据对包含的响应中，提取响应包含的约束信息；根据响应、响应包含的约束信息以及响应对应的指令，生成训练数据集；利用训练数据集，对预训练的大语言模型进行继续训练，得到目标大语言模型，以利用目标大语言模型根据指令，生成响应。本发明可以高效地训练得到可准确执行具有复杂约束的指令的大语言模型，进而有效提升计算资源的利用率。

技术关键词

大语言模型指令样本生成训练数据标签非暂态计算机可读存储介质生成提示词电子设备处理器人工智能技术计算机程序产品文本训练装置脚本模块存储器模板

系统为您推荐了相关专利信息

数据查询方法、装置、电子设备及存储介质

标签数据查询方法关系资产节点

一种血压计校准方法和系统

血压计校准方法校准血压计支持向量机回归网络非线性记录环境参数

报文传输方法、系统、网络设备及计算设备集群

设备组报文传输方法端口网络设备执行组网

一种基于随钻录井数据的储层价值解释方法及装置

数据收集单元随机森林模型录井解释技术智能模型异常数据处理

一种基于心冲击图的心脏功能异常检测系统、方法及介质

异常检测系统心脏冲击特征异常检测方法信号预处理模块

大语言模型的训练方法、装置、电子设备及存储介质

站点导航

APP 下载