大语言模型的训练方法和信息处理方法

正文

推荐专利

大语言模型的训练方法和信息处理方法

申请号：CN202510143097

申请日期：2025-02-08

公开号：CN119990325A

公开日期：2025-05-13

类型：发明专利

摘要

本申请公开了一种大语言模型的训练方法和信息处理方法。涉及人工智能技术领域，其中，该方法包括：获取第一知识信息；将第一知识信息输入到大语言模型中，以使大语言模型学习第二知识信息，得到学习后的大语言模型；依据第二知识信息，构建训练样本集，其中，训练样本集至少包括多个知识样本，以及知识样本对应的第一答复信息和第二答复信息；通过训练样本集对学习后的大语言模型进行监督训练，得到目标大语言模型。本申请解决了相关技术中通过将相关知识输入到大语言模型中实现对大语言模型的训练，导致大语言模型答复准确性比较低的技术问题。

技术关键词

大语言模型训练样本集信息处理方法计算机程序产品信息处理装置可读存储介质人工智能技术云端服务器对象客户端训练装置处理单元处理器电子设备存储器

系统为您推荐了相关专利信息

音频处理方法、装置、设备、系统和计算机程序产品

井下设备音频监控平台通信组件故障分类模型

基于机理唯象模型多工况流场仿真求解方法及装置

唯象模型监测点工况样本数据

声学腔体结构、声学腔体结构的确定方法和装置

声学腔体结构计算机执行指令测试场景音频设备数据

面向模态缺失的多模态融合处理方法、电子设备、介质

模态特征业务预测模型融合特征通道注意力机制电子设备

施工文件的信息识别方法、装置及系统

图纸信息识别方法二维卷积神经网络计算机可执行指令工控机

大语言模型的训练方法和信息处理方法

站点导航

APP 下载