摘要
本申请公开了一种大语言模型的训练方法和信息处理方法。涉及人工智能技术领域,其中,该方法包括:获取第一知识信息;将第一知识信息输入到大语言模型中,以使大语言模型学习第二知识信息,得到学习后的大语言模型;依据第二知识信息,构建训练样本集,其中,训练样本集至少包括多个知识样本,以及知识样本对应的第一答复信息和第二答复信息;通过训练样本集对学习后的大语言模型进行监督训练,得到目标大语言模型。本申请解决了相关技术中通过将相关知识输入到大语言模型中实现对大语言模型的训练,导致大语言模型答复准确性比较低的技术问题。
技术关键词
大语言模型
训练样本集
信息处理方法
计算机程序产品
信息处理装置
可读存储介质
人工智能技术
云端服务器
对象
客户端
训练装置
处理单元
处理器
电子设备
存储器
系统为您推荐了相关专利信息
声学腔体结构
计算机执行指令
测试场景
音频设备
数据
模态特征
业务预测模型
融合特征
通道注意力机制
电子设备
图纸
信息识别方法
二维卷积神经网络
计算机可执行指令
工控机