大语言模型的训练方法和信息处理方法

AITNT
正文
推荐专利
大语言模型的训练方法和信息处理方法
申请号:CN202510143097
申请日期:2025-02-08
公开号:CN119990325A
公开日期:2025-05-13
类型:发明专利
摘要
本申请公开了一种大语言模型的训练方法和信息处理方法。涉及人工智能技术领域,其中,该方法包括:获取第一知识信息;将第一知识信息输入到大语言模型中,以使大语言模型学习第二知识信息,得到学习后的大语言模型;依据第二知识信息,构建训练样本集,其中,训练样本集至少包括多个知识样本,以及知识样本对应的第一答复信息和第二答复信息;通过训练样本集对学习后的大语言模型进行监督训练,得到目标大语言模型。本申请解决了相关技术中通过将相关知识输入到大语言模型中实现对大语言模型的训练,导致大语言模型答复准确性比较低的技术问题。
技术关键词
大语言模型 训练样本集 信息处理方法 计算机程序产品 信息处理装置 可读存储介质 人工智能技术 云端服务器 对象 客户端 训练装置 处理单元 处理器 电子设备 存储器
系统为您推荐了相关专利信息
1
音频处理方法、装置、设备、系统和计算机程序产品
井下设备 音频 监控平台 通信组件 故障分类模型
2
基于机理唯象模型多工况流场仿真求解方法及装置
唯象模型 监测点 工况 样本 数据
3
声学腔体结构、声学腔体结构的确定方法和装置
声学腔体结构 计算机执行指令 测试场景 音频设备 数据
4
面向模态缺失的多模态融合处理方法、电子设备、介质
模态特征 业务预测模型 融合特征 通道注意力机制 电子设备
5
施工文件的信息识别方法、装置及系统
图纸 信息识别方法 二维卷积神经网络 计算机可执行指令 工控机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号