大语言模型的训练方法、文本查询方法及其装置

正文

推荐专利

申请号：CN202510112818

申请日期：2025-01-23

公开号：CN120045666A

公开日期：2025-05-27

类型：发明专利

摘要

本公开提供了一种大语言模型的训练方法、文本查询方法及其装置，涉及人工智能领域，尤其涉及深度学习、自然语言处理、大模型领域。具体实现方案为：确定样本查询文本，以及，从预设的索引池中匹配得到与样本查询文本相关的至少一个提示样本集合，其中，索引池包括多个候选样本集合，候选样本集合中包括正样本和负样本；将提示样本集合和样本查询文本共同输入待训练的大语言模型，得到样本回答文本；获取样本回答文本的准确性相关参数，并根据准确性相关参数对索引池进行更新；基于更新后的索引池对大语言模型进行增量训练，得到训练后的目标大语言模型。

技术关键词

样本大语言模型索引文本查询方法匹配模块参数查询装置标签计算机程序产品算法训练装置处理器通信频率自然语言指令可读存储介质

系统为您推荐了相关专利信息

一种基于双层智能体蜂拥控制的能效提升方法及系统

双层智能能效提升方法能效评估模型综合能源利用率能耗

基于大语言模型的参数化三维模型逆向建模方法及介质

逆向建模方法激光雷达大语言模型三维模型相机

一种重型燃气轮机控制逻辑验证方法及验证平台

仿真模型验证平台组合工况测试验证系统重型燃气轮机

一种面向长视频理解的采样方法及系统

令牌大语言模型视频帧采样方法生成视频片段

一种融合知识图谱和梯度提升决策树算法的加工链生成方法

融合知识图谱生成方法机械加工工艺 GBDT算法梯度提升决策树

大语言模型的训练方法、文本查询方法及其装置

站点导航

APP 下载