大语言模型的训练方法、文本查询方法及其装置

AITNT
正文
推荐专利
大语言模型的训练方法、文本查询方法及其装置
申请号:CN202510112818
申请日期:2025-01-23
公开号:CN120045666A
公开日期:2025-05-27
类型:发明专利
摘要
本公开提供了一种大语言模型的训练方法、文本查询方法及其装置,涉及人工智能领域,尤其涉及深度学习、自然语言处理、大模型领域。具体实现方案为:确定样本查询文本,以及,从预设的索引池中匹配得到与样本查询文本相关的至少一个提示样本集合,其中,索引池包括多个候选样本集合,候选样本集合中包括正样本和负样本;将提示样本集合和样本查询文本共同输入待训练的大语言模型,得到样本回答文本;获取样本回答文本的准确性相关参数,并根据准确性相关参数对索引池进行更新;基于更新后的索引池对大语言模型进行增量训练,得到训练后的目标大语言模型。
技术关键词
样本 大语言模型 索引 文本查询方法 匹配模块 参数 查询装置 标签 计算机程序产品 算法 训练装置 处理器通信 频率 自然语言 指令 可读存储介质
系统为您推荐了相关专利信息
1
一种基于双层智能体蜂拥控制的能效提升方法及系统
双层智能 能效提升方法 能效评估模型 综合能源利用率 能耗
2
基于大语言模型的参数化三维模型逆向建模方法及介质
逆向建模方法 激光雷达 大语言模型 三维模型 相机
3
一种重型燃气轮机控制逻辑验证方法及验证平台
仿真模型 验证平台 组合工况 测试验证系统 重型燃气轮机
4
一种面向长视频理解的采样方法及系统
令牌 大语言模型 视频帧 采样方法 生成视频片段
5
一种融合知识图谱和梯度提升决策树算法的加工链生成方法
融合知识图谱 生成方法 机械加工工艺 GBDT算法 梯度提升决策树
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号