一种基于大语言模型的双阶段微调训练方法及装置

AITNT
正文
推荐专利
一种基于大语言模型的双阶段微调训练方法及装置
申请号:CN202510145586
申请日期:2025-02-10
公开号:CN120045749A
公开日期:2025-05-27
类型:发明专利
摘要
本申请提供了一种基于大语言模型的双阶段微调训练方法及装置,方法包括:获取相关性判断数据集和相关性选择数据集,其中,相关性判断数据集和相关性选择数据集均包含查询、正样本和负样本构成的三元组,相关性选择数据集的复杂度高于相关性判断数据集的复杂度;采用相关性判断数据集对预训练完成的大语言模型进行初步微调,其中,初步微调用于使大语言模型掌握基本的相关性判断能力;采用相关性选择数据集对初步微调后的大语言模型进行再次微调,其中,再次微调用于使大语言模型掌握复杂环境下的相关性判别能力;将微调完成后的大语言模型部署到信息检索系统中。本申请能够提高信息检索的精确性。
技术关键词
大语言模型 标签模板 信息检索系统 三元组 数据 样本 复杂度 通信接口 可读存储介质 存储器 处理器 阶段 训练装置 关系 模块 格式 计算机
系统为您推荐了相关专利信息
1
一种基于BIM的工程项目进度管控方法及系统
进度管控方法 物联网传感器网络 风险 多源特征 工程项目进度管理技术
2
低代码流程异常检测方法、装置、设备及可读存储介质
时间序列特征 异常检测方法 拓扑特征 异常检测程序 上下文特征
3
一种基于露点传感器的空压站智能控制系统
露点传感器 智能控制系统 冷干机 露点温度 远程控制模块
4
一种面向知识演化的智能辅助决策系统及构建方法
强化学习算法 仿真环境 智能辅助决策系统 模块 样本
5
一种异构AUV群组的协同航行控制方法及装置
航行控制方法 一致性协议 状态空间模型 异构 动态数学模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号