领域专用大语言模型的训练样本生成方法及训练方法

AITNT
正文
推荐专利
领域专用大语言模型的训练样本生成方法及训练方法
申请号:CN202511433522
申请日期:2025-10-09
公开号:CN120892822B
公开日期:2025-12-05
类型:发明专利
摘要
本申请实施例提供一种领域专用大语言模型的训练样本生成方法及训练方法,所述训练样本生成方法包括:对多个数据系统中的异构信息进行采集与预处理,生成与特定优化任务相关的结构化过程数据,并基于所述结构化过程数据,重建与该特定优化任务对应的优化模型的演进轨迹;以及基于所述优化模型的演进轨迹,构建指令微调样本,用于对预训练大语言模型进行定制化训练。本申请提供的方法可以解决具体工程应用中存在的训练数据质量较差的问题。
技术关键词
训练样本生成方法 大语言模型 多源异构信息 网络结构 轨迹 邮件服务系统 模式匹配技术 文档管理系统 版本控制系统 项目管理系统 生成测试数据 指令 节点 参数 建立通信 自然语言 矩阵
系统为您推荐了相关专利信息
1
一种基于面部动态捕捉的中文唇语识别方法
中文唇语识别方法 面部关键点 拼音 深度相机 大语言模型
2
一种基于多源数据融合的海上风电机组故障缺陷识别系统
海上风电机组 缺陷识别系统 动态门控 振动特征 声学特征
3
基于图像捕捉数据的行为识别方法、装置、设备及介质
端点 对象 特征点 图像捕捉 轨迹
4
一种油气井在线酸化解堵控制方法及系统
解堵工艺 堵控制方法 故障检测 感应模块 联动设备
5
一种高速飞行体多阶段轨迹不确定性传播方法
飞行体 多阶段 轨迹模型 拉丁超立方采样 三自由度运动
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号