领域专用大语言模型的训练样本生成方法及训练方法

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
推荐专利
领域专用大语言模型的训练样本生成方法及训练方法
申请号:CN202511433522
申请日期:2025-10-09
公开号:CN120892822B
公开日期:2025-12-05
类型:发明专利
摘要
本申请实施例提供一种领域专用大语言模型的训练样本生成方法及训练方法,所述训练样本生成方法包括:对多个数据系统中的异构信息进行采集与预处理,生成与特定优化任务相关的结构化过程数据,并基于所述结构化过程数据,重建与该特定优化任务对应的优化模型的演进轨迹;以及基于所述优化模型的演进轨迹,构建指令微调样本,用于对预训练大语言模型进行定制化训练。本申请提供的方法可以解决具体工程应用中存在的训练数据质量较差的问题。
技术关键词
训练样本生成方法 大语言模型 多源异构信息 网络结构 轨迹 邮件服务系统 模式匹配技术 文档管理系统 版本控制系统 项目管理系统 生成测试数据 指令 节点 参数 建立通信 自然语言 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号