基于大模型的训练数据生成方法、模型训练方法及装置

正文

推荐专利

申请号：CN202411899226

申请日期：2024-12-20

公开号：CN119862272B

公开日期：2025-10-17

类型：发明专利

摘要

本公开提供了一种基于大模型的训练数据生成方法、模型训练方法及装置，涉及自然语言处理、大模型、智能搜索、知识图谱等人工智能技术领域，可应用于知识问答等场景。该方法包括：基于历史操作数据，获取三元组数据，并从其中筛选出回答错误的三元组数据作为待修正三元组数据；基于大模型的迭代反思对待修正三元组数据中的问题进行改写，并基于改写后的问题和大模型生成修正后的检索片段；基于改写后的问题和修正后的检索片段，采用大模型生成改写后的问题对应的更正答案；基于改写后的问题、修正后的检索片段和更正答案，对待修正三元组数据进行更新，得到检索增强生成RAG训练数据。本公开可以提升训练数据质量和生成效率。

技术关键词

答案三元组训练数据生成方法问答模型训练方法指标模块数据生成装置模板人工智能技术格式计算机程序产品训练装置处理器通信自然语言指令

系统为您推荐了相关专利信息

基于信号增强的多通道煤质在线检测系统及方法

实时信息煤质在线检测方法多通道煤质在线检测系统时间段

基于主动视觉搜索的图像问答方法、装置、设备及介质

视觉问答模型图像问答方法文本图像压缩图像块

一种智能工程造价成本预测方法、装置及电子设备

生成器网络数据构建知识图谱造价关键词

基于知识图谱的航天器故障定位方法及装置

异常数据航天器故障三元组实体构建知识图谱

基于笔记的用户特征分析方法

线性回归模型编辑特征分析方法指标表头

基于大模型的训练数据生成方法、模型训练方法及装置

站点导航

APP 下载