一种大模型的训练数据处理方法、装置、介质及设备

AITNT
正文
推荐专利
一种大模型的训练数据处理方法、装置、介质及设备
申请号:CN202511039371
申请日期:2025-07-25
公开号:CN120542510B
公开日期:2025-12-23
类型:发明专利
摘要
本说明书实施例公开了一种大模型的训练数据处理方法,该方法将通过获取包含大模型的推理过程的初始数据集,从推理过程中确定在初始数据集的模型输入中,大模型推理出输出结果所需的条件,并对模型输入中确定出的条件进行更新,使模型输入不再具备大模型输出结果所需的条件,得到标注为无法输出结果的训练数据集,基于该训练数据集对待调整的大模型进行微调。该方法通过大模型的推理过程,确定输出结果所必需的条件,再基于此将模型输入中对应的条件更新,使得训练样本集不再具备推理出真实输出结果的条件,从而训练大模型能够识别不具备输出结果的模型输入的能力,避免大模型输出结果出现“幻觉”的情况。
技术关键词
训练数据处理方法 训练样本集 处理器 可读存储介质 存储器 电子设备 模块 接口 语义 计算机 程序
系统为您推荐了相关专利信息
1
一种多模态数据自动化处理与信息提取方法及系统
信息提取方法 生成答案 多模态数据融合 关系型数据库 大语言模型
2
室内导航及广告宣传方法、装置、存储介质及系统
互动式广告 广告宣传方法 广告投放策略 广告管理系统 AR导航系统
3
一种基于云计算的数据处理方法
数据处理方法 节点 MapReduce算法 边缘计算技术 分片
4
虚拟机迁移方法、装置、设备、可读存储介质和程序产品
策略 虚拟机迁移方法 物理 参数 虚拟机迁移装置
5
考虑频率安全的异步互联电网优化控制方法及装置
电网优化控制方法 数学模型 区域电力系统 电力系统频率响应 表达式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号