摘要
本发明提供一种大语言模型领域微调数据自动化筛选与修正方法,属于人工智能领域。包括以下步骤:自动过滤阶段用于识别并移除低质量的数据对,以确保后续微调过程使用的数据集尽可能高质量。自动纠正阶段旨在自动纠正那些被识别为低质量但有可能通过LLM生成更优响应的数据对。重复上述过程,即再次使用更新后的数据集进行LLM微调,形成一个不断优化的循环,直至达到满意的性能水平。本发明显著提高了数据集的整体质量。不仅减少了因直接丢弃数据而导致的学习样本减少问题,还保留了有价值的信息,增强了模型的适应性和性能。
技术关键词
修正方法
自然语言推理技术
大语言模型
数据
置信度阈值
阶段
代表
指令
基础
语义
样本
基座