一种面向一致性学习的样本增强与优化方法

正文

推荐专利

一种面向一致性学习的样本增强与优化方法

申请号：CN202511455023

申请日期：2025-10-13

公开号：CN120929892A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种面向一致性学习的样本增强与优化方法，包括：对非结构化文本中的专业知识资料、专业词汇解读、历史实践数据与专家经验集合分别进行知识抽取，得到原始问答对，得到专业知识库；通过多样化策略处理原始问答对，生成语义一致但形式多样的增强样本问答对，对增强样本问答对进行扩展或简化，得到正样本；在增强样本问答对中引入干扰性表述或事实错误，得到负样本；根据大模型准确率调整正负样本比例；将正样本和负样本作为训练数据，并基于预训练大模型和专业知识库进行参数微调得到专业大模型。本发明提升了大模型在不同场景下的适应性和鲁棒性，降低了无关信息与错误回答的出现概率。

技术关键词

样本专业知识库答案语义文本解析系统句法结构翻译模型识别关键信息核心客户管理系统术语模式识别算法知识图谱技术神经网络架构策略实体数据阶段决策树算法