摘要
本发明公开了一种面向一致性学习的样本增强与优化方法,包括:对非结构化文本中的专业知识资料、专业词汇解读、历史实践数据与专家经验集合分别进行知识抽取,得到原始问答对,得到专业知识库;通过多样化策略处理原始问答对,生成语义一致但形式多样的增强样本问答对,对增强样本问答对进行扩展或简化,得到正样本;在增强样本问答对中引入干扰性表述或事实错误,得到负样本;根据大模型准确率调整正负样本比例;将正样本和负样本作为训练数据,并基于预训练大模型和专业知识库进行参数微调得到专业大模型。本发明提升了大模型在不同场景下的适应性和鲁棒性,降低了无关信息与错误回答的出现概率。
技术关键词
样本
专业知识库
答案
语义
文本解析系统
句法结构
翻译模型
识别关键信息
核心
客户管理系统
术语
模式识别算法
知识图谱技术
神经网络架构
策略
实体
数据
阶段
决策树算法
系统为您推荐了相关专利信息
多头注意力机制
情感分析模型
多模态
跨模态
文本
情感分析方法
分类预处理
文本
社交媒体平台
样本
定量预测方法
随机森林模型
特征值
三维地质模型
网格