摘要
本发明属于自然语言处理技术领域,具体涉及一种电力领域指令微调样本集自动构建方法及装置,包括:利用电力文本构建指令微调样本知识库;利用指令微调样本知识库和电力领域不同场景的指令种子样本实例,生成各场景下的多个指令微调样本;基于思维链校验法和文本特征筛选法,从多个指令微调样本中筛选符合要求的指令微调样本构建微调样本数据集。本发明提供的技术方案,实现了高效率自动生成符合任务需求以及具备高质量、多样性、专业性的电力微调样本,从而为大模型微调提供数据基础,同时减少了人工参与和标注的工作量,降低了标注成本。
技术关键词
样本
指令
文本
自动构建方法
电力
TextRank算法
特征筛选方法
答案
bert模型
校验方法
基准
种子
场景
节点
存储方法
数据
实体
模块
摘要
词典