摘要
本申请实施例提供了一种基于大语言模型的电力文档规范化处理方法及装置,其中,该方法包括:将从电力系统中获取的原始数据集转化目标数据集,其中,所述目标数据集中的数据均为文本格式的结构化数据;构建目标语料库,其中,所述目标语料库中包括多个被向量化的语料,所述多个被向量化的语料均属于电力领域中的语料;利用所述目标语料库和第一数据集构建指令数据集;基于所述指令数据集对第一预设模型进行监督微调,得到目标模型,以利用所述目标模型检测所述目标数据集中的数据的规范性。通过本申请,解决了相关技术中检测数据规范性的方法存在检测效率低、检测准度低的问题。
技术关键词
文本
数据
大语言模型
指令
电力系统
词语
命名实体识别
处理器
可读存储介质
计算机程序产品
标识
模块
存储器
电子设备
分词
指数
模板
指标
系统为您推荐了相关专利信息
搜索词
样本
模型训练方法
召回方法
模型训练装置
风险评估方法
计划
智能分析算法
施工现场环境
风险评估系统