摘要
本发明属于电力自动化领域,公开了一种电力语义大模型训练数据处理方法及相关装置,将原始格式的电力专业文档数据转换为Markdown格式文件;获取电力语义大模型的当前训练任务的数据需求;根据所述数据需求得到数据校核要求,以及根据所述数据校核要求,基于人工校核反馈进行Markdown格式文件的数据校核;基于人工审核反馈数据对校核通过的Markdown格式文件进行数据审核;将数据审核通过的Markdown格式文件依照数据需求分版本保存。首先将电力专业文档数据转换为Markdown格式文件,以便后续人与机器相结合的数据校核和数据审核的进行,使得处理后的电力数据的逻辑更加清晰、层次更加鲜明、内容更加准确,根据不同的数据需求进行数据校核,适配训练任务。
技术关键词
训练数据处理方法
项目
电力
语义
数据处理系统
脱敏规则
专业
格式
校核工具
可读存储介质
数据存储模块
处理器
计算机设备
存储器
逻辑
系统为您推荐了相关专利信息
机器学习模型
电子设备
计算机可执行指令
处理单元
计算机程序产品
图像篡改检测方法
注意力
噪声预测
语义特征
生成噪声
综合能源服务
电力交易方法
生成电力
安全监控数据
图谱
人脸超分辨率方法
低分辨率人脸图像
文本
高分辨率人脸图像
交叉注意力机制
预警模型构建方法
网络
无标签样本
语义特征
多层感知机