摘要
本申请提出一种面向煤炭行业的异常事实案例数据的合成方法,该方法涉及智能矿山的数据处理技术领域。该方法包括:获取煤炭行业的字典集合,并基于字典集合中煤炭行业的作业约束文件,确定煤炭行业的第一语料集合,对第一语料集合进行分类,得到煤炭行业不同业务领域的第二语料集合,针对每个业务领域,对业务领域的第二语料集合中每个语料进行关键点提取,得到语料的关键点集合,根据第二语料集合和语料的关键点集合进行异常事实案例模拟,得到业务领域的异常事实案例的数据集合。本申请中基于煤炭行业的作业约束中标准化条目语料,合成煤炭行业的模拟异常事实案例,从而可为大模型的训练提供数据支撑,提高煤炭行业相关大模型的训练效果。
技术关键词
关键点
三元组
字典
指标
复杂度
合规性
数据处理技术
语义
标签
条目
频率
矿山
地点
文本
格式
密度
系统为您推荐了相关专利信息
施工机器人
图像特征数据
惯性导航误差
定位方法
惯性导航数据
语音控制指令
交互方法
座舱系统
全息投影技术
人体关键点检测
换能器
数据分析模型
分辨率
测试方法
信号获取模块
大语言模型
信息处理方法
高维向量空间
构建知识图谱
信息处理系统