摘要
本发明公开一种用于领域知识抽取的水害防治实体数据增强方法及系统,方法包括:获取水害防治领域内文本数据;对获取的不同格式文本数据进行标准化处理及清洗,形成领域的原始数据集;根据领域的原始数据集,自上而下归纳领域主题概念,剖析概念关联关系,建立水害防治本体模型,根据本体模型开展数据标注;根据标注结果将每条文本数据分为实体部分与非实体部分,对实体部分与非实体部分采用相应的增强策略实施数据增强,重新组合实体部分增强结果与非实体部分增强结果,得到该条文本数据的增强数据,每条文本的增强数据组成增强数据集。
技术关键词
水害防治
实体
数据
文本
大语言模型
格式
修正错别字
策略
概念属性
主题
同义词库
编辑
关系
防治方法
字典
论文
标签
处理器
系统为您推荐了相关专利信息
咨询平台
回归预测模型
数据收集模块
能量消耗
因子
蓄冷模块
数据中心机房
节能控制方法
IT机柜
节点
功能模块
大语言模型
计算中心
云平台
基础设施技术
演化特征
风险
疏散路径规划
动态场景
实时监测数据