摘要
本发明公开了一种基于文本语义解读的配电网项目可研报告分析方法,属于文本数据处理领域。发明通过获取历史可研报告,提取其中的关键信息和专业术语,并依据这些信息构建起因与结果的映射规则形成规则集,通过Bert模型对映射规则集进行文本处理,生成关键术语及其关联信息的语义特征向量,分析待处理文档时,将标记后的段落分为敏感段和意义段,利用敏感段中提取字符段并输入文本处理模型进行字符串的输出,并利用数据库映射数据识别与关键术语有关的语义特征向量,通过相似度计算选出关键信息作为起因信息,并匹配结果信息生成含义段;通过整合字符串识别重复的语义特征向量,最终界定报告主题,从而将关键信息填入相应的报告模板中。
技术关键词
报告分析方法
配电网项目
术语
文本处理模型
规则集
聚类算法
关键词
语义向量
字符串识别
数据格式
主题
模板
词语
语义特征
系统为您推荐了相关专利信息
故障检测方法
充放电曲线
储能
等效串联电阻
元件
建筑信息模型
合规性检查方法
建立映射关系
计算机可读指令
数值
意图识别方法
文本分类算法
同义词
意图识别装置
策略
设备运行参数
规则集
颜色
可视化界面
规则冲突检测