摘要
本发明公开了一种稳定规程规则化抽取方法、装置及存储介质,包括以下步骤:文档预处理;将稳定规程文件转换为指定格式的文件;表格识别与标题匹配;识别表格内容以及识别表格中表头包含的内容;根据表格信息与预设标题模板,匹配表格对应的标题内容;按照业务字段需求构建提示工程,根据限定字段抽取实际对应的实体内容;融合规则抽取与大模型抽取的结果,最终实现稳定规定断面限额的自动录入并关联设备模型。本发明提供一种融合规则化与大模型的信息抽取方法,以解决现有断面限额人工录入电子化技术的缺点。通过规则化限定专业领域名词范围,融合电力规则化能力与大模型抽取能力,实现无需大量人工干预的智能化信息抽取能力。
技术关键词
自动识别方法
稳定规程
表格
预训练语言模型
字段
格式
信息抽取方法
自动识别装置
融合规则
表头
文本
模板
处理器
指令
实体
专业
逻辑
编码
系统为您推荐了相关专利信息
大语言模型
文本
原型
模型训练方法
特征提取单元
数据传输系统
数据传输方法
资源
时间段
通信链路
区块链存证
浏览器插件
智能审核系统
特征融合技术
图像视觉特征
参数估计器
估测方法
站点
马尔科夫链蒙特卡洛方法
数据混合驱动