摘要
本发明公开了一种基于电力词元结构的文档信息提取处理方法及装置,涉及文档信息处理技术领域,该方法包括:针对目标电力文档,识别提取任务并重定义任务范式,确定词元结点并构建词元有向图;基于消歧原理构建大语言问答模型,遍历词元有向图,确定词元关系;搭配文档布局编码器,构建信息提取引擎;识别词元有向图与词元关系,介入信息提取引擎对目标电力文档进行引擎并行检索与信息提取,确定多元电力信息体系;互补融合多元电力信息体系,作为目标电力文档的信息提取结果。解决了现有电力文档信息检索精度不足、完备性较低的技术问题,达到了通过基于任务范式的多元并行检索与信息融合,提高电力文档信息提取的精度和完备性的效果。
技术关键词
电力
问答模型
编码器
关系
预训练模型
异构
信息处理技术
结点
实体
逻辑
信息检索
模型更新
嵌套
布局
模块
定义
多模态
标签
样本
系统为您推荐了相关专利信息
关键运行参数
电力系统
负荷
节点导纳矩阵
系统风险评估
碳化硅部件
生成对抗网络
剩余使用寿命
光谱采集设备
磁探针阵列