摘要
本申请涉及人工智能技术,提供了信息抽取方法、装置、设备及介质,一方面,将提取的文字信息与版面分析后得到的文档布局信息进行融合,能够对文本识别后的结果进行图像还原,以提高模型识别的准确性;一方面,根据信息抽取需求数据从预先构建的模型池中调取目标大语言模型,通过调取与实际需求相匹配的大语言模型,能够在满足任务要求的同时降低模型部署成本;另一方面,根据融合信息及关键信息说明生成目标prompt,并基于目标prompt及关键信息抽取策略调用目标大语言模型对目标文档进行处理,无需针对不同的任务重新训练模型,因此能够在高效执行信息抽取的同时提高泛化性及通用性。
技术关键词
信息抽取方法
大语言模型
策略
布局
计算机设备
抽取装置
融合特征
数据
指令
可读存储介质
生成表格
图像还原
人工智能技术
文本识别
解析单元
模版
参数
分析单元
处理单元
规模
系统为您推荐了相关专利信息
节点
采样点
贪婪算法
无人机路径规划
计算机程序产品
风电机组运维
管理系统
分布式大数据处理
风电机组部件
数据采集层
消毒纸巾
动态调度系统
监控模块
订单
注意力机制
层次化语义
自动分类方法
构建知识图谱
语义特征
大语言模型