摘要
本发明提供基于大语言模型的文档级知识抽取与融合方法、系统,属于工业机器人领域,包括:确定所需关键信息范围并建立关键字字典;根据关键字字典对文档级的非结构化数据按段落进行划分,得到划分后的子文档;使用生产者-消费者模式集成大模型的异步架构搭建软件系统,利用软件系统依次对划分后的子文档进行知识抽取任务,从子文档的非结构化数据中提取关键信息;将同一篇子文档中抽取出的所有关键信息整合、归类得到规整的数据,再对规整的数据进行知识融合处理;段落间的关联程度配合关键字字典对文档划分,划分后子文档内容高度聚合,降低大模型处理复杂文档的难度,在大模型中集成生产者-消费者模式,避免系统阻塞,提升系统并发处理能力。
技术关键词
关键字
大语言模型
融合方法
关系
字典
融合系统
收集机器人
三元组
文本
数据
实体
解析工具
术语
队列
处理单元
列表
模块
消息
工业机器人
系统为您推荐了相关专利信息
水表信息
协议匹配方法
关键字
修正传感器数据
字段
车辆部件
车辆故障诊断方法
工况参数
轮廓系数
聚类
大语言模型
网络安全数据
威胁检测方法
标签化数据
语义向量
残差数据
经验模态分解法
LSTM算法
矩阵
LSTM模型