摘要
本发明属于大模型技术领域,本发明公开了一种改进的大模型知识库构建方法;包括:根据原始文档判断结构特征和属性,并构建原始文档诊断报告;针对原始文档内容,预测原始文档类型,当预测类型不唯一时,启动精分类法对原始文档进行分类;根据原始文档的主题表征词,使用实体协调涌现机制得到原始文档的第二层实体,将原始文档的文档名称作为第一层实体;针对第二层实体中的主题表征词,获取锚点,建立跨原始文档的候选对;并计算出候选对的关系判定等级;将关系判定等级作为第三层实体;并反向查询锚点,更新知识库;实现文档知识抽取与智能关联,为大模型知识库构建提供高质量语义支撑。
技术关键词
知识库构建方法
实体
主题
符号
序列
语义注意力
多头注意力机制
锚点
异构特征
协同方法
文本
报告
关系
多模态
关键词
术语
标志