摘要
本发明公开了基于多维数据校验的企业股权图谱构建方法及存储介质,涉及知识图谱技术领域,本发明在获取的文档数据中提取文本,对提取的文本进行版面分析及表格结构重建,将格式转换后的文本输入到大语言模型中,对文本中的企业实体信息与股权关系进行抽取;构建初步股权图谱;对初步股权图谱中的环路进行检测,对消解矛盾后的股权图谱进行利益共同体识别,输出健康股权图谱;实时抽取企业实体信息,进行可信度校验,存入数据库。从数据获取、OCR表格重建到LLM抽取、图谱构建、矛盾消解、利益共同体识别和健康图谱对照,形成了一套完整的自动化技术链条,大幅降低人工操作成本。
技术关键词
图谱构建方法
文本
实体
节点
关系
字符
家族
文件管理服务器
社区划分算法
标记
数据
知识图谱技术
信息更新
集中度
表格
可视化工具
算法引擎
生成企业
系统为您推荐了相关专利信息
隔振系统
数字孪生驱动
优化控制方法
控制策略
执行控制动作
运动状态预测方法
车辆
指标
状态预测装置
计算机设备
光伏消纳能力
动态特征提取
条件风险价值
耦合特征
分位数回归森林
自然语言
计算机可执行指令
多轮对话
大语言模型
关键字
变形评价方法
地铁车站
基坑支护设计
正态分布函数
围挡结构