摘要
本说明书实施例公开了一种基于知识高维向量的文档分析方法、装置、设备及介质,涉及信息检索技术领域,用于解决现有检索精度低效率低的问题。方法包括:基于预置预置解析引擎与预置动态切片策略对多格式文档进行处理,获得多格式文档分片;对多格式文档分片进行向量编码,获得多格式文档分片的当前语义向量与当前位置向量;根据多格式文档所对应的基本结构特征对预置向量数据库进行筛选,确定多格式文档所对应的分析范围;将当前语义向量与当前位置向量,分别与分析范围内各历史文档的切片语义向量与切片位置向量进行相似度判别,获得多格式文档的原创性分析结果;基于预置分析模型对原创性分析结果进行处理以获得多格式文档的结构化分析结果。
技术关键词
语义向量
文档分析方法
格式
分片
原创性
动态切片
编码器
编码策略
计算机可执行指令
文档分析装置
解析工具
非易失性存储介质
信息检索技术
自然语义
编码算法
处理器
分析设备
系统为您推荐了相关专利信息
裁决方法
简化卷积神经网络
数据
语义特征提取
无监督
鼻中隔
锥形束CT设备
图像
计算机程序产品
特征提取模块
人工智能模型
人机交互方法
多模态会话
摘要
指令