摘要
本发明公开了一种基于大数据分析的法律史文献分类存储方法,涉及知识图谱技术领域,包括,采集法律史文献的文本、图像及元数据,进行OCR识别及多语言对齐,检测图像印章区域并分割版式,得到多模态数据集合;将法律条文跨法典修订记录编码为图嵌入向量,构建时间衰减函数,得到条文时空轨迹向量集合;根据用户输入的条文关键词和时间范围,激活相关分片并计算轨迹向量余弦相似度,得到检索结果;将新增文献的修订记录实时融合至条文时空轨迹向量集合,并触发知识图谱节点的动态扩展,得到分类存储数据库。通过法律逻辑标签匹配获得分类标签和知识图谱节点,动态扩展知识图谱节点,实现跨法典条文相似度精准计算。
技术关键词
文献分类存储方法
印章
轨迹
图像
节点
标签
关键词
文本
分片策略
术语
多模态
创建知识图谱
关系
更新知识图谱
逻辑
知识图谱技术
索引
数据
系统为您推荐了相关专利信息
商用清洁机器人
垃圾
清洁控制方法
清洁控制系统
图像
航空发动机管路
无网格方法
焊接方法
初始边界条件
方程
多普勒
反射点
误码率
信道频域响应
卫星轨道参数