摘要
本发明提供一种文档的存储方法、智能问答方法、系统、设备和介质。存储方法包括:获取待分析的文档;对文档进行类型识别,基于识别出的文档类型,从文档中提取文档内容;计算文档内容与预存的多个标准分类内容的语义相似度,根据语义相似度确定文档对应的内容类别;其中,每一个标准分类内容对应一个内容类别;对文档内容进行章节划分,并确定各个章节的章节摘要;其中,每一个章节对应一个章节摘要;对各个章节进行语义识别,将每一个章节切分为多个语义片段;根据内容类别、章节摘要和语义片段之间的层级关系,对文档进行结构化存储。本发明提升了对于多源异构文档的适配能力,实现了对复杂文档内容的更加精准、更为细粒度的结构化信息抽取。
技术关键词
智能问答方法
语义
存储方法
大语言模型
意图识别
摘要提取模块
文本
光学字符识别
层级
电子设备
生成机制
存储系统
计算机
处理器
关系
识别模块
存储装置
存储模块
可读存储介质
系统为您推荐了相关专利信息
力评价方法
模拟训练场景
神经网络模型
指标
心理
中文文本识别
识别模块
图像数据处理
网络
脱机手写
多层感知机
图像变化检测方法
分类器
多级特征融合
变化检测模型
三元组
道路交通事故
知识抽取方法
实体
关系抽取模型