文档解析方法、装置、电子设备和计算机可读存储介质

AITNT
正文
推荐专利
文档解析方法、装置、电子设备和计算机可读存储介质
申请号:CN202411520580
申请日期:2024-10-29
公开号:CN119476256A
公开日期:2025-02-18
类型:发明专利
摘要
本发明提供一种文档解析方法、装置、电子设备和计算机可读存储介质,通过将待解析文档按照行划分方式划分为多个文本单元,并获得各文本单元在待解析文档中的行号。按照行号的排序依次遍历各文本单元,将遍历到的每相邻两个文本单元输入预先训练得到的文档解析模型中进行语义分析,输出语义分析结果。基于语义分析结果判断每相邻两个文本单元是否属于同一个语义片段。本方案中,利用文档解析模型通过语义分析的方式判断文本单元是否属于同一个语义片段,可为后续文本单元的拼接提供依据,具有更强的泛化性能和更高的准确性。
技术关键词
文档解析方法 文本 语义 样本 计算机可执行指令 切片 可读存储介质 字符 电子设备 解析装置 处理器 分析模块 存储器
系统为您推荐了相关专利信息
1
基于栖息地成像与影像组学的慢性骨髓炎预测模型训练方法、预测方法、装置、电子设备及存储介质
样本 预测模型训练方法 组学特征 栖息地 影像
2
基于持久同源和深度元迁移的物流运输装备故障诊断方法
物流运输装备 迁移学习模型 故障诊断方法 拓扑特征 多任务学习模型
3
基于机器学习筛选早期非侵入性阿尔兹海默病筛查的生物标志物的方法
基因表达数据 诊断方法 分类器 计算机可执行指令 患者
4
用于与虚拟角色交互的方法、客户端、服务器、存储介质以及电子设备
界面 视频 计算机可执行指令 虚拟人物语音 终端
5
一种基于区块链的建设工程监理方法
建设工程监理 工程进度计划 支持向量机模型 资源分配 因子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号