一种文档智能识别方法和计算机设备

正文

推荐专利

一种文档智能识别方法和计算机设备

申请号：CN202510956752

申请日期：2025-07-11

公开号：CN120853207A

公开日期：2025-10-28

类型：发明专利

摘要

本发明属于文档识别技术领域，具体涉及一种文档智能识别方法和计算机设备。本发明在处理正文文本时，在利用文本检测模型识别出正文文本内容以后，增加对语义消歧处理的步骤，具体为，先识别出其中的多义词和/或专有名词，然后采用参数估计法确定该多义词和/或专有名词最有可能的词义，进而在参数估计法无法匹配出较优的结果(即参数估计法估计出的该多义词和/或专有名词属于最可能的词义的概率低于设定概率阈值)后，进一步利用训练好的神经网络来确定该多义词和/或专有名词的词义，消除多义词在不同上下文中的理解偏差，明确专有名词的明确含义，实现了文档关键信息的解析和提取，便于用户对获取的知识的理解，提升了文档识别效果。

技术关键词

智能识别方法多义词文本检测模型参数估计法图片表格文档识别技术结构化数据格式计算机设备合并单元格条目实体神经网络模型字段图像处理器词语关系语义

系统为您推荐了相关专利信息

基于动态多光谱植被指数的多品种水稻结实率估算方法

水稻结实率无人机多光谱数字表面模型水稻冠层机器学习算法

融合多肽三维特征与深度学习的活性肽精准识别方法

精准识别方法融合多肽活性肽数据深度学习模型

一种海洋测绘图片资料矢量化方法

矢量化方法初始聚类中心矢量线要素指数色彩

电动汽车充电量的预测方法

数据汽车配电网规划技术机器可读介质统计算法

一种翻盘设备翻盘过程异常监控方法、装置和存储介质

异常监控方法关键帧感兴趣类别图片视频

一种文档智能识别方法和计算机设备

站点导航

APP 下载