一种人工智能文本解析提炼与要点来源定位方法

正文

推荐专利

申请号：CN202510661807

申请日期：2025-05-22

公开号：CN120180252A

公开日期：2025-06-20

类型：发明专利

摘要

本发明涉及文本处理技术领域，公开了一种人工智能文本解析提炼与要点来源定位方法，包括：收集PDF文档数据，进行人工标注和预处理，得到训练集、验证集和测试集；对深度学习模型进行初始化，设置深度学习模型训练的参数；基于训练集、验证集和测试集对深度学习模型进行训练、验证和测试，得到PDF文档版面识别模型；利用PDF文档版面识别模型对待识别PDF文档进行识别，将识别结果转化为文本格式或图表/表格格式；对转化为文本格式或图表/表格格式的文本进行深度向量化处理；基于先进的向量空间模型和相似性度量算法，实现语义检索。本发明能够显著提升文本解析提炼的准确性和效率，同时快速定位要点来源。

技术关键词

定位方法向量空间模型深度学习模型训练表格图表多尺度特征金字塔数据收集策略格式融合局部特征语义理解技术高维向量空间文本处理技术深度学习训练训练集优化器联动规则标签体系

系统为您推荐了相关专利信息

一种基于区块链的工程技术文档存储处理方法及系统

加密策略文档特征多模态特征结构单元指纹

一种多维全息数据融合的资产定位方法

资产定位方法三维全息影像多模态数据采集多模块风险评估模型

一种POBP模型在高维数据噪声环境下的预测方法

数据噪声噪声识别样本噪声数据数据监测技术

一种预测化学品环境暴露行为参数的深度学习方法

查询化学品深度学习模型训练深度学习方法节点特征分子

一种基于重心感知的四足巡检机器人空间定位方法及系统

波束生成全息图空间定位方法坐标风险点

一种人工智能文本解析提炼与要点来源定位方法

站点导航

APP 下载