基于自然语言处理的文档分析方法及系统

正文

推荐专利

基于自然语言处理的文档分析方法及系统

申请号：CN202410994271

申请日期：2024-07-23

公开号：CN118940743A

公开日期：2024-11-12

类型：发明专利

摘要

本发明涉及文档处理技术领域，是基于自然语言处理的文档分析方法及系统，具体方法包括：通过训练完成的AI大语言模型将待分析文档按段落切分为一组独立的文本片段；识别待分析文档中的实体信息，并提取各类实体信息的卷积特征，完成待分析文档的实体信息抽取处理；建立二维平面坐标系，评估每个实体与实体信息中心的初始关系强度值，将各个实体信息标注至平面坐标系中；识别待分析文档中的连接词汇，根据所述连接特征数据反馈确认每个实体信息之间的关系优化系数；将实体信息有序排列，并输出待分析文档的二维框架概况图。本发明解决了现有技术中，文档中知识点之间的关联关系复杂导致文档的阅读者阅读文档时产生理解误差的问题。

技术关键词

文档分析方法实体自然语言二维平面坐标系关系词嵌入模型卷积特征文本文档分析系统表达序列强度字符数据策略 BERT模型识别模块框架知识点

系统为您推荐了相关专利信息

一种基于大数据的金融问答智能规划和检索系统及方法

检索方法大数据金融向量检索技术规划

一种原地运动设备及其应用

运动设备重力传感器定位盘编码器虚拟现实体验

信息答复方法、装置、计算机设备及存储介质

意图类别信息答复方法置信度阈值语义特征关键词

一种基于斑马算法的无人机自组网覆盖优化方法

覆盖优化方法无人机自组网网络覆盖优化位置更新节点通信半径

一种适用于粒子加速器束流管的感生放射性评估方法

粒子加速器关注点周期模式辐射防护技术

基于自然语言处理的文档分析方法及系统

站点导航

APP 下载