摘要
本发明涉及文档处理技术领域,是基于自然语言处理的文档分析方法及系统,具体方法包括:通过训练完成的AI大语言模型将待分析文档按段落切分为一组独立的文本片段;识别待分析文档中的实体信息,并提取各类实体信息的卷积特征,完成待分析文档的实体信息抽取处理;建立二维平面坐标系,评估每个实体与实体信息中心的初始关系强度值,将各个实体信息标注至平面坐标系中;识别待分析文档中的连接词汇,根据所述连接特征数据反馈确认每个实体信息之间的关系优化系数;将实体信息有序排列,并输出待分析文档的二维框架概况图。本发明解决了现有技术中,文档中知识点之间的关联关系复杂导致文档的阅读者阅读文档时产生理解误差的问题。
技术关键词
文档分析方法
实体
自然语言
二维平面坐标系
关系
词嵌入模型
卷积特征
文本
文档分析系统
表达序列
强度
字符
数据
策略
BERT模型
识别模块
框架
知识点
系统为您推荐了相关专利信息
运动设备
重力传感器
定位盘
编码器
虚拟现实体验
意图类别
信息答复方法
置信度阈值
语义特征
关键词
覆盖优化方法
无人机自组网
网络覆盖优化
位置更新
节点通信半径