摘要
本发明提供一种文本解析模型设计方法、装置、存储介质和程序产品,涉及自然语言处理技术领域。其中,文本解析模型设计方法包括:基于语义相似度对文本进行分块,得到语义文本块;至少基于语义文本块,将文本划分为不同级别的节点,得到树状节点结构;根据文本中的非文本对象,创建非文本节点,并纳入所述树状节点结构;对所述树状节点结构中的每个节点进行元数据管理。本发明方法通过文本解析,得到包含元数据的树状节点结构,在保持文本原有层次结构和语义完整性的同时,大幅提高了复杂文本的解析效率和信息检索的准确性,为大语言模型的文本处理应用提供了强有力的支持。
技术关键词
文本
模型设计方法
节点
元数据管理
语义
分块
对象
计算机装置
计算机程序产品
处理器
信息检索
自然语言
数据字
框架
可读存储介质
存储器
模式
系统为您推荐了相关专利信息
状态信息管理方法
风险评估模型
误码率
谐波
无线射频
双极结晶体管
偏置电压节点
无源元件
沟道场效应晶体管
栅极
纵向联邦学习方法
结点
孩子
XGBoost模型
样本