摘要
本发明涉及自然语言处理技术领域,公开了基于自然语言处理的史料文本自动分类方法。该方法包括采集原始史料文本数据并预处理;构建含多个文本实体节点、实体间语义关联关系及各节点特征信息的文本特征图谱;通过文本分析算法识别图谱中的核心语义簇、离散语义片段并定位关键实体节点;依据核心语义簇与关键实体节点生成含语义重映射方案、分类结构调整方案及权重调整方案的初步分类策略集合;接收用户校正指令,确定分类修正类型并对初步分类策略集合自适应调整;执行调整后的策略集合,依据分类结果更新文本特征图谱。该方法提升史料分类精准性与灵活性,助力史料资源高效整理与利用。
技术关键词
文本自动分类方法
分类策略
自然语言
实体
图谱
动态
强度
核心
节点特征
算术平均值
分类结构
校正
指令
关系
多层次特征
独立语义
逻辑