摘要
本发明涉及自然语言处理领域,提供了一种文章标题结构生成方法及系统。该方法包括,获取文章的标题结构信息,并根据标题等级对文章标题结构进行标签化处理,得到文章不同层级的标题结构;根据文章标题结构标签数据,进行标题层级树构建;对标题层级树中叶子节点进行剪枝,去除掉某个或者多个树分支的叶子节点,获得第一子标题层级树;在树分子节点满足一定范围时,根据标题层级树的中分支子树情况,抽取其根节点下的所有子树,得到第二子标题层级树;对标题层级树中子树分支进行剪枝,去除掉某个或者多个树分支,得到第三子标题层级树;基于第一子标题层级树、第二子标题层级树和第三子标题层级树,构建训练样本集,训练文章结构生成大模型。
技术关键词
结构生成方法
层级
文章
训练样本集
分支
标签
模型训练模块
中子
分子
生成结构
数据获取模块
处理器
生成系统
自然语言
计算机设备
节点数
可读存储介质
文本