摘要
本发明公开一种基于主从模型协作的长文协作生成方法,包括:通过公开数据集获取训练数据,并使用自然语言处理工具提取摘要、关键词和段落层次,从而为该训练数据提供结构化信息;将训练数据中的长文本语料分层,提取主题层和段落层,用于训练模型生成主题框架;将分层后的数据转化为模型可接受的输入/输出对,输入为全局上下文,输出为所述主题层的框架;基于Transformer网络构建文本生成模型,然后训练;通过训练完成的文本生成模型进行长文本协作生成。本发明为训练数据提供了结构化信息,明确了模型的目标和生成约束,解决了传统生成模型难以生成层次化长文本的任务定义问题。
技术关键词
文本生成模型
生成方法
网络
多头注意力机制
解码器
交叉注意力机制
编码器
生成主题
参数
模拟环境噪声
Softmax函数
数据
介质
输出特征
反射率
自然语言
特征提取模型
系统为您推荐了相关专利信息
车载通信网络
诊断计算机
交换机
虚拟局域网标识符
电子控制单元
桥梁裂缝监测
桥梁有限元模型
生成二值化
掩膜
生成输出图像
声子晶体设计
带隙
图像
二维声子晶体
声子晶体结构