摘要
本发明公开了一种基于离散流匹配扩散算法的半自回归分层文本生成方法,包括:(1)构建一种层次化分块扩散语言模型,该模型将文本序列首先划分为大块,块间采用自回归方式生成,块内采用离散流匹配扩散方式并行生成;(2)对层次化分块扩散语言模型进行训练,使其学习块间的条件分布和块内的联合分布;(3)采用层次化分块结构,将每个大块递归地分解为更小的子块,形成多层次的分块树结构;(4)在推理阶段,采用自上而下的生成方式,首先生成上层大块,然后基于已生成的内容条件生成下层子块,从而实现高效的文本生成。利用本发明,能够在保持语言建模质量的同时显著提高文本生成效率。
技术关键词
文本生成方法
扩散算法
分块
分层
马尔可夫链模型
大规模语料库
生成方式
序列
概率密度函数
多层次
后验概率
速度
定义
状态更新
阶段
关系
广义
度量
数学
系统为您推荐了相关专利信息
分层卷积神经网络
多维特征向量
多维度特征提取
能力评估模型
语义特征
波动特征
电力传感器
特征提取模型
集成学习策略
分层
整车动力学模型
质心侧偏角
车辆模型
车辆纵向车速
闭环