摘要
本公开提供了一种风格文字生成方法、装置及计算机可读存储介质,涉及内容生成技术领域。该方法包括:通过多模态特征提取网络分别提取文字风格文本的第一文字风格特征和文字风格图像的第二文字风格特征;通过交叉注意力网络处理第一文字风格特征和第二文字风格特征,得到第三文字风格特征;通过门控融合网络处理第三文字风格特征和第二文字风格特征,得到第四文字风格特征;通过文本语义特征提取网络提取内容文本的文本语义特征;通过扩散网络处理文本语义特征和第四文字风格特征,得到针对内容文本的内容风格文本。通过上述技术手段,解决相关技术中生成风格文字需要依赖庞大的字体库,模仿特定字体风格的能力有限等问题。
技术关键词
风格
文本
语义特征提取
特征提取网络
文字生成方法
多模态
注意力
图像
文字生成装置
内容生成技术
字体
可读存储介质
噪声
对象
计算机
输入模块
参数
系统为您推荐了相关专利信息
动态三维模型
飞机位姿
姿态角估计
估计方法
融合特征