摘要
本发明涉及人工智能领域,提供了一种数学文档的语音转换方法、装置、设备及介质,可应用于金融、医疗领域,其方法包括:基于解析器对数学文档进行解析得到树形结构和标记化文本;利用编码器对标记化文本进行编码得到语义向量;获取图像数据;基于第一处理策略对树形结构、语义向量和图像数据进行对齐得到目标特征向量;基于第二处理策略对目标特征向量进行生成得到目标语音特征;对目标语音特征进行转换处理得到语音波形。通过实施本发明实施例实现了利用解析器、编码器、第一处理策略和第二处理策略对数学文档进行解析、编码、对齐和生成等处理得到目标语音特征,以对目标语音特征进行转换处理得到语音波形,提高了语义连贯性和处理效率。
技术关键词
语音特征
语义向量
树形结构
语音转换方法
解析器
数学
编码器
文本
标记
策略
波形
语音转换装置
声码器
图像
计算机设备
数据
解析单元
转换单元
系统为您推荐了相关专利信息
语义相关度
分层注意力模型
层次化结构
语义向量
自然语言理解模型
智能遥控器
语音特征数据
语音采集模块
触摸板模块
模板