数学文档的语音转换方法、装置、设备及介质

正文

推荐专利

申请号：CN202510713263

申请日期：2025-05-29

公开号：CN120580986A

公开日期：2025-09-02

类型：发明专利

摘要

本发明涉及人工智能领域，提供了一种数学文档的语音转换方法、装置、设备及介质，可应用于金融、医疗领域，其方法包括：基于解析器对数学文档进行解析得到树形结构和标记化文本；利用编码器对标记化文本进行编码得到语义向量；获取图像数据；基于第一处理策略对树形结构、语义向量和图像数据进行对齐得到目标特征向量；基于第二处理策略对目标特征向量进行生成得到目标语音特征；对目标语音特征进行转换处理得到语音波形。通过实施本发明实施例实现了利用解析器、编码器、第一处理策略和第二处理策略对数学文档进行解析、编码、对齐和生成等处理得到目标语音特征，以对目标语音特征进行转换处理得到语音波形，提高了语义连贯性和处理效率。

技术关键词

语音特征语义向量树形结构语音转换方法解析器数学编码器文本标记策略波形语音转换装置声码器图像计算机设备数据解析单元转换单元

系统为您推荐了相关专利信息

大数据环境下的实时数据分析与可视化方法及系统

语义相关度分层注意力模型层次化结构语义向量自然语言理解模型

一种智能遥控器及其控制方法

智能遥控器语音特征数据语音采集模块触摸板模块模板

基于数据平台及大语言模型的自然语言SQL转换方法

索引自然语言语句冗余度序列

基于多尺度多模态对齐网络的目标说话人提取方法及系统

多模态多尺度交叉注意力机制深度编码网络

一种基于人工智能的用户标签融合方法及系统

融合标签融合方法注意力生成向量生成标签

数学文档的语音转换方法、装置、设备及介质

站点导航

APP 下载