数学文档的语音转换方法、装置、设备及介质

AITNT
正文
推荐专利
数学文档的语音转换方法、装置、设备及介质
申请号:CN202510713263
申请日期:2025-05-29
公开号:CN120580986A
公开日期:2025-09-02
类型:发明专利
摘要
本发明涉及人工智能领域,提供了一种数学文档的语音转换方法、装置、设备及介质,可应用于金融、医疗领域,其方法包括:基于解析器对数学文档进行解析得到树形结构和标记化文本;利用编码器对标记化文本进行编码得到语义向量;获取图像数据;基于第一处理策略对树形结构、语义向量和图像数据进行对齐得到目标特征向量;基于第二处理策略对目标特征向量进行生成得到目标语音特征;对目标语音特征进行转换处理得到语音波形。通过实施本发明实施例实现了利用解析器、编码器、第一处理策略和第二处理策略对数学文档进行解析、编码、对齐和生成等处理得到目标语音特征,以对目标语音特征进行转换处理得到语音波形,提高了语义连贯性和处理效率。
技术关键词
语音特征 语义向量 树形结构 语音转换方法 解析器 数学 编码器 文本 标记 策略 波形 语音转换装置 声码器 图像 计算机设备 数据 解析单元 转换单元
系统为您推荐了相关专利信息
1
大数据环境下的实时数据分析与可视化方法及系统
语义相关度 分层注意力模型 层次化结构 语义向量 自然语言理解模型
2
一种智能遥控器及其控制方法
智能遥控器 语音特征数据 语音采集模块 触摸板模块 模板
3
基于数据平台及大语言模型的自然语言SQL转换方法
索引 自然语言 语句 冗余度 序列
4
基于多尺度多模态对齐网络的目标说话人提取方法及系统
多模态 多尺度 交叉注意力机制 深度编码 网络
5
一种基于人工智能的用户标签融合方法及系统
融合标签 融合方法 注意力 生成向量 生成标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号