一种语音重构方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
一种语音重构方法、装置、电子设备及存储介质
申请号:CN202510666593
申请日期:2025-05-22
公开号:CN120726984A
公开日期:2025-09-30
类型:发明专利
摘要
本申请公开了一种语音重构方法、装置、电子设备及存储介质,该方法包括:获取第一时刻对应的第一语音单元的编码特征,并获取与第一语音单元相关的第二语音单元的文本预测结果;基于第二语音单元的文本预测结果,得到第一语音单元的显式语义特征,以及基于第一语音单元的编码特征,得到第一语音单元的隐式语义特征;将显式语义特征和隐式语义特征进行融合,得到第一语音单元的融合语义特征;基于第一语音单元的融合语义特征,合成第一时刻对应的重构音频。通过上述方法,本申请能够提高重构音频的准确性。
技术关键词
融合语义 编码特征 显式语义特征 文本 视野 重构方法 重构模型 样本 线性单元 音频 参数 电子设备 语音识别模块 存储程序指令 可读存储介质 重构装置 数值
系统为您推荐了相关专利信息
1
一种基于领域知识的渐增式模型推荐系统的构建方法
SysML模型 推荐系统 推荐方法 列表 BERT模型
2
地形图生成方法、装置、设备以及存储介质
生成方法 颜色 地形特征 网络 文本编码器
3
一种智能体情绪生成方法、系统与存储介质
生成方法 社交 大语言模型 序列 可读存储介质
4
一种人物模型的构建方法、装置、设备、介质和程序产品
人物模型 三维模型 人体姿态估计 视频 参数
5
一种基于AI的智能图像处理方法及系统
智能图像处理方法 图片 多模态信息 随机噪声 智能图像处理系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号