一种音频生成方法、装置、设备及其存储介质

正文

推荐专利

申请号：CN202510028146

申请日期：2025-01-07

公开号：CN119864015B

公开日期：2025-09-30

类型：发明专利

摘要

本申请实施例属于研发设计及音频处理技术领域，应用于音频生成场景中，涉及一种音频生成方法、装置、设备及其存储介质，通过获取进行音频生成的目标文本数据；将目标文本数据输入到预训练完成的音频生成器中；识别通过人机交互方式所获取的尺度选择指令；基于所述尺度选择指令，获得所述音频生成器所输出的期望音频数据。将本申请所述音频生成方法，应用到多尺度音频生成场景下，尤其是在多语种广播或者智能语音客服回访场景下，能够根据音频语种、音频时间、音频频率范围的差异，生成更加细节和高质量的多语种译音，更加自动化和智能化，且为不同语种的客户提供更加国际化的广播或问询服务。

技术关键词

音频生成方法声学特征多尺度特征提取情感特征人机交互方式多时间尺度计算机可读指令频率文本生成机制智能语音客服生成场景生成方式数据输入模块

系统为您推荐了相关专利信息

装配界面应力预测方法

应力图像重建装配误差多尺度特征提取分辨率

一种基于多尺度超图神经网络和大语言模型对齐的电力负载预测方法

电力负载预测方法大语言模型特征提取模块原型多尺度特征提取

一种服务推荐方法、装置、计算机设备及存储介质

情绪状态信息客户服务推荐方法语音识别模型声学特征

一种基于神经网络的肾脏血管分割方法

医学影像数据血管分割方法肾脏深层特征提取浅层特征提取

一种融合动态光谱优化与多尺度特征强化的农作物遥感分类方法

农作物遥感分类方法多尺度特征提取图像可见光标签

一种音频生成方法、装置、设备及其存储介质

站点导航

APP 下载