语音生成方法、装置、介质、电子设备及程序产品

正文

推荐专利

申请号：CN202510832969

申请日期：2025-06-19

公开号：CN120599999A

公开日期：2025-09-05

类型：发明专利

摘要

本申请属于人工智能技术领域，具体涉及一种语音生成方法、语音生成装置、计算机可读介质、电子设备以及计算机程序产品。该方法包括：获取自然语言指令，所述自然语言指令用于以自然语言描述语音的呈现效果；获取与所述自然语言指令具有相似语音呈现效果的样本对，所述样本对包括音频样本和文本样本，所述文本样本用于描述所述音频样本的语音呈现效果；将所述自然语言指令与所述样本对组合，得到多模态提示词；根据所述多模态提示词生成语音。本申请可以提升语音生成的控制精度和灵活性。

技术关键词

语音生成方法自然语言样本去噪模型生成语音多模态指令频谱特征风格格式化文本参数噪声预测预测特征计算机程序产品语义向量音频适配器

系统为您推荐了相关专利信息

基于少样本多模态融合的变电站设备健康状态评估方法、系统、设备及存储介质

健康状态评估方法变电站配电设备变电站设备综合健康指数预训练模型

一种基于大模型的多轮对话方法、装置、设备及存储介质

多轮对话方法键值语义向量实体三元组

一种用于VVC编码单元的CU分区模式预测方法及视频编码设备

模式预测方法混合神经网络模型分区局部纹理特征视频编码设备

基于无人机影像测定的光伏板定位建模方法及系统

光伏板定位建模方法无人机能耗图像

基于支持向量加权模型的供水管道泄漏检测方法及系统

泄漏检测方法供水管道生成样本数据噪声管道泄漏检测

语音生成方法、装置、介质、电子设备及程序产品

站点导航

APP 下载