目标音频生成方法及装置、电子设备和介质

正文

推荐专利

目标音频生成方法及装置、电子设备和介质

申请号：CN202510337001

申请日期：2025-03-20

公开号：CN120164486A

公开日期：2025-06-17

类型：发明专利

摘要

本公开提供了一种目标音频生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品，涉及计算机领域，尤其涉及人工智能、深度学习、自然语言处理技术领域。实现方案为：获取参考音频、参考文本和目标文本；基于将参考音频进行特征离散化，获得参考音频声学标记序列和参考音频语义标记序列；将目标文本和参考文本分别进行特征离散化以获得各自对应的文本语义标记序列；基于文本语义标记序列、参考音频语义标记序列，通过第一生成式语言模型获得目标音频语义标记序列；基于参考音频语义标记序列、目标音频语义标记序列和参考音频声学标记序列，通过第二生成式语言模型获得目标音频声学标记序列；基于目标音频声学标记序列解码得到目标音频。

技术关键词

标记序列文本语义向量音频生成方法音频特征标签索引解码计算机程序产品模型训练装置模型训练方法电子设备处理器可读存储介质处理单元生成智能

系统为您推荐了相关专利信息

一种基于关键帧的扩散模型引导的人形机器人交互物体方法

人形机器人交互物体关键帧人体动作序列定义

一种售后数据管理系统及其管理方法

分派工单数据管理系统文本语义序列

基于人工智能的合同识别方法、装置、设备及存储介质

信息提取模型线下识别方法数据计算机可读指令

一种靶向MlaC蛋白的核酸适配体及应用

核酸蛋白体外筛选技术核苷酸同位素标记

应用于五金制品控制系统的数据挖掘方法及系统

数据挖掘方法实体知识点模式软件

目标音频生成方法及装置、电子设备和介质

站点导航

APP 下载