目标音频生成方法及装置、电子设备和介质

AITNT
正文
推荐专利
目标音频生成方法及装置、电子设备和介质
申请号:CN202510337001
申请日期:2025-03-20
公开号:CN120164486A
公开日期:2025-06-17
类型:发明专利
摘要
本公开提供了一种目标音频生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及计算机领域,尤其涉及人工智能、深度学习、自然语言处理技术领域。实现方案为:获取参考音频、参考文本和目标文本;基于将参考音频进行特征离散化,获得参考音频声学标记序列和参考音频语义标记序列;将目标文本和参考文本分别进行特征离散化以获得各自对应的文本语义标记序列;基于文本语义标记序列、参考音频语义标记序列,通过第一生成式语言模型获得目标音频语义标记序列;基于参考音频语义标记序列、目标音频语义标记序列和参考音频声学标记序列,通过第二生成式语言模型获得目标音频声学标记序列;基于目标音频声学标记序列解码得到目标音频。
技术关键词
标记 序列 文本 语义向量 音频生成方法 音频特征 标签 索引 解码 计算机程序产品 模型训练装置 模型训练方法 电子设备 处理器 可读存储介质 处理单元 生成智能
系统为您推荐了相关专利信息
1
一种基于关键帧的扩散模型引导的人形机器人交互物体方法
人形机器人 交互物体 关键帧 人体动作序列 定义
2
一种售后数据管理系统及其管理方法
分派工单 数据管理系统 文本 语义 序列
3
基于人工智能的合同识别方法、装置、设备及存储介质
信息提取模型 线下 识别方法 数据 计算机可读指令
4
一种靶向MlaC蛋白的核酸适配体及应用
核酸 蛋白 体外筛选技术 核苷酸 同位素标记
5
应用于五金制品控制系统的数据挖掘方法及系统
数据挖掘方法 实体 知识点 模式 软件
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号