音频生成方法、装置及其应用

正文

推荐专利

音频生成方法、装置及其应用

申请号：CN202510732376

申请日期：2025-06-03

公开号：CN120581025A

公开日期：2025-09-02

类型：发明专利

摘要

本申请涉及一种音频生成方法、装置及其应用。该方法包括：获取条件信息，条件信息包括文本提示；对文本提示进行解析，生成至少一个事件集合，其中，事件集合中包括至少一个事件子提示以及每个事件子提示对应的时间窗口，各时间窗口相互独立且起止节点连续；基于文本提示以及各事件集合，利用预训练的扩散模型进行采样处理，生成目标音频。本申请提供的方案，能够适应自然语言描述的条件，实现文本驱动下的可控长时音频生成，且能够确保时间与语义的精准对齐，生成高质量的音频。

技术关键词

音频生成方法文本交叉注意力机制时序处理器键值电子设备时间段生成装置自然语言节点可读存储介质模块重构语义分段变量

系统为您推荐了相关专利信息

珠宝结构的检测方法、装置、及储存介质

珠宝结构对称轴缺陷检测参数定位技术转换算法

一种车辆降噪控制方法、装置、车辆和存储介质

音频特征数据降噪控制方法降噪模型滤波器系数更新车辆主动降噪

基于几何注意力机制的RGBD语义分割方法及系统

注意力机制语义分割方法 RGB特征解码器编码器

一种基于似然比的伪造人脸图像真伪鉴定方法和系统

真伪鉴定方法人脸轮廓人脸关键点检测图像构造轮廓

一种基于联合采样的集中式机器人编队控制方法及系统

多机器人系统序列多机器人编队编队控制系统轨迹

音频生成方法、装置及其应用

站点导航

APP 下载