音频生成方法、装置及其应用

AITNT
正文
推荐专利
音频生成方法、装置及其应用
申请号:CN202510732376
申请日期:2025-06-03
公开号:CN120581025A
公开日期:2025-09-02
类型:发明专利
摘要
本申请涉及一种音频生成方法、装置及其应用。该方法包括:获取条件信息,条件信息包括文本提示;对文本提示进行解析,生成至少一个事件集合,其中,事件集合中包括至少一个事件子提示以及每个事件子提示对应的时间窗口,各时间窗口相互独立且起止节点连续;基于文本提示以及各事件集合,利用预训练的扩散模型进行采样处理,生成目标音频。本申请提供的方案,能够适应自然语言描述的条件,实现文本驱动下的可控长时音频生成,且能够确保时间与语义的精准对齐,生成高质量的音频。
技术关键词
音频生成方法 文本 交叉注意力机制 时序 处理器 键值 电子设备 时间段 生成装置 自然语言 节点 可读存储介质 模块 重构 语义 分段 变量
系统为您推荐了相关专利信息
1
珠宝结构的检测方法、装置、及储存介质
珠宝结构 对称轴 缺陷检测参数 定位技术 转换算法
2
一种车辆降噪控制方法、装置、车辆和存储介质
音频特征数据 降噪控制方法 降噪模型 滤波器系数更新 车辆主动降噪
3
基于几何注意力机制的RGBD语义分割方法及系统
注意力机制 语义分割方法 RGB特征 解码器 编码器
4
一种基于似然比的伪造人脸图像真伪鉴定方法和系统
真伪鉴定方法 人脸轮廓 人脸关键点检测 图像 构造轮廓
5
一种基于联合采样的集中式机器人编队控制方法及系统
多机器人系统 序列 多机器人编队 编队控制系统 轨迹
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号