音频生成方法、装置、设备及计算机可读存储介质

正文

推荐专利

申请号：CN202510853769

申请日期：2025-06-24

公开号：CN120358378B

公开日期：2025-09-02

类型：发明专利

摘要

本公开关于一种音频生成方法、装置、设备及计算机可读存储介质，涉及人工智能技术领域。方法包括：获取待生成音频的视频；确定所述视频对应的视频特征、视频时长特征和音画同步特征，所述视频特征用于表征所述视频，所述视频时长特征用于表征所述视频的时长，所述音画同步特征用于表征所述视频的画面和声音的时间一致性和语义关联性；根据所述视频特征、所述视频时长特征和所述音画同步特征，生成所述视频对应的音频，所述音频的时长与所述视频的时长相同。该方法使得生成的音频与视频的匹配度较高，提高了音频的生成效率。

技术关键词

视频噪声特征文本音频生成方法音频特征关键词池化特征图片可读存储介质计算机程序产品积层融合特征电子设备处理器人工智能技术语义注意力编码器

系统为您推荐了相关专利信息

基于目标区域的城市治理多模态大模型构建方法

多模态模型构建方法大语言模型文本嵌入特征

一种基于数据模型的汽车用户行为预测方法

协方差矩阵信号特征交互建模方法协作关系噪声特征

智能回复方法和装置、电子设备及存储介质

意图识别模型智能回复方法样本关键字对象

一种基于交通流量监测的道路通行管理控制方法及系统

交通流量监测管理控制方法动态信号控制路径规划导航优化交通流

一种基于AI语言大模型的智能多模态虚拟数字人交互系统、交互方法及应用

交互系统多模态数据采集语音特征智能决策引擎智能交互模块

音频生成方法、装置、设备及计算机可读存储介质

站点导航

APP 下载