摘要
本公开关于一种音频生成方法、装置、设备及计算机可读存储介质,涉及人工智能技术领域。方法包括:获取待生成音频的视频;确定所述视频对应的视频特征、视频时长特征和音画同步特征,所述视频特征用于表征所述视频,所述视频时长特征用于表征所述视频的时长,所述音画同步特征用于表征所述视频的画面和声音的时间一致性和语义关联性;根据所述视频特征、所述视频时长特征和所述音画同步特征,生成所述视频对应的音频,所述音频的时长与所述视频的时长相同。该方法使得生成的音频与视频的匹配度较高,提高了音频的生成效率。
技术关键词
视频
噪声特征
文本
音频生成方法
音频特征
关键词
池化特征
图片
可读存储介质
计算机程序产品
积层
融合特征
电子设备
处理器
人工智能技术
语义
注意力
编码器
系统为您推荐了相关专利信息
协方差矩阵
信号特征
交互建模方法
协作关系
噪声特征
交通流量监测
管理控制方法
动态信号控制
路径规划导航
优化交通流
交互系统
多模态数据采集
语音特征
智能决策引擎
智能交互模块