音频生成方法、装置、设备及计算机可读存储介质

AITNT
正文
推荐专利
音频生成方法、装置、设备及计算机可读存储介质
申请号:CN202510853769
申请日期:2025-06-24
公开号:CN120358378B
公开日期:2025-09-02
类型:发明专利
摘要
本公开关于一种音频生成方法、装置、设备及计算机可读存储介质,涉及人工智能技术领域。方法包括:获取待生成音频的视频;确定所述视频对应的视频特征、视频时长特征和音画同步特征,所述视频特征用于表征所述视频,所述视频时长特征用于表征所述视频的时长,所述音画同步特征用于表征所述视频的画面和声音的时间一致性和语义关联性;根据所述视频特征、所述视频时长特征和所述音画同步特征,生成所述视频对应的音频,所述音频的时长与所述视频的时长相同。该方法使得生成的音频与视频的匹配度较高,提高了音频的生成效率。
技术关键词
视频 噪声特征 文本 音频生成方法 音频特征 关键词 池化特征 图片 可读存储介质 计算机程序产品 积层 融合特征 电子设备 处理器 人工智能技术 语义 注意力 编码器
系统为您推荐了相关专利信息
1
基于目标区域的城市治理多模态大模型构建方法
多模态 模型构建方法 大语言模型 文本 嵌入特征
2
一种基于数据模型的汽车用户行为预测方法
协方差矩阵 信号特征 交互建模方法 协作关系 噪声特征
3
智能回复方法和装置、电子设备及存储介质
意图识别模型 智能回复方法 样本 关键字 对象
4
一种基于交通流量监测的道路通行管理控制方法及系统
交通流量监测 管理控制方法 动态信号控制 路径规划导航 优化交通流
5
一种基于AI语言大模型的智能多模态虚拟数字人交互系统、交互方法及应用
交互系统 多模态数据采集 语音特征 智能决策引擎 智能交互模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号