一种基于视音频合成的目标视频解说方法、系统及终端

正文

推荐专利

申请号：CN202510296898

申请日期：2025-03-13

公开号：CN120091157B

公开日期：2025-09-26

类型：发明专利

摘要

本申请涉及一种基于视音频合成的目标视频解说方法、系统及终端，属于视音频处理的技术领域，该目标视频解说方法包括：获取目标视频；根据所述目标视频的目标时长，将所述目标视频分隔为多个调整子视频；将每个所述调整子视频分解为角色层、场景层和互动层；根据所述角色层匹配第一音频、根据所述场景层匹配第二音频、根据所述互动层匹配第三音频；将所述第一音频、所述第二音频和所述第三音频融合，生成子音频；将所述调整子视频与对应的所述子音频关联；在所述目标视频播放至某一所述调整子视频范围时，根据对应所述子音频进行解说。本申请的提高用户的观看体验有益效果。

技术关键词

解说方法视音频解说系统音频特征视觉特征场景模板拼接单元视频分析终端模块存储器周期性误差程序图像风格处理器

系统为您推荐了相关专利信息

基于多模态感知的中低压配电设备精确位置定位方法

低压配电设备位置定位方法关键点特征原型视觉特征

一种针对电力行业的复杂表格结构识别方法、系统、设备及介质

结构识别方法图像结构布局特征融合视觉特征区域特征提取

一种基于AI数字人的智能录课系统及其工作方法

录课系统视频采集模块图像处理模块人工智能信息技术图像数据处理

一种大语言模型辅助的跨模态医学数据哈希检索方法

哈希检索方法大语言模型汉明距离报告医学图像模态

一种多模态数据标注方法

数据标注方法视觉特征关键字锚点时序特征

一种基于视音频合成的目标视频解说方法、系统及终端

站点导航

APP 下载