一种基于视音频合成的目标视频解说方法、系统及终端

AITNT
正文
推荐专利
一种基于视音频合成的目标视频解说方法、系统及终端
申请号:CN202510296898
申请日期:2025-03-13
公开号:CN120091157B
公开日期:2025-09-26
类型:发明专利
摘要
本申请涉及一种基于视音频合成的目标视频解说方法、系统及终端,属于视音频处理的技术领域,该目标视频解说方法包括:获取目标视频;根据所述目标视频的目标时长,将所述目标视频分隔为多个调整子视频;将每个所述调整子视频分解为角色层、场景层和互动层;根据所述角色层匹配第一音频、根据所述场景层匹配第二音频、根据所述互动层匹配第三音频;将所述第一音频、所述第二音频和所述第三音频融合,生成子音频;将所述调整子视频与对应的所述子音频关联;在所述目标视频播放至某一所述调整子视频范围时,根据对应所述子音频进行解说。本申请的提高用户的观看体验有益效果。
技术关键词
解说方法 视音频 解说系统 音频特征 视觉特征 场景 模板 拼接单元 视频分析 终端 模块 存储器 周期性 误差 程序 图像 风格 处理器
系统为您推荐了相关专利信息
1
基于多模态感知的中低压配电设备精确位置定位方法
低压配电设备 位置定位方法 关键点特征 原型 视觉特征
2
一种针对电力行业的复杂表格结构识别方法、系统、设备及介质
结构识别方法 图像结构 布局特征 融合视觉特征 区域特征提取
3
一种基于AI数字人的智能录课系统及其工作方法
录课系统 视频采集模块 图像处理模块 人工智能信息技术 图像数据处理
4
一种大语言模型辅助的跨模态医学数据哈希检索方法
哈希检索方法 大语言模型 汉明距离 报告 医学图像模态
5
一种多模态数据标注方法
数据标注方法 视觉特征 关键字 锚点 时序特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号