基于AI语音合成与动画驱动的讲师视频自动生成方法

正文

推荐专利

申请号：CN202510989167

申请日期：2025-07-17

公开号：CN120897102A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于AI语音合成与动画驱动的讲师视频自动生成方法，包括：通过改进的内点方法和增量最短路径算法对PPT或文本脚本进行结构化解析；应用全动态并行单链接聚类算法进行语义分组并生成带表现力标记的增强脚本；利用CosyVoice技术结合低秩逼近方法生成高质量语音数据流；通过语义分析建立内容与动作表情的映射关系，生成完整的动作表情指令集；利用museTalk技术驱动数字人模型并通过并行渲染算法生成最终的讲师教学视频。本发明实现了教育视频的高效自动化生成，显著提高了内容制作效率，降低了制作成本，同时保证了教学视频的专业性和表现力。

技术关键词

动作表情增量最短路径视频自动生成方法脚本语义理解模型时间同步序列动画 AI语音渲染算法语义结构聚类算法标记面部协调算法场景视觉文本

基于AI语音合成与动画驱动的讲师视频自动生成方法

站点导航

APP 下载