一种基于多模态视听模块的舞蹈生成系统

正文

推荐专利

一种基于多模态视听模块的舞蹈生成系统

申请号：CN202511114574

申请日期：2025-08-11

公开号：CN120956990A

公开日期：2025-11-14

类型：发明专利

摘要

本申请涉及多模态音视频内容生成领域，公开了一种基于多模态视听模块的舞蹈生成系统，包括：输入处理模块用于接收音频和视频输入，分别提取音频的节奏、频谱和音调特征，以及视频的动作关节点和时序特征；同步生成模块通过动态优化方法，根据音频特征和视频特征的匹配度生成音视频同步的舞蹈动作；校正检测模块检测音视频内容的同步误差，并优化视频帧的时间戳；存储分发模块将校正优化后的音视频内容存储，并通过单播或多播方式分发至用户终端；用户交互模块接收用户输入的舞蹈生成参数，以动态调整音视频同步生成过程。本发明实现了音视频的精准同步生成，支持个性化内容定制和高效分发，广泛适用于在线教育、娱乐、虚拟现实等多媒体应用场景。

技术关键词

音频特征生成系统动态优化方法多模态动态时间规整算法视听舞蹈生成方法分发模块时序特征生成参数关节点校正人体姿态估计算法同步性分布式存储单元对音视频

系统为您推荐了相关专利信息

基于扩散模型的多模态内容生成AI模型构建方法及装置

模型构建方法子模块模态特征多模态文本

一种基于混合精度量化的多模态模型轻量化部署方法

多模态语言模块视觉特征精度电子设备

一种用于大落差地区的高程数据测量方法及装置、设备

数据测量方法区域环境数据测量点校正水准仪

一种智能消防机器人的火源探测识别并报警系统及方法

智能消防机器人多模态传感器报警管理模块报警系统卡尔曼滤波算法

数字化制造平台的协同调度方法、装置及设备

协同调度方法模拟单元神经网络模型稀疏特征向量矩阵

一种基于多模态视听模块的舞蹈生成系统

站点导航

APP 下载