基于多模态的音乐视频生成视频彩铃的方法

正文

推荐专利

基于多模态的音乐视频生成视频彩铃的方法

申请号：CN202410732067

申请日期：2024-06-06

公开号：CN118524174A

公开日期：2024-08-20

类型：发明专利

摘要

本发明公开了一种基于多模态的音乐视频生成视频彩铃的方法，包括以下步骤：S10，对输入的视频数据进行预处理，所述预处理包括视频和音频分离以及音频重采样；S20，对重采样后的音频文件进行音频特征提取，基于提取的音频特征，利用自相似性和动态规划算法自动识别和定位音频中的副歌段落；S30，将副歌部分对应的视频内容调整为竖屏格式；S40，将视频文件进行抽帧，使用OCR技术识别视频中的字幕文本，并通过图像处理技术擦除字幕；S50，将视频内容进行超分辨率处理，得到高分辨率的视频文件。

技术关键词

音频特征提取动态规划算法多模态全局运动估计方法音乐视频稳定技术动态规划搜索图像处理技术超分辨率关键帧内容字幕 MFCC特征命令行工具离散余弦变换格式视角

系统为您推荐了相关专利信息

基于多目标强化学习的焚烧污染协同控制方法

协同控制方法协同优化控制 X射线荧光分析仪强化学习框架动态权重分配

一种基于大数据的烧伤病房感染防控智能预警系统

智能预警系统烧伤病房环境监测数据长短期记忆网络大数据

一种基于生物多模态的移动终端智能身份识别方法及系统

生物识别特征身份识别方法指纹特征面部特征虹膜特征

基于人工智能的空地协同白蚁检测自适应路径规划方法

路径规划方法空地协同空中平台搜索算法障碍物

一种商品的智能分类管理方法及系统

分类管理方法深度视觉特征细粒度分类商品知识图谱分类管理系统

基于多模态的音乐视频生成视频彩铃的方法

站点导航

APP 下载