基于多模态的音乐视频生成视频彩铃的方法

AITNT
正文
推荐专利
基于多模态的音乐视频生成视频彩铃的方法
申请号:CN202410732067
申请日期:2024-06-06
公开号:CN118524174A
公开日期:2024-08-20
类型:发明专利
摘要
本发明公开了一种基于多模态的音乐视频生成视频彩铃的方法,包括以下步骤:S10,对输入的视频数据进行预处理,所述预处理包括视频和音频分离以及音频重采样;S20,对重采样后的音频文件进行音频特征提取,基于提取的音频特征,利用自相似性和动态规划算法自动识别和定位音频中的副歌段落;S30,将副歌部分对应的视频内容调整为竖屏格式;S40,将视频文件进行抽帧,使用OCR技术识别视频中的字幕文本,并通过图像处理技术擦除字幕;S50,将视频内容进行超分辨率处理,得到高分辨率的视频文件。
技术关键词
音频特征提取 动态规划算法 多模态 全局运动估计方法 音乐 视频稳定技术 动态规划搜索 图像处理技术 超分辨率 关键帧内容 字幕 MFCC特征 命令行工具 离散余弦变换 格式 视角
系统为您推荐了相关专利信息
1
基于多目标强化学习的焚烧污染协同控制方法
协同控制方法 协同优化控制 X射线荧光分析仪 强化学习框架 动态权重分配
2
一种基于大数据的烧伤病房感染防控智能预警系统
智能预警系统 烧伤病房 环境监测数据 长短期记忆网络 大数据
3
一种基于生物多模态的移动终端智能身份识别方法及系统
生物识别特征 身份识别方法 指纹特征 面部特征 虹膜特征
4
基于人工智能的空地协同白蚁检测自适应路径规划方法
路径规划方法 空地协同 空中平台 搜索算法 障碍物
5
一种商品的智能分类管理方法及系统
分类管理方法 深度视觉特征 细粒度分类 商品知识图谱 分类管理系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号