摘要
本发明涉及一种基于AIGC的音乐视频生成方法及系统,包括以下步骤:步骤1、输入音频文件;步骤2、语音表征模型分析音频文件并生成情感标签;步骤3、大语言模型根据情感标签扩充生成形容词集合;步骤4、大语言模型根据情感标签和生成的形容词集合,编写音乐视频剧本;步骤5、运用文本生成视频模型,通过音乐视频剧本生成具体的视频画面;步骤6、对抗神经网络模型对视频画面内容进行情感评估,判断与情感标签是否一致,如果一致则输出最终音乐视频文件,如果不一致则重复步骤3‑6。本发明将多种人工智能技术有机结合,实现了高效、情感契合、视觉丰富的音乐视频生成,具有广阔的应用前景和重要的理论与实践意义。
技术关键词
视频生成方法
音乐
大语言模型
标签
视频生成系统
神经网络模型
情感评估
文本
情感特征
音频
情感识别模型
注意力机制
模块
画面
抽样方法
人工智能技术
语音
处理器
序列
系统为您推荐了相关专利信息
多任务处理系统
时间序列模型
大语言模型
时间序列特征
卫星遥测数据预测
BIM技术
AI摄像头
物品定位系统
监测设备
混凝土振捣
乳腺超声影像
乳腺癌分类
融合多模态特征
预测乳腺癌
编码器
仓储管理方法
终端
仓储管理系统
服务器
温湿度检测装置