摘要
本发明涉及人工智能与计算机科学领域。本发明公开了一种基于跨模态大模型的创意内容生成系统及方法,其包括输入模块,输入模块用于接收来自用户的多种模态创意输入信息;跨模态大模型处理模块,包括文本特征提取子模块、图像特征提取子模块、提音频特征提取子模块及跨模态融合子模块,文本特征提取子模块、图像特征提取子模块及音频特征提取子模块提取的特征通过跨模态融合子模块进行融合;输出模块,输出模块依据跨模态大模型处理模块的运算结果,输出模块生成相应的创意内容。本发明的系统,在用户输入明确需求后,通过自动化的跨模态处理和生成流程,仅需数小时即可生成初稿,经过简单人工微调就能交付使用,缩短创作周期,提高效率。
技术关键词
跨模态
内容生成系统
内容生成方法
子模块
音频特征提取
图像特征提取
文本
输出模块
输入模块
预训练语言模型
数据
视频剪辑技术
深度语义分析
图像特征向量
阶段
命名实体识别
脚本