摘要
本发明公开了一种基于大语言模型的数字媒体作品自动化生成方法,包括如下步骤:S1、接收用户输入的文本描述,利用DeepSeek大语言模型解析文本信息;S2、确定目标模态并选择对应生成模型;S3、构建生成输入;S4、将生成输入传入改进的VQ‑VAE‑2模型,模型融合长短时记忆网络和循环自编码器以处理时序数据;S5、通过自适应离散空间和变分推理方法动态调整潜在空间分布;S6、使用DeepSeek模型对生成内容进行语义一致性检查;S7、根据一致性结果优化生成输出;S8、输出图像、视频或音频作品。本发明实现了语言驱动的多模态内容生成与语义控制。
技术关键词
自动化生成方法
大语言模型
编码器模块
网络模块
推理方法
媒体
图像
解码器
风格
生成音频内容
数据
时序
视频生成模型
文本
主题
神经网络结构
语义
系统为您推荐了相关专利信息
关系推理方法
特征提取模型
节点
矩阵
正则化方法
接口方法
文件系统
静态分析技术
列表
AIDL文件
驾驶场景数据
驾驶评价方法
大语言模型
驾驶评价系统
多模态
翻译模型
大语言模型
信息访问请求
信息翻译方法
矩阵