一种基于大语言模型的数字媒体作品自动化生成方法

正文

推荐专利

申请号：CN202510927749

申请日期：2025-07-07

公开号：CN120996017A

公开日期：2025-11-21

类型：发明专利

摘要

本发明公开了一种基于大语言模型的数字媒体作品自动化生成方法，包括如下步骤：S1、接收用户输入的文本描述，利用DeepSeek大语言模型解析文本信息；S2、确定目标模态并选择对应生成模型；S3、构建生成输入；S4、将生成输入传入改进的VQ‑VAE‑2模型，模型融合长短时记忆网络和循环自编码器以处理时序数据；S5、通过自适应离散空间和变分推理方法动态调整潜在空间分布；S6、使用DeepSeek模型对生成内容进行语义一致性检查；S7、根据一致性结果优化生成输出；S8、输出图像、视频或音频作品。本发明实现了语言驱动的多模态内容生成与语义控制。

技术关键词

自动化生成方法大语言模型编码器模块网络模块推理方法媒体图像解码器风格生成音频内容数据时序视频生成模型文本主题神经网络结构语义

系统为您推荐了相关专利信息

一种生产线设计参数关联关系推理方法及系统

关系推理方法特征提取模型节点矩阵正则化方法

一种基于AOSP静态分析的Android攻击面探索方法

接口方法文件系统静态分析技术列表 AIDL文件

基于大语言模型的自动驾驶评价方法和装置

驾驶场景数据驾驶评价方法大语言模型驾驶评价系统多模态

一种大模型版权保护方法、装置及存储介质

版权保护方法大语言模型水印检测文本标识符

翻译模型的训练方法、信息翻译方法、系统及相关产品

翻译模型大语言模型信息访问请求信息翻译方法矩阵

一种基于大语言模型的数字媒体作品自动化生成方法

站点导航

APP 下载