基于多模态大模型平台的内容生成方法、装置及设备

正文

推荐专利

申请号：CN202510824183

申请日期：2025-06-19

公开号：CN120654196A

公开日期：2025-09-16

类型：发明专利

摘要

本申请涉及内容生成相关技术领域，具体涉及一种基于多模态大模型平台的内容生成方法、装置及设备。其中，方法包括：获取多模态数据；所述多模态数据包括：文本数据、图片数据、视频数据；基于预设的编码器将所述文本数据、图片数据、视频数据统一编码为潜在向量，并基于Transformer进行对齐和关联，得到多模态特征；基于多头自注意力机制，融合多模态特征，得到目标特征；将所述目标特征输入预设的多模态生成器，输出多模态内容；其中，所述多模态内容包括：文本内容、图片内容、视频内容；其中，运行多模态生成器功能的设备，通过智能预测负载和任务需求，实时优化GPU、内存的资源分配，确保高优先级任务快速完成；对多模态内容进行内容优化、质量评估。

技术关键词

内容生成方法融合多模态特征数据文本视频图片注意力机制平台资源分配内容生成装置编码器处理器可读存储介质内存输出模块存储器

系统为您推荐了相关专利信息

一种基于图像的隧道病害识别系统、方法及其便携式设备

隧道病害识别系统 Hessian矩阵便携式设备数据储存模块无线通信模块

基于加密算法的数据安全传输方法

数据安全传输方法加密算法数据加密传输技术数值标记

一种基于无人机巡航的移动车辆过桥定位方法和装置

移动车辆定位方法坐标系过桥静态特征

基于人工智能的无线充电设备故障检测方法及系统

无线充电设备路径特征故障检测方法时间序列模式动态时间规整算法

空域参数优化方法、装置及电子设备

参数优化方法无人机邻域搜索算法非易失性存储介质样本

基于多模态大模型平台的内容生成方法、装置及设备

站点导航

APP 下载