一种内容生成方法、装置、设备、存储介质及产品

正文

推荐专利

申请号：CN202411936117

申请日期：2024-12-25

公开号：CN119763121A

公开日期：2025-04-04

类型：发明专利

摘要

本发明公开了一种内容生成方法、装置、设备、存储介质及产品，该方法包括：将目标图像和目标提示文本输入到训练完成的多模态语言模型中；通过多模态语言模型中的至少两个视觉编码器，对目标图像分别进行视觉编码得到至少两个视觉编码特征，并通过多模态语言模型中的特征融合模块，对至少两个视觉编码特征进行特征融合得到视觉融合特征；通过多模态语言模型中的文本特征网络，对目标提示文本进行文本编码得到文本编码特征；将视觉融合特征和文本编码特征输入到多模态语言模型中的内容输出网络中，得到输出的与多模态数据对应的响应文本内容，提高了多模态语言模型对视觉信息的表达能力，从而提高了多模态语言模型的准确度。

技术关键词

内容生成方法多模态文本编码特征融合特征编码模块层级视觉特征网络拼接单元内容生成装置图像数据输入模块处理器可读存储介质计算机程序产品

系统为您推荐了相关专利信息

一种基于红外热图和汽车诊断的智能AI检测方法

AI检测方法电池模组动态关联模型电控单元故障案例库

一种基于问题分解与社区语义搜索的智能问答系统及方法

智能问答系统实体答案语义知识图谱构建

基于多模态图像的经皮腰椎间盘穿刺手术导航方法及装置

腰椎间盘穿刺手术导航方法多模态注意力图像分割模型

一种模型风险评估方法、装置、电子设备及存储介质

文本生成语音生物特征信息标识符风险评估方法

模型蒸馏方法，装置、设备及存储介质

学生模型蒸馏方法自然语言子模块文本

一种内容生成方法、装置、设备、存储介质及产品

站点导航

APP 下载