内容生成方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510788245

申请日期：2025-06-12

公开号：CN120673039A

公开日期：2025-09-19

类型：发明专利

摘要

本申请公开了一种内容生成方法、装置、设备、存储介质及程序产品，涉及大语言模型视觉感知技术领域，该方法包括：获取图像数据以及图像数据对应的问题信息；利用目标生成式模型识别问题信息的语义特征，按照语义特征在图像数据中定位问题信息对应的视觉区域；利用目标生成式模型识别视觉区域中的视觉信息，按照视觉信息生成与问题信息相匹配的目标文本内容；其中，目标生成式模型是基于视觉重现和多模态信息训练生成的。通过实施本公开技术方案，能够充分识别图像数据中的视觉特征，提升视觉信息的处理能力，结合语义特征以及视觉信息进行内容生成的推理，实现了多模态数据的有效整合，从而提升了内容生成效果。

技术关键词

内容生成方法样本语义特征视觉特征语义标签图像数据检测损失视觉感知技术内容生成装置文本多模态特征可读存储介质生成答案大语言模型指令计算机程序产品

系统为您推荐了相关专利信息

一种高斯引导跨模态学习的视频问答定位方法与系统

视频帧特征跨模态学习时序特征融合特征定位方法

语音情感识别方法、装置、设备及存储介质

语音特征语音情感识别方法曲线语音情感识别装置分类器

一种基于多分辨率图文融合的单目视频高斯人体化身方法

化身方法多分辨率特征视频图文视觉特征

一种基于拉曼光谱的水产品药物残留检测方法及系统

水产品药物残留拉曼光谱数据机器学习算法支持向量回归模型修正算法

一种基于拉曼光谱的肌纤维类型分析方法、系统、设备及介质

长短期记忆网络分析方法拉曼光谱数据编码拉曼光谱技术

内容生成方法、装置、设备、存储介质及程序产品

站点导航

APP 下载