基于图像输入与大模型组合的资料分析问题生成方法

正文

推荐专利

申请号：CN202510683138

申请日期：2025-05-26

公开号：CN120632138A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了基于图像输入与大模型组合的资料分析问题生成方法，包括如下步骤：S1、获取原始图像数据，并进行预处理；S2、构建基于Qwen‑VL架构的视觉语言模型，并进行双向对齐生成视觉特征向量；S3、构造提示词模板，并通过交叉注意力机制进行融合，生成结构化文本描述；S4、构建基于Transformer架构的大语言模型，并采用LoRA方法进行监督微调，生成资料分析问题候选序列；S5、进行语义一致性检测与结构规则匹配，剔除不满足语义规范或结构约束的序列；S6、构建图文对齐三元组，并写入JSON格式的数据结构中进行编码存储。本发明能够将图像转化为资料分析问题，显著提升文本生成的质量与效率。

技术关键词

生成方法文本资料图像特征向量原始图像数据序列交叉注意力机制一致性检测语义视觉矩阵图像编码生成上下文感知图文多头注意力机制前馈神经网络

系统为您推荐了相关专利信息

视频生成方法、装置、电子设备及存储介质

文本视频生成方法显示产品信息序列控件

基于业务智能体的客服回复方法、装置及设备

回复方法客服语义相关度数据客户端

用于模型评估的方法、装置、设备、存储介质和程序产品

文本机器学习模型度量序列样本

大模型评测方法、系统、介质与设备

模型评测方法动态职业数据文本

艺术字生成方法和装置、电子设备及存储介质

艺术字生成方法字体风格结构特征提取图像编码器

基于图像输入与大模型组合的资料分析问题生成方法

站点导航

APP 下载