基于图像输入与大模型组合的资料分析问题生成方法

AITNT
正文
推荐专利
基于图像输入与大模型组合的资料分析问题生成方法
申请号:CN202510683138
申请日期:2025-05-26
公开号:CN120632138A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了基于图像输入与大模型组合的资料分析问题生成方法,包括如下步骤:S1、获取原始图像数据,并进行预处理;S2、构建基于Qwen‑VL架构的视觉语言模型,并进行双向对齐生成视觉特征向量;S3、构造提示词模板,并通过交叉注意力机制进行融合,生成结构化文本描述;S4、构建基于Transformer架构的大语言模型,并采用LoRA方法进行监督微调,生成资料分析问题候选序列;S5、进行语义一致性检测与结构规则匹配,剔除不满足语义规范或结构约束的序列;S6、构建图文对齐三元组,并写入JSON格式的数据结构中进行编码存储。本发明能够将图像转化为资料分析问题,显著提升文本生成的质量与效率。
技术关键词
生成方法 文本 资料 图像特征向量 原始图像数据 序列 交叉注意力机制 一致性检测 语义 视觉 矩阵 图像编码 生成上下文感知 图文 多头注意力机制 前馈神经网络
系统为您推荐了相关专利信息
1
视频生成方法、装置、电子设备及存储介质
文本 视频生成方法 显示产品信息 序列 控件
2
基于业务智能体的客服回复方法、装置及设备
回复方法 客服 语义相关度 数据 客户端
3
用于模型评估的方法、装置、设备、存储介质和程序产品
文本 机器学习模型 度量 序列 样本
4
大模型评测方法、系统、介质与设备
模型评测方法 动态 职业 数据 文本
5
艺术字生成方法和装置、电子设备及存储介质
艺术字生成方法 字体 风格 结构特征提取 图像编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号