摘要
本公开提供了一种基于多模态的数据解析方法、装置、设备及存储介质,涉及人工智能领域,尤其涉及大模型和图像处理领域。具体实现方案为:获取待解析图像;其中,所述待解析图像中含有结构化数据;对所述待解析图像进行特征提取处理,得到所述待解析图像的图像特征向量;其中,所述图像特征向量表征待解析图像中的结构化数据;根据所述图像特征向量和预设的提示词信息,确定所述待解析图像的解析结果;其中,所述预设的提示词信息为表征预设语法结构的文本数据,所述解析结果表征以预设语法结构所表达的结构化数据。通过结合结构化数据相关的图像模态数据和文本模态数据,提高结构化数据解析的准确性。
技术关键词
图像特征向量
视觉特征
训练特征
语法结构
视觉字典
数据解析方法
网络表征
文本
多模态
数据解析装置
分辨率
计算机程序产品
解析单元
处理器通信
系统为您推荐了相关专利信息
神经网络模型
文本
网约车服务
特征工程
神经网络预测模型
机械臂关节
智能抓取
语言编码器
语义向量
多模态
检测模型构建方法
天基平台
空中平台
图像编码器
病虫害检测方法
大坝
视觉摄像头
数据处理计算机
麦克风阵列
雷达点云数据
服务机器人
视角
抓取方法
检测网络模型
机器人抓取