多模态信息抽取指令数据集的构建方法、抽取模型及抽取方法

正文

推荐专利

申请号：CN202510357903

申请日期：2025-03-25

公开号：CN120296384B

公开日期：2025-12-02

类型：发明专利

摘要

本发明涉及计算机视觉技术领域，公开一种多模态信息抽取指令数据集的构建方法、抽取模型及抽取方法。构建方法包括：针对不同模态数据根据抽取任务设计不同提示词模板；发送信息抽取请求，调用开源多模态大模型以获取多模态数据的实体、关系、属性、事件信息；运行提示词模板的执行程序，输出初始Json结果；筛选出符合标准的Json结果为初筛Json结果；从初筛Json结果中筛选出符合标准的Json结果为校核后的Json结果，由多模态数据对应的多个校核后的Json结果构成多模态信息抽取指令数据集。多模态信息抽取模型应用多模态信息抽取指令数据集且基于有监督指令微调训练获得。本发明能纾解多模态信息抽取指令数据集不足及多模态大模型幻觉问题，提高多模态信息抽取的准确率。

技术关键词

多模态信息信息抽取模型文本编码器数据模板指令信息抽取方法分布式空间多层注意力计算机视觉技术实体大语言模型视觉特征关系格式关键帧

系统为您推荐了相关专利信息

一种基于改进DETR的面向无人机图像的小目标检测方法

面向无人机混合编码器无人机图像处理蒸馏数据采集策略

一种基于多通道特征融合的线结构光中心线提取方法

多通道特征融合中心线提取方法像素线结构光面积统计方法

一种基于分布式计算的预测控制方法、系统、设备及介质

变量预测控制方法代表节点决策

一种具备智能匹配功能的自动派单系统

自动派单系统数据采集模块客户关系管理系统数据分析模块机器学习算法

一种智能流化床气流粉碎机

流化床气流粉碎机分级叶轮滚动时域控制物料粉碎分级设备粒子群算法

多模态信息抽取指令数据集的构建方法、抽取模型及抽取方法

站点导航

APP 下载