摘要
本发明涉及计算机视觉技术领域,公开一种多模态信息抽取指令数据集的构建方法、抽取模型及抽取方法。构建方法包括:针对不同模态数据根据抽取任务设计不同提示词模板;发送信息抽取请求,调用开源多模态大模型以获取多模态数据的实体、关系、属性、事件信息;运行提示词模板的执行程序,输出初始Json结果;筛选出符合标准的Json结果为初筛Json结果;从初筛Json结果中筛选出符合标准的Json结果为校核后的Json结果,由多模态数据对应的多个校核后的Json结果构成多模态信息抽取指令数据集。多模态信息抽取模型应用多模态信息抽取指令数据集且基于有监督指令微调训练获得。本发明能纾解多模态信息抽取指令数据集不足及多模态大模型幻觉问题,提高多模态信息抽取的准确率。
技术关键词
多模态信息
信息抽取模型
文本编码器
数据
模板
指令
信息抽取方法
分布式空间
多层注意力
计算机视觉技术
实体
大语言模型
视觉特征
关系
格式
关键帧
系统为您推荐了相关专利信息
服务器集群
协同系统
优先级管理系统
分布式缓存技术
电厂设备
模版
训练深度神经网络
组装结构
嵌段共聚物材料
光刻模型
雷达回波数据
森林火灾监测方法
时空分布特征
火势蔓延速度
构建机器学习模型