摘要
本发明涉及计算机视觉技术领域,公开一种多模态信息抽取指令数据集的构建方法、抽取模型及抽取方法。构建方法包括:针对不同模态数据根据抽取任务设计不同提示词模板;发送信息抽取请求,调用开源多模态大模型以获取多模态数据的实体、关系、属性、事件信息;运行提示词模板的执行程序,输出初始Json结果;筛选出符合标准的Json结果为初筛Json结果;从初筛Json结果中筛选出符合标准的Json结果为校核后的Json结果,由多模态数据对应的多个校核后的Json结果构成多模态信息抽取指令数据集。多模态信息抽取模型应用多模态信息抽取指令数据集且基于有监督指令微调训练获得。本发明能纾解多模态信息抽取指令数据集不足及多模态大模型幻觉问题,提高多模态信息抽取的准确率。
技术关键词
多模态信息
信息抽取模型
文本编码器
数据
模板
指令
信息抽取方法
分布式空间
多层注意力
计算机视觉技术
实体
大语言模型
视觉特征
关系
格式
关键帧
系统为您推荐了相关专利信息
手势识别模型
识别方法
采集手势数据
压缩算法
手势识别系统
隐私数据保护方法
隐私风险评估
可信执行环境
加密数据
拉普拉斯噪声
混合型超级电容器
均衡管理系统
模组
中央控制器
热管理系统