多模态信息抽取指令数据集的构建方法、抽取模型及抽取方法

AITNT
正文
推荐专利
多模态信息抽取指令数据集的构建方法、抽取模型及抽取方法
申请号:CN202510357903
申请日期:2025-03-25
公开号:CN120296384B
公开日期:2025-12-02
类型:发明专利
摘要
本发明涉及计算机视觉技术领域,公开一种多模态信息抽取指令数据集的构建方法、抽取模型及抽取方法。构建方法包括:针对不同模态数据根据抽取任务设计不同提示词模板;发送信息抽取请求,调用开源多模态大模型以获取多模态数据的实体、关系、属性、事件信息;运行提示词模板的执行程序,输出初始Json结果;筛选出符合标准的Json结果为初筛Json结果;从初筛Json结果中筛选出符合标准的Json结果为校核后的Json结果,由多模态数据对应的多个校核后的Json结果构成多模态信息抽取指令数据集。多模态信息抽取模型应用多模态信息抽取指令数据集且基于有监督指令微调训练获得。本发明能纾解多模态信息抽取指令数据集不足及多模态大模型幻觉问题,提高多模态信息抽取的准确率。
技术关键词
多模态信息 信息抽取模型 文本编码器 数据 模板 指令 信息抽取方法 分布式空间 多层注意力 计算机视觉技术 实体 大语言模型 视觉特征 关系 格式 关键帧
系统为您推荐了相关专利信息
1
一种基于改进DETR的面向无人机图像的小目标检测方法
面向无人机 混合编码器 无人机图像处理 蒸馏 数据采集策略
2
一种基于多通道特征融合的线结构光中心线提取方法
多通道特征融合 中心线提取方法 像素 线结构光 面积统计方法
3
一种基于分布式计算的预测控制方法、系统、设备及介质
变量 预测控制方法 代表 节点 决策
4
一种具备智能匹配功能的自动派单系统
自动派单系统 数据采集模块 客户关系管理系统 数据分析模块 机器学习算法
5
一种智能流化床气流粉碎机
流化床气流粉碎机 分级叶轮 滚动时域控制 物料粉碎分级设备 粒子群算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号