文档快照信息抽取方法、装置、设备及存储介质

AITNT
正文
推荐专利
文档快照信息抽取方法、装置、设备及存储介质
申请号:CN202411512999
申请日期:2024-10-28
公开号:CN119358678A
公开日期:2025-01-24
类型:发明专利
摘要
本申请公开了一种文档快照信息抽取方法、装置、设备及存储介质,涉及多模态学习技术领域,包括:获取预设图文对数据集,对预训练模型进行自回归训练,得到训练成功的预训练模型;提取训练成功的预训练模型的网络结构作为新词表网络结构,对预设多模态大模型的原始词表网络结构进行更新,确定更新后的预设多模态大模型;获取预设视觉问答数据集以及用户输入的第一信息抽取指令,对更新后的预设多模态大模型进行微调,得到微调结束的预设多模态大模型;接收用户输入的目标文档快照以及第二信息抽取指令,得到微调后的预设多模态大模型输出的信息抽取结果。本申请能够提高复杂文档快照中信息抽取的准确性。
技术关键词
预训练模型 多模态 信息抽取方法 图像嵌入 网络结构 大语言模型 快照 数据 文本 图文 图表 指令 视觉 信息抽取设备 抽取装置 生成文档 参数 表格 编辑
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号