基于大模型的多模态智能问答系统及构建方法、装置

正文

推荐专利

申请号：CN202411851025

申请日期：2024-12-16

公开号：CN119783819A

公开日期：2025-04-08

类型：发明专利

摘要

本申请提供一种基于大模型的多模态智能问答系统及构建方法、装置，该方法包括：对PDF文档进行区域识别，得到表格区域图片、文字区域图片和/或图像区域图片；对Word文档进行解析，得到Word文档的段落内容，段落内容是由第一文本、表格数据和/或Word图片构成的；构建知识库；其中，知识库中包括文档切片的向量表示；文档切片是基于表格区域图片、文字区域图片和/或图像区域图片确定的，或者，文档切片是基于段落内容及其对应的章节信息确定的。可见，本申请可以对PDF文档进行版面识别，还可以对Word文档进行目录章节的识别，基于此构建知识库，可以提升多模态文本问答召回的语义完整性和连贯性，提升回答准确性。

技术关键词

表格智能问答系统图片切片大语言模型坐标列表图像多模态 FAQ问答文本检测模型目录分段合并单元格标签关系生成答案摘要

系统为您推荐了相关专利信息

一种基于大语言模型的小说影视化分镜生成方法

大语言模型生成方法场景文本动态更新

一种防商户盗刷的电子券核销方法以及系统

电子券管理核销方法条形码图片扫码枪

一种基于上下文协议的连续反应器优化方法、装置、设备、介质及产品

连续反应器计算机程序指令语义角色策略自然语言

一种基于CA-GAN的岩石体纹理合成方法及系统

纹理生成对抗网络采样模块注意力机制卷积模块

一种基于全景化服务的电子档案单套制管理方法及系统

因子管理方法编辑电子备份

基于大模型的多模态智能问答系统及构建方法、装置

站点导航

APP 下载