基于大模型的多模态智能问答系统及构建方法、装置

AITNT
正文
推荐专利
基于大模型的多模态智能问答系统及构建方法、装置
申请号:CN202411851025
申请日期:2024-12-16
公开号:CN119783819A
公开日期:2025-04-08
类型:发明专利
摘要
本申请提供一种基于大模型的多模态智能问答系统及构建方法、装置,该方法包括:对PDF文档进行区域识别,得到表格区域图片、文字区域图片和/或图像区域图片;对Word文档进行解析,得到Word文档的段落内容,段落内容是由第一文本、表格数据和/或Word图片构成的;构建知识库;其中,知识库中包括文档切片的向量表示;文档切片是基于表格区域图片、文字区域图片和/或图像区域图片确定的,或者,文档切片是基于段落内容及其对应的章节信息确定的。可见,本申请可以对PDF文档进行版面识别,还可以对Word文档进行目录章节的识别,基于此构建知识库,可以提升多模态文本问答召回的语义完整性和连贯性,提升回答准确性。
技术关键词
表格 智能问答系统 图片 切片 大语言模型 坐标 列表 图像 多模态 FAQ问答 文本检测模型 目录 分段 合并单元格 标签 关系 生成答案 摘要
系统为您推荐了相关专利信息
1
一种基于大语言模型的小说影视化分镜生成方法
大语言模型 生成方法 场景 文本 动态更新
2
一种防商户盗刷的电子券核销方法以及系统
电子券管理 核销方法 条形码 图片 扫码枪
3
一种基于上下文协议的连续反应器优化方法、装置、设备、介质及产品
连续反应器 计算机程序指令 语义角色 策略 自然语言
4
一种基于CA-GAN的岩石体纹理合成方法及系统
纹理 生成对抗网络 采样模块 注意力机制 卷积模块
5
一种基于全景化服务的电子档案单套制管理方法及系统
因子 管理方法 编辑 电子 备份
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号