摘要
本发明公开了一种基于大语言模型的word文档问答方法及系统,属于人工智能技术领域,该方法的实现包括:在对文档进行预处理时,记录图片内容在原文档中的位置,利用多模态模型描述并解读图片内容后,将多模态模型返回的解读结果插入到图片原位置中;在对话阶段根据文档长度采用不同的处理机制:当文档为token数超过阈值的长篇幅文档,将文档分块、向量化后存入向量数据库,并启用RAG机制;而对于文档token数未达到阈值的短篇幅文档,则采用遍历分块的方式进行问答。本发明能够提升文档问答系统的准确性和用户体验;并能避免对短文档进行不必要的向量化和数据库存储,提高了处理效率。
技术关键词
大语言模型
图片
问答方法
分块
表格
多模态
机器可读程序
标记
问答系统
语义
机制
问答装置
文本
阶段
人工智能技术
计算机
答案
格式
变量
处理器