一种基于大语言模型的word文档问答方法及系统

正文

推荐专利

申请号：CN202510544474

申请日期：2025-04-28

公开号：CN120470086A

公开日期：2025-08-12

类型：发明专利

摘要

本发明公开了一种基于大语言模型的word文档问答方法及系统，属于人工智能技术领域，该方法的实现包括：在对文档进行预处理时，记录图片内容在原文档中的位置，利用多模态模型描述并解读图片内容后，将多模态模型返回的解读结果插入到图片原位置中；在对话阶段根据文档长度采用不同的处理机制：当文档为token数超过阈值的长篇幅文档，将文档分块、向量化后存入向量数据库，并启用RAG机制；而对于文档token数未达到阈值的短篇幅文档，则采用遍历分块的方式进行问答。本发明能够提升文档问答系统的准确性和用户体验；并能避免对短文档进行不必要的向量化和数据库存储，提高了处理效率。

技术关键词

大语言模型图片问答方法分块表格多模态机器可读程序标记问答系统语义机制问答装置文本阶段人工智能技术计算机答案格式变量处理器

一种基于大语言模型的word文档问答方法及系统

站点导航

APP 下载