摘要
本发明属于文本问答领域,涉及一种基于混合上下文压缩技术的大语言模型长文本问答方法与系统。该方法包括:进行文档解析与预处理,将非结构化的原始文本转换为规范化的文本段落集合;基于大语言模型将长文本问答场景的问题进行分类;根据问题类型和预处理后的文本,自适应选择最适合的上下文压缩方法对长文本进行压缩,得到压缩后的上下文;利用压缩后的上下文,基于大语言模型生成问题的答案。本发明综合了两种上下文压缩技术的优势,有效解决了大语言模型处理长文本的上下文窗口限制问题,在降低压缩技术的计算资源消耗和处理延迟的同时,保持了高质量的问答性能,缓解了单一压缩方法在不同类型问题上的局限性。
技术关键词
大语言模型
问答场景
文本段落
问答方法
存储计算机程序
语义
答案
可读存储介质
语句
问答系统
格式
计算机设备
关系
模块
存储器
链条
处理器
编码器