摘要
本发明涉及自然语言处理技术领域,特别涉及一种基于模块化检索增强生成的多课程答疑方法及装置,其中,方法包括:根据目标资料范围构建知识与索引分离的多匹配角度课程索引数据库;获取目标提问的检索范围,并根据检索范围确定检索增强生成推理过程的检索查询语句;对目标提问进行重写,以得到重写后的提问;根据重写后的提问和检索查询语句在多匹配角度课程索引数据库中进行检索,以查询目标领域知识;将领域知识与目标提问进行拼接,以得到回答结果。由此,解决了现有检索增强生成RAG的方法局限于优化具有同分布的特定垂直领域问题,即使用相同的工作流处理同一个领域的问题,难以统一处理不同课程/答疑类型对检索增强的不同需求等问题。
技术关键词
答疑方法
索引方式
语义向量
语句
生成知识
嵌入方法
多角度
资料
多标签
知识点
关键词
处理器
拼接模块
转换单元
数据
自然语言
工作流
字段