摘要
本发明公开一种基于业务关键信息引导的检索增强生成方法。首先利用大模型对用户的问题进行改写和重构,将其转写成包含原始问题语义信息和对应业务关键信息的新问题;然后用新的问题去定位到相关文档页面,并采用视觉化驱动的方式对相关文档页面进行文本分块;在此基础上,利用向量检索工具对用户问题和分块后的文本进行检索;最后选择检索到的前K个最相关文本块作为提示输入,供大模型生成最终答案。本发明的文本分块方式保留了原始文档的语义结构,而且利用业务关键信息定位相关文档页面的方式缩小了检索的范围,从而提高了文档的召回率。本发明可为真实场景中的检索增强生成任务提供有价值的参考。
技术关键词
生成方法
文本
分块
布局结构
自然语言转换
关键字
模板
语义结构
解析工具
视觉
关键词
页面内容
索引
编码
答案
字体
分词
目录
系统为您推荐了相关专利信息
问答模型
电话外呼方法
终端设备
自然语言模型
语音
视频摘要生成方法
生成视频摘要
身份
视频摘要生成装置
多场景
页面内容
商品详情页
自动化测试工具
机器翻译
翻译方法