摘要
本发明公开了一种基于大模型的智能问答方法及系统,包括:获取原始文档,对原始文档进行数据解析、识别、转换以及向量化,构建向量知识库;获取用户问题并进行向量化,转为高维向量表示;基于向量化后的用户问题和向量知识库,采用语义匹配和关键词匹配的混合检索方法进行初步的多段文本召回,得到候选文本列表;使用rerank模型进行重排序,将初步筛选出的文本列表进行重排序,获得按照得分从高到低的更准确的文本列表;将用户的问题和文本匹配的文本列表根据阈值过滤后一同发送给大模型,获得回答。有效提高大数据量向量知识库的匹配准确度,以解决现有技术中难以精准构建向量知识库和知识库增大而导致的语义匹配准确度下降的问题。
技术关键词
文本
混合检索方法
智能问答方法
列表
关键词
解析工具
语义
智能问答系统
模块
词频统计
分词
处理器
计算机设备
数据
可读存储介质
频率
格式
存储器
资料
图片
系统为您推荐了相关专利信息
时序遥感数据
预训练语言模型
文本
地表特征
图像