摘要
本发明属于人工智能大模型技术领域,公开了一种图文混合输出的大模型RAG检索方法及系统。该方法对原始文档语料进行预处理,生成语料树,并对图、表等语料进行处理,生成键值对存储到数据库中;对问答语句生成词向量,并与语料树进行检索,找到最相关的语料;将最相关的语料拼接成prompt,然后传送给文本大语音模型;问答大模型输出相关结果;基于文本大语音模型输出的结果,检索替换结果中的图、表的键信息,生成最终的问答结果。本发明解决了现有技术难以处理这种包含文本、图片、图表数据的资料的问题,生成了准确度高的最终的问答结果。
技术关键词
检索方法
FastText算法
图文
混合聚类算法
节点
文本
中文分词
语句
大语言模型
语音
图表
离散余弦变换
表达式
键值
图像
表格
检索系统
数据
拼接模块
系统为您推荐了相关专利信息
高斯混合模型
概率潮流计算方法
电力系统潮流
概率密度函数
有功功率
电子电气系统
三维环境模型
车载传感器
管理器
控制模块
动态报表生成方法
项目关联矩阵
多模态
图表
数据标签