摘要
本发明涉及一种基于大语言模型的专业检索方法,包括:收集需要处理的文本数据,对所述文本数据进行预处理;利用大语言模型对预处理后的文本数据进行训练和微调,并针对训练后的所述大语言模型的检索结果预生成对应的问题;将所述预生成的对应问题作为训练数据,所述检索结果作为训练标签,训练小型模型以推理用户输入检索问题的语义和意图,以匹配预生成的问答对;当用户输入所述检索问题时,所述小型模型快速匹配所述预生成的问答对给出结果,若无法匹配获得所述预生成的问答对,则标记为待优化,本方案实现了高检索效率,并且在提升专业领域的检索准确性的同时规避了敏感的问答内容。
技术关键词
大语言模型
文本
检索方法
存储计算机程序
数据
语义
专业
朴素贝叶斯
标签
可读存储介质
意图
神经网络模型
检索系统
计算机程序产品
处理器
模块
存储器
电子设备
分词
指令
系统为您推荐了相关专利信息
存储算法
压缩存储方法
存储模块
处理单元
结构网络
虚拟仿真软件
数控系统
虚拟机床
数据通讯模块
硬件设备
汽车充电站
预测误差
概率预测方法
时间段
时序预测模型
报告自动生成方法
数据接口
智能客服系统
人机交互界面
模板