摘要
本发明提出一种基于大语言模型的企业问答方法,收集企业内部供检索的非结构化文本数据和结构化文本数据;利用预训练的文本向量化模型将文本段块转换为向量存储到向量数据库;在开源大模型的基础上利用LORA微调方法对训练数据进行训练得到问题改写模型;基于SQL生成模型对用户新输入的问题进行预测得到SQL语句,再经过人工校验并重新训练SQL生成模型;利用问题改写模型进行改写得到上下文完整的问题,利用意图识别模型识别问题后得到具体意图,利用实体信息抽取模型获取问题中的实体信息并通过关键词匹配获取宽表的字段,将组合完成的SQL语句查询出具体的数据返回;将RAG召回的文本段块与调用的数据输入开源大模型作为最终结果输出。
技术关键词
意图识别模型
信息抽取模型
大语言模型
问答方法
数据
实体
微调方法
企业
非暂态计算机可读存储介质
语句
非结构化文本
矩阵
关键词
处理器
问答系统
计算机程序产品
元素
系统为您推荐了相关专利信息
参数识别模型
因子
终端设备
全局最优化
可读存储介质
烟火识别方法
检测监控区域
注意力
视频流
摄像设备
智能辅助监测
生物力学模型
个性化特征
状态诊断
数据处理模块
高压配电柜
LSSVM模型
状态评估方法
高斯径向基函数
振动传感器
卫星通信方法
智能天线阵列
虚拟化网络管理
卫星便携站
数据传输需求