摘要
本发明实施例涉及一种基于大语言模型的问答任务处理方法和装置,所述方法包括:选择一款生成式大语言模型作为工作模型,设计一个相关性识别模型并对其进行训练;通过对工作模型的历史问答任务进行数据采集来创建问题‑背景缓存库,并为其创建一个对应的问题‑背景向量空间;然后,对用户输入的当前问题进行嵌入编码,并根据嵌入向量、向量空间和缓存库进行背景样本检索,若样本集为空则通过检索外部知识库得到当前上下文、若不为空则由工作模型和相关性识别模型进行背景文档的生成与验证从而得到当前上下文,并根据当前的问题和上下文更新缓存库与向量空间,并由工作模型根据当前的问题和上下文进行答案预测。通过本发明可以提高答案生成效率。
技术关键词
文本
大语言模型
Softmax函数
编码向量
生成文档
编码规则
标签
特征提取网络
样本
序列
指令
模板
答案
分词
输出模块
参数
DBSCAN聚类算法
优化器
编码模块
系统为您推荐了相关专利信息
视觉特征
计数方法
嵌入特征
交叉注意力机制
模态特征
生成系统
解码器
多头注意力机制
多尺度特征融合
中草药
溅射方法
文本
光栅化技术
挖掘算法
分层聚类算法