一种基于大语言模型的问答任务处理方法和装置

正文

推荐专利

申请号：CN202510467303

申请日期：2025-04-15

公开号：CN120371965A

公开日期：2025-07-25

类型：发明专利

摘要

本发明实施例涉及一种基于大语言模型的问答任务处理方法和装置，所述方法包括：选择一款生成式大语言模型作为工作模型，设计一个相关性识别模型并对其进行训练；通过对工作模型的历史问答任务进行数据采集来创建问题‑背景缓存库，并为其创建一个对应的问题‑背景向量空间；然后，对用户输入的当前问题进行嵌入编码，并根据嵌入向量、向量空间和缓存库进行背景样本检索，若样本集为空则通过检索外部知识库得到当前上下文、若不为空则由工作模型和相关性识别模型进行背景文档的生成与验证从而得到当前上下文，并根据当前的问题和上下文更新缓存库与向量空间，并由工作模型根据当前的问题和上下文进行答案预测。通过本发明可以提高答案生成效率。

技术关键词

文本大语言模型 Softmax函数编码向量生成文档编码规则标签特征提取网络样本序列指令模板答案分词输出模块参数 DBSCAN聚类算法优化器编码模块

系统为您推荐了相关专利信息

基于多模态多尺度交叉注意力的目标计数方法及系统

视觉特征计数方法嵌入特征交叉注意力机制模态特征

基于场景分析的大语言模型安全识别方法及系统

文本语义向量识别方法场景知识点

一种基于改进Transformer的中医处方生成系统

生成系统解码器多头注意力机制多尺度特征融合中草药

代码流的实时渲染方法、装置、电子设备及可读存储介质

脚本解析机制标签超文本标记语言管理系统

基于隐式文本查询的开放词汇3D推理高斯溅射方法

溅射方法文本光栅化技术挖掘算法分层聚类算法

一种基于大语言模型的问答任务处理方法和装置

站点导航

APP 下载