一种基于大语言模型的问答任务处理方法和装置

AITNT
正文
推荐专利
一种基于大语言模型的问答任务处理方法和装置
申请号:CN202510467303
申请日期:2025-04-15
公开号:CN120371965A
公开日期:2025-07-25
类型:发明专利
摘要
本发明实施例涉及一种基于大语言模型的问答任务处理方法和装置,所述方法包括:选择一款生成式大语言模型作为工作模型,设计一个相关性识别模型并对其进行训练;通过对工作模型的历史问答任务进行数据采集来创建问题‑背景缓存库,并为其创建一个对应的问题‑背景向量空间;然后,对用户输入的当前问题进行嵌入编码,并根据嵌入向量、向量空间和缓存库进行背景样本检索,若样本集为空则通过检索外部知识库得到当前上下文、若不为空则由工作模型和相关性识别模型进行背景文档的生成与验证从而得到当前上下文,并根据当前的问题和上下文更新缓存库与向量空间,并由工作模型根据当前的问题和上下文进行答案预测。通过本发明可以提高答案生成效率。
技术关键词
文本 大语言模型 Softmax函数 编码向量 生成文档 编码规则 标签 特征提取网络 样本 序列 指令 模板 答案 分词 输出模块 参数 DBSCAN聚类算法 优化器 编码模块
系统为您推荐了相关专利信息
1
基于多模态多尺度交叉注意力的目标计数方法及系统
视觉特征 计数方法 嵌入特征 交叉注意力机制 模态特征
2
基于场景分析的大语言模型安全识别方法及系统
文本 语义向量 识别方法 场景 知识点
3
一种基于改进Transformer的中医处方生成系统
生成系统 解码器 多头注意力机制 多尺度特征融合 中草药
4
代码流的实时渲染方法、装置、电子设备及可读存储介质
脚本 解析机制 标签 超文本标记语言 管理系统
5
基于隐式文本查询的开放词汇3D推理高斯溅射方法
溅射方法 文本 光栅化技术 挖掘算法 分层聚类算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号