摘要
本发明提供一种面向知识密集型任务的模型推理方法、装置、设备、介质及产品,方法包括:获取输入文本;将输入文本输入至目标大语言模型,得到目标大语言模型输出的问答结果。本发明提供的面向知识密集型任务的模型推理方法,先基于知识图谱中预设大语言模型的未知知识进行训练,增强了基础知识的覆盖范围,然后在训练后模型中设置了知识适配器和知识路由器,适配器在不改变原模型参数的情况下注入新知识,路由器根据模型对新知识的掌握情况动态调节融合强度,既有效扩展了模型的知识边界,又通过知识掌握感知的加权机制降低了新旧知识冲突风险,这一设计能够在保持模型原有能力的同时,有效缓解灾难性遗忘问题,从而提升了推理问答结果的准确性。
技术关键词
大语言模型
推理方法
多项选择题
适配器
非暂态计算机可读存储介质
三元组
路由器
文本
图谱
计算机程序产品
实体
样本
表达式
非线性
推理装置
关系
处理器
多层感知机
参数
电子设备
系统为您推荐了相关专利信息
无线网络能效优化
水平波束宽度
智能体模型
特征提取模块
覆盖率
异常状态
文本
故障诊断模型
电力设备
大语言模型