摘要
本发明提供一种针对大型语言模型的毒性思维链分析和优化方法及装置,方法包括:获取问题文本输入到大语言模型进行文本问答;通过归因追踪分析生成毒性思维链时存在的推理漂移信息损失,或者通过因果追踪分析根据毒性思维链生成回答文本时存在的回答偏移信息损失;当分析出存在推理漂移信息损失时,对毒性思维链进行残差解码得到优化思维链,当分析出存在回答漂移信息损失时,在思维链文本片段中,将问题文本与毒性思维链进行文本序列位置交换,得到优化文本序列,以使大语言模型基于优化思维链或优化文本序列,生成回答文本。通过本申请,克服在问答场景中,大语言模型毒性思维链的优化方法不能普遍适应,导致推理性能低下的缺陷。
技术关键词
文本
大语言模型
序列
归因
注意力
非暂态计算机可读存储介质
效应
解码
问答场景
处理器
模块
计算机程序产品
优化装置
存储器
噪声
电子设备
系统为您推荐了相关专利信息
电网运行数据
统一数据模型
语义
事件知识库
记录处理过程