摘要
本发明公开一种基于隐式思维链的提示优化方法,使用智能体构建最优CoT提示文本,将初始CoT提示文本和Agent对初始CoT提示优化后得到的最优CoT提示文本组成数据集D;使用数据集D训练KAN神经网络,用以在测试阶段避免输出显性提示过程中带来的语义损失;将训练好的KAN神经网络添加到第一轻量级大型语言模型SLLM‑I的内部,对SLLM‑I中最后一个隐藏层的表示的输出进行优化,KAN神经网络的输出作为第二轻量级大型语言模型SLLM‑II的隐式提示。本发明通过神经网络内部优化机制隐式完成推理路径的选择和优化,辅助SLLMs对提示验证是否正确,避免输出显性提示过程中带来的语义损失,提高提示质量。
技术关键词
文本
蒙特卡洛树搜索
语义
数据
自然语言
数值
索引
样本
机制
代表
网络