摘要
本发明公开了一种分层决策架构模型及其训练推理系统,它包括模型构建模块在大语言模型解码器层后添加与文本预测层并行的工具决策层;专用数据集制作模块根据通用数据集、大语言模型及三阶标记法制作专用数据集;混合监督训练模块冻结解码器层并联合训练文本预测层和工具决策层;动态推理控制模块控制推理迭代过程,将文本预测层输出拼接到输入文本后再次迭代,当工具决策层输出特定起始标记和终止标记时,暂停迭代,调用服务模块获取结果并拼接后继续迭代,直至输出结束符或达最大长度。本发明解决了大模型调用外部工具时决策冗余、响应延迟及扩展性差的问题,降低了训练成本、保持了语义精度、提升了决策效率、工具预测精度与扩展能力。
技术关键词
文本
推理系统
决策
分层
专用数据集
标记
大语言模型
解码器
训练工具
答案
制作专用
推理方法
计算机程序产品
控制模块
动态
编码器
系统为您推荐了相关专利信息
公路桥梁工程施工
因子
关联规则挖掘算法
监测方法
规则集
图像检测方法
概念
文本编码器
图像编码器
训练集
电力调度自动化
面向电力调度
研判方法
自动化作业
实体
机器学习模型
筛选方法
验证特征
验证数据库
样本
微型燃气轮机
收敛方法
强化学习算法
电网实时电价
分布式风电