摘要
本发明提出一种基于大模型的成本感知高效工具规划方法,通过构建CATP‑LLM框架实现工具调度的效率与成本优化。该方法包括:设计工具规划语言TPL,利用结构化Token支持生成非线性多分支并行方案,显著提升任务执行效率;结合成本感知离线强化学习CAORL算法,基于历史数据动态优化工具选择策略,平衡任务性能与资源消耗;通过方案质量指标QoP量化性能与成本的平衡关系,实现动态调整以输出高效低成本的规划方案。相较于现有技术,本发明支持并行工具调用、动态成本优化及复杂任务适应性,在确保任务质量的同时显著降低执行成本,为多场景任务规划提供高效解决方案。
技术关键词
训练数据生成方法
多分支
动态
强化学习算法
约束工具
规划设备
工具组合
存储计算机程序
设计工具
关系
离线
计算机程序产品
非顺序
资源
非线性
低成本
策略
处理器