摘要
本发明公开了一种大语言模型迭代生成流程优化控制方法及系统,旨在提高复杂生成任务(如创意写作、代码生成)中多轮交互的效率与质量。针对传统单轮生成难以满足多维质量需求且现有迭代反馈方法易出现盲目修改或质量退化的问题,本发明构建了动态的迭代控制框架,通过对任务质量进行多维度建模、对人类反馈进行可靠性评估,并基于信念状态估计与最优动作决策,显著减少无效迭代降低成本、提升生成结果质量。本发明能够在迭代过程中有效避免盲目修改、减少因反馈不可靠导致的错误决策,并通过信念状态估计与最优动作规划和反馈聚合,实现对生成质量的动态优化,从而使LLM在处理复杂任务时输出的内容更加契合用户需求,显著提升最终生成效果。
技术关键词
优化控制方法
大语言模型
支持自定义
优化控制系统
决策
自动工具
贪心策略
反馈方法
贪心算法
状态更新
动态
单轮
参数
序列
模块
规划
人类
框架
基础
系统为您推荐了相关专利信息
深度强化学习模型
深度神经网络
设备状态信息
风险
半导体
无线充电功率
决策系统
动态剪枝
空间关系特征
深度强化学习方法
三维点云数据
纹理特征
注意力
线性回归模型
决策树模型
大语言模型
导管架结构
结构失效概率
诊断系统
时序