摘要
本发明涉及多智能强化学习领域,特别是一种多智能体自适应提问方法及装置,方法包括将外界输入的信息发送到构建好的强化学习增强大语言模型中,输出提出的问题;其中,所述强化学习增强大语言模型包括通用大模型和LoRA架构;通过强化学习机制训练所述强化学习增强大语言模型,使得大模型智能体能够提出一个更贴合实际的问题,从而进一步加强自身规划抽象的能力和完成任务的成功率。
技术关键词
提问方法
大语言模型
语义
网络
处理器通信
机制
指令
高层次
计算方法
频率
存储器
表达式
体能
规划
数据
策略
系统为您推荐了相关专利信息
深度神经网络模型
降噪方法
训练深度神经网络
降噪电路
分支
大语言模型
自然语言
列表
核心评价指标
软件测试技术
远程监控方法
数据更新频率
缓存调度策略
多级缓存结构
网络吞吐量
水浴振荡器
样品管
深度学习预测模型
监控方法
变量