摘要
本发明公开一种基于状态转移图谱和大语言模型的规划方法,包括:S1.构建状态转移图谱;状态转移图谱由若干个节点和边构成,用于表达状态和场景之间的动态逻辑关系;边用于连接各个节点,且边为有向边;S2.构建深度强化学习模型S3.微调大语言模型;S4.联合状态转移图谱和大语言模型训练深度强化学习模型,以大语言模型指导奖励函数优化规划过程;深度强化学习模型与大语言模型协同工作,通过训练以改进规划结果;S5.给定状态和场景,基于大语言模型和训练好的深度强化学习模型生成拟人的自然语言描述。
技术关键词
深度强化学习模型
大语言模型
图谱
节点
规划
自然语言
场景
支持多跳
微调单元
处理器
动态
可读存储介质
存储器
逻辑
序列
定义
电子设备
计算机
系统为您推荐了相关专利信息
医疗知识图谱
医疗信息处理方法
实时视频
医疗健康信息
骨骼关键点
无线局域网干扰
软件无线电
防碰撞算法
多信道MAC协议
频段
自动规划方法
空间约束条件
三维空间模型
办公室装修设计
三维模型