摘要
本发明公开了一种基于验证反馈的大模型强化学习网络配置生成方法,通过网络配置语义解析将输入的网络现象和状态内容转化为语义和动作序列,基于语义动作序列,通过混合动作空间策略生成和神经符号协同的强化学习模型生成符合要求的配置框架与参数,将生成的网络配置信息在数字孪生系统中进行验证与反馈,在虚拟环境中通过形式化验证与性能仿真,模拟真实网络场景,全面评估配置的正确性与性能表现,进而生成包含多维度信息的反馈信号,依据数字孪生验证对策略模型进行修正和优化,最后通过奖励机制来引导智能体对高熵配置项进行调整,优化配置生成大模型。
技术关键词
配置生成方法
强化学习网络
数字孪生系统
策略
强化学习算法
符号
面向通信网络
动态知识图谱
网络配置信息
强化学习方法
强化学习模型
模糊语义
噪声数据
节点特征
模型更新
动态更新
系统为您推荐了相关专利信息
观测器
扰动抑制方法
扩展系统
控制策略
机器人运动控制系统
智能管控方法
负荷预测模型
电力线载波通信技术
协议转换技术
模式
畜牧养殖场
环境检测模型
环境检测方法
空气环境检测技术
数据
无功电压优化方法
发电机无功出力
变异策略
贪婪策略
电网无功电压