一种基于验证反馈的大模型强化学习网络配置生成方法

正文

推荐专利

申请号：CN202510463855

申请日期：2025-04-14

公开号：CN120525019A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开了一种基于验证反馈的大模型强化学习网络配置生成方法，通过网络配置语义解析将输入的网络现象和状态内容转化为语义和动作序列，基于语义动作序列，通过混合动作空间策略生成和神经符号协同的强化学习模型生成符合要求的配置框架与参数，将生成的网络配置信息在数字孪生系统中进行验证与反馈，在虚拟环境中通过形式化验证与性能仿真，模拟真实网络场景，全面评估配置的正确性与性能表现，进而生成包含多维度信息的反馈信号，依据数字孪生验证对策略模型进行修正和优化，最后通过奖励机制来引导智能体对高熵配置项进行调整，优化配置生成大模型。

技术关键词

配置生成方法强化学习网络数字孪生系统策略强化学习算法符号面向通信网络动态知识图谱网络配置信息强化学习方法强化学习模型模糊语义噪声数据节点特征模型更新动态更新

系统为您推荐了相关专利信息

基于扩展补偿函数观测器的非匹配扰动抑制方法及设备

观测器扰动抑制方法扩展系统控制策略机器人运动控制系统

一种台区有序充电智能管控方法、系统、终端及存储介质

智能管控方法负荷预测模型电力线载波通信技术协议转换技术模式

一种畜牧养殖场的空气环境检测系统及方法

畜牧养殖场环境检测模型环境检测方法空气环境检测技术数据

燃料汽车动力系统优化方法、装置、设备及存储介质

动力系统优化燃料电池功率电机策略

一种无功电压优化方法、装置、计算机设备及存储介质

无功电压优化方法发电机无功出力变异策略贪婪策略电网无功电压

一种基于验证反馈的大模型强化学习网络配置生成方法

站点导航

APP 下载