摘要
本发明涉及车联网技术领域,公开一种基于知识协作的通信资源分配方法、系统、设备和介质,方法包括:基于自动驾驶车辆的局部高维观测信息,利用隐马尔可夫模型抽象获取低维隐状态,将隐状态上传至公共知识库;在公共知识库中,采用自注意力机制对来自若干车辆的隐状态进行加权聚合,生成全局环境的聚合隐状态表示;根据全局隐状态,提取并定义代表通信资源最优分配策略的动作约束,包括基准带宽分配比率及其上下限;将动作约束作为知识输入,应用于深度强化学习代理的带宽资源分配决策中,通过带有动作空间约束的Actor‑评论家结构,实现资源的动态合理分配;通过深度强化学习代理在以动作约束为指导,进行训练和决策,获得带宽分配策略。
技术关键词
通信资源分配方法
深度强化学习
隐马尔可夫模型
注意力机制
通信资源分配系统
转移概率矩阵
策略
决策
可读存储介质
车辆
车联网技术
比率
基准
计算机
代表
定义
系统为您推荐了相关专利信息
多源异构数据融合
态势感知方法
异构特征
CatBoost算法
融合特征
联合损失函数
交互模型
智能交互方法
语音交互技术
语义结构
深度强化学习
节点
网络状态信息
迭代消息传递算法
神经网络参数